更多精彩 >

奇多多AI学伴亮相2025云栖大会,无界方舟用AI“慧眼”开启智能早教时代

2025-09-30 13:05:56   来源:中华网  作者: 

摘要:在近日举办的2025云栖大会现场,无界方舟推出的国内首款基于「端到端实时多模态互动模型」的AI学伴机器人——奇多多,成为全场焦点。

日举办的2025云栖大会现场,无界方舟推出的国内首款基于「端到端实时多模态互动模型」的AI学伴机器人——奇多多,成为全场焦点。这款产品在京东预售仅上线一周,销量便突破了10000,这个数字不仅体现了市场对优质AI早教产品的渴望,更预示着多模态大模型在消费级硬件领域的商业化曙光正在到来。

正如一位现场宝妈所说:“太好了!终于不止是AI玩具了,而是解决了很多早教痛点问题。”在AI技术日益成熟的今天,奇多多的成功或许验证了:在早教赛道,“功能驱动”比“概念炒作”更能让市场买单。更令人瞩目的是,奇多多在展会期间,现场获得了上百位家长下单预定,同时吸引了几十家AI产品后续对接无界方舟EVA模型的合作机会,成为本届大会最具商业潜力的AI硬件产品。

云栖大会现场火爆,奇多多展现真实力

在云栖大会3号馆·前沿应用馆奇多多星球展,奇多多吸引了大量参展观众及宝宝驻足体验。孩子们手拿绘本、练、玩具、绘画作品等,与奇多多进行自然互动,现场气氛热烈。

奇多多展现出的不仅仅是语音交互能力,更是真正的多模态理解能力。它能够识别孩子手中的任意绘本/教材/卡片等读物,无论中文、英文,甚至儿童读物复杂分散的混合排版,都能精准识别;它能看懂孩子的现场绘画;它能对日常物品进行即时有趣的科普,将深奥的科学原理,以孩子能够理解的语言描述,符合孩子“边看、边问、边学”的科学得链路。

展会的三天时间里,奇多多展示了令人惊叹的阅读能力:除了所有书本都能识别外,还提供了三种阅读模式:

朗读模式:可识别所有类型的读物、多种主流语言文字,语音富有表现力,避免机械感;

翻译模式:支持多语言即时互译,读一句英文、翻译一句中文,让孩子有兴趣阅读全英文材料;

指读模式:文字、单词、图案均可识别,并给出相关科普,替代传统点读笔、词典笔。

“这意味着家长不再需要购买点读笔、词典笔、故事机等多种产品。”一位现场宝爸评价,“一机解决所有阅读需求,能帮助孩子读课本,和学校课业结合,这才是真正的解决刚需。”

“与传统AI产品的交互不同,奇多多不需要按压拍照或按压对话,也不需要等待漫长的响应时间导致注意力转移。”无界方舟CPO杨冬蕴(小乔)在现场介绍,“孩子们可以更自然地边看、边问、边学,这是符合儿童认知行为的革命突破。”

突破功能:从“AI陪伴功能满足的质变

预售破万,奇多多究竟做对了什么?

小乔表示:“首先非常感谢广大用户对奇多多的喜爱和认可。奇多多的突破主要在于两方面:一方面是回归第一原理,对早教产品功能做深度挖掘;另一方面是我们自研的EVA实时多模态互动模型,能真正满足产品需求。”

从国内几个主流电商的退货率数据可知,早教产品退货率高达30%-70%。其中退货率偏低的是故事机、熏听机这类产品,AI类产品的退货率是非常高的。所以早教硬件看似是红海赛道,实际产品力上并没有满足家长和宝贝们的需求。

奇多多的突破功能主要体现在三大方面:

1. 世界的眼睛:AI识物科普与全能阅读

无界方舟创始人&CEO曾晓东博士指出:“常见的「语音AI+CV视觉模型」在真实幼龄场景中会有四重失效,具体表现为,常见的儿童语音识别错误率高达52%、对任意书籍的识别准确率不足35%、对常见物品误识率超40%、复杂概念解释远超认知水。”

EVA通过“模态中枢+成长型认知引擎”架构实现突破,从“成人适配”到“儿童友好”,其中视觉能力为核心支撑:

打通视觉理解【眼】:儿童“边看边问”是核心交互惯,除AI语音外,奇多多更有视觉识别能力,并带给孩子知识科普拓展。书籍、日常物品、涂鸦作品、学校发的奖状奖品等,这些孩子喜欢展示和提问的物件,奇多多均可识别。

除AI视觉识物和科普外,奇多多还有强大的阅读能力,支持不同字体、多语言、全类型读物的识别。宝贝家里的绘本、考卷、课本、期刊、卡片全能识别和阅读,提供3种阅读模式:朗读、翻译、指读,有效替代点读笔、词典笔等产品。

2. 堪比真人的低延迟反馈速度

革新延迟标准【快】:语音交互延迟≤250ms(匹配快速注意力转移特),视频交互延迟≤400ms,书籍识别/实物识别延迟≤300ms(采用边缘端视觉特征加速算法,支持即时反馈)。即使受限于硬件设备能,也可以控制在秒级响应。

0-10岁儿童的注意力持续时间仅为10-30分钟,超过1秒的响应延迟就会中断注意力,而缺乏视觉理解的实时互动则会切断“从看到学”的核心链路。很多AI语音产品采用按压式交互,反馈在6秒以上,孩子是无法沉浸使用的。

“孩子问‘这是什么’时,如果等待超过1秒,他们的注意力就可能转移。”小乔解释道,“我们的技术团队为此进行了大量优化,确保交互过程自然连贯。”

3. 成长的个化陪伴感

情感与成长体系【伴】:具备48种情绪计算体系,100+种眼神表情互动,可克隆父母的音色与孩子对话。更有个化记忆引擎带来AI成长体验,使每个孩子都有专属于自己的奇多多。

奇多多是带有成长属的AI产品,会随着用户的使用,个化适配用户,记得用户的重要事件,让每个孩子拥有属于自己的奇多多。其背后的关键是“存储型记忆 + 参数化记忆”的技术结合,为宝贝们打造专属的 “记忆引擎”。

技术内核:EVA大模型如何突破行业瓶颈

曾晓东博士深入解析了背后的技术原理:“首先我们需要的是一个极强的实时多模态大模型来赋予硬件‘真人般的交互’,多模态模型因其能够融合文本、图像、音频等多种信息形态,提供更智能、拟人化的交互,而成为重要研究方向。我们从去年年初就着重布局这个方向,在业界没有任何现成开源方案的情况下,率先在去年8月份推出了国内SOTA的EVA端到端多模态模型,率先解决了多模态商业化致命瓶颈,为AI应用赋予了‘超级感官’与‘真大脑’,填补了走向商用落地的最后一公里。”

在此基础上,EVA为奇多多做了儿童早教场景的深度模型适配。最特别的是看懂“万物与书籍”的视觉魔法——AI识物科普与AI所有书全能读。

早教场景视觉识别面临四大核心挑战,包括非标准书籍(多样排版、手写字体等)、实物形态多变、复杂环境干扰以及儿童非标准书写和涂鸦。普通AI识别准确率低于30%,实物混淆率超45%,难以满足儿童学需求。

EVA针对早教场景进行了全面的场景化视觉能力优化。其“书籍全域识别引擎”支持所有类别书籍甚至手写本,通过字体扩展、排版分析和印刷增强实现96%的准确率,并可同步语音朗读与科普互动。在实物识别方面,采用小样本学技术,仅需3-5个样本即可识别新实物,结合多模态科普和抗干扰优化,在复杂环境下仍保持93%以上准确率。针对儿童手写和涂鸦,EVA通过专用训练数据集和模型优化,实现94%的作业识别准确率,并能对非标准书写保持鲁棒,还可将涂鸦关联科普内容激发创作兴趣。

化与隐私保护的完美

在个化方面,小乔介绍:“AI陪伴类产品,只有做好个化成长时,才能提升使用时长和活跃度。奇多多是带有成长属的AI产品,会随着用户的使用,个化适配用户,记得用户的重要事件,让每个孩子拥有属于自己的奇多多。其背后的关键是‘存储型记忆+参数化记忆’的技术结合,为宝贝们打造专属的‘记忆引擎’。”

这主要依靠三个模块协同工作:认知记忆模块会追踪孩子的知识轨迹,并构建认知标签;情感记忆模块则本地化存储孩子的个人偏好;交互记忆模块会依据艾宾浩斯遗忘曲线动态调整记忆内容的优先级。

针对家长关心的隐私安全问题,曾晓东博士强调:“这是我们极其重视的关键问题。我们通过多层技术保障、完善的家长控制功能、透明的数据承诺以及合规的设计,全面消除家长对数据隐私的顾虑。”

“我们创新地研发PrivateLoRA技术,进一步加强儿童信息的安全与隐私保护。EVA基于PrivateLoRA构建了一套隐私优先的大模型架构,其核心思路是将涉及用户隐私的计算任务本地化——迁移至个人终端设备执行。该技术借助低秩适配(LoRA)方法,在调大模型时仅训练和更新少量参数,无需原始数据上传至云端,既降低了数据传输中的泄露风险,也利用本地算力实现深度个化处理。”该技术我们已向技术社区开源(https://wanglamao.github.io/),为推动隐私保护大模型的发展贡献力量。

开放生态:EVA OS让每个硬件都拥有视觉智慧大脑

曾晓东博士分享了EVA OS的未来开放计划:“简单来说,EVA OS将奇多多最核心的‘眼睛’和‘大脑’做成了一个标准化、可插拔的软硬件一体能力包,任何想做智能硬件的公司,无需从头研发AI,直接使用我们的研发套件即可。”

EVA OS主要开放四类能力:多模态交互API、知识与视觉接口、硬件适配SDK以及广泛的硬件兼容。首批合作伙伴已取得显著成效:某知名儿童出版社接入EVA书籍识别能力后,其小众科普书的用户阅读时长提升3.5倍;户外玩具厂商通过实物识别API,使望远镜产品增加“识别花草/鸟类”的科普功能,销量增长52%。

未来,EVA OS致力于打造一个开放、协同的生态。不仅提供技术接口,更通过开发者社区、详尽的文档和技术支持,持续赋能合作伙伴,共同推动多模态AI在智能硬件领域的创新与应用。

我们希望作为先行者,让科技人,实现科技普惠、行业共荣!


猜你喜欢

外卖下单遇惊喜 京东家电家居品质检测实验室携手七鲜小厨0.1元送千元电饭煲

大消费京东家电

“没想到,1毛钱真给这么好的电饭锅!”家住北京昌平的万女士提起这段经历,语气里仍满是震惊和惊喜。

5小时前

厚积薄发,乌江榨菜亮相2025重庆食农产业生态展

大消费乌江榨菜

在重庆食农产业版图中,乌江榨菜早已不是单纯的“榨菜生产商”,而是以产品创新、技术突破、产业链担当的行...

5小时前

超越商业的想象力:巴拉巴拉“玩具羽绒”背后的品牌新视野

大消费巴拉巴拉

作为全亚洲第一童装品牌,巴拉巴拉始终以超越商业的视野引领行业创新。

5小时前

欧普照明SDL智慧光谱获《财富》中国最佳设计认可,诠释创新驱动增长

大消费欧普照明

2025年10月22日,《财富》正式发布2025年中国最佳设计榜。

5小时前

万店品牌破界!加码调味品,抢占千亿市场蛋糕

大消费锅圈

近日,锅圈(02517.HK)推出“一酱成菜”系列调味料产品,并在全国超万家门店及线上锅圈商城同步上...

10小时前

业界首个企业应用AI成熟度模型(AIM²)外滩大会发布

创新创业AIM²

该模型首次提出从“单点试验”到“AI原生”五大进阶等级(L1-L5),并围绕战略、组织、数据、技术、...

2025-09-12

千亿畅融丨民生银行专精特新优惠贷款产品上线啦!

金融科技民生银行

千亿畅融融资服务平台,由北京市经济和信息化局指导建设,北京市中小企业公共服务平台负责运营

2025-09-12

国内十大专业款伦敦金实时看盘软件综合排名(2025版)

金融科技伦敦金

伦敦金投资因其双向交易、时间自由等优点而备受广大投资者的青睐。

2025-09-12

台北区块链周观察——「破圈」与「等待」

区块链金融科技

对多数 Web3 中文从业者而言,台湾是个“熟悉的陌生人”——同根同源的语言文化之下,因现实阻隔,其...

2025-09-12

原创

332亿,中国男装之王要IPO

海澜之家

看到奶茶、美妆、潮玩、零食IPO,卖衣服的也坐不住了。

2025-09-11

“中国国际糖果季”开幕式暨专题论坛在京举行

大消费中国国际糖果季

9月10日,作为2025中国国际服务贸易交易会框架下的重要活动,“中国国际糖果季”开幕式暨专题论坛在...

2025-09-11

国内十大知名贵金属交易所正规平台2025最新排名

金融科技贵金属交易平台

在全球贵金属市场的浪潮中,众多新平台纷纷涌现,所以如何从中选择一个合适的贵金属交易所会员平台对于交易...

2025-09-11

投资国际现货黄金选哪个正规平台?五大外盘黄金平台综合实力榜单

金融科技黄金投资

当全球金融市场在地缘政治波动与货币政策转向中持续震荡,黄金作为“硬通货”的避险属性愈发凸显。

2025-09-11

原创

A股最牛黄金股,横空出世了

一路上涨的黄金,最近又杀疯了。

2025-09-11

全球首创!德氪微发布基于毫米波的隔离通信技术

德氪微

近日,深圳高新技术企业——德氪微电子(深圳)有限公司正式发布全球首颗基于毫米波超短距离通信的数字隔离...

2025-09-11

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

投资家网主办:“智造未来-人工智能与机器人”专场路演成功举办

投资家网主办:“智造未来-人工智能与机器人”专场路演成功举办

投资家网联合深圳市龙岗区人工智能(机器人)署于9月28日联合主办“智造未来——人工智能与机器人”专场...

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

在时代的浩渺长河中,“分化”宛如一条隐匿的脉络,贯穿于万物的生长、发展与变迁。从生命的进化到文明的演...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。