Workflow
EVA OS
icon
搜索文档
奇多多AI学伴亮相2025云栖大会,无界方舟用AI“慧眼”开启智能早教时代
财富在线· 2025-09-29 18:24
产品发布与市场反响 - 无界方舟在2025云栖大会推出国内首款基于端到端实时多模态互动模型的AI学伴机器人“奇多多”,成为全场焦点 [1] - 产品在京东预售上线一周销量突破10000台,显示市场对优质AI早教产品的强烈需求 [1] - 展会期间现场获得上百位家长下单预定,并吸引几十家AI产品后续对接公司EVA模型的合作机会 [3] 产品核心功能与差异化优势 - 产品具备真正的多模态理解能力,能识别孩子手中的任意绘本、教材、卡片等读物,无论中文、英文或复杂混合排版,并能看懂现场绘画,对日常物品进行即时科普 [7] - 提供三种阅读模式:朗读模式(识别所有类型读物、多种主流语言文字)、翻译模式(支持多语言即时互译)、指读模式(文字、单词、图案识别及科普),可替代传统点读笔、词典笔、故事机等多种产品 [7] - 通过对比表格显示,产品在科普认知拓展、单词/词组学习、阅读绘本/期刊/杂志、学科解题、双语互动、英文翻译、情绪安抚、成长记录、亲子语音通话等功能上具备显著优势,整合了多种单一功能产品的价值 [12] - 交互体验革新,无需按压拍照或对话,语音交互延迟≤250ms,视频交互延迟≤400ms,书籍/实物识别延迟≤300ms,匹配儿童快速转移的注意力特性 [9][16][18] - 具备个性化成长属性,拥有48种情绪计算体系,100+种眼神表情互动,可克隆父母音色,并通过“存储型记忆+参数化记忆”技术打造专属记忆引擎 [20][26] 底层技术突破 - 产品基于公司自研的EVA实时多模态互动模型,该模型采用“模态中枢+成长型认知引擎”架构,实现了从“成人适配”到“儿童友好”的突破 [13][14] - EVA模型的“书籍全域识别引擎”支持所有类别书籍甚至手写本,识别准确率达96%;实物识别在复杂环境下保持93%以上准确率;儿童手写和涂鸦识别准确率达94% [24] - 针对儿童早教场景视觉识别的四大核心挑战(非标准书籍、实物形态多变、复杂环境干扰、儿童非标准书写)进行了全面优化 [24] - 采用创新PrivateLoRA技术构建隐私优先的大模型架构,将涉及用户隐私的计算任务本地化,无需原始数据上传至云端,加强儿童信息安全与隐私保护 [28] 商业化前景与生态战略 - 早教硬件市场看似红海,但行业退货率高达30%-70%,AI类产品退货率尤高,表明现有产品力并未真正满足市场需求,为技术驱动的新型产品创造了机会 [11] - 公司计划开放EVA OS生态,将核心多模态交互能力标准化、可插拔化,向硬件合作伙伴提供多模态交互API、知识与视觉接口、硬件适配SDK等 [30] - 首批合作伙伴已取得成效:某知名儿童出版社接入EVA书籍识别能力后,其小众科普书用户阅读时长提升3.5倍;户外玩具厂商通过实物识别API使产品销量增长52% [30] - EVA OS致力于打造开放协同的生态,通过开发者社区和技术支持赋能合作伙伴,共同推动多模态AI在智能硬件领域的创新与应用 [30]
深度|“长眼睛”的奇多多AI学伴,凭什么能爆卖10000台?
Z Potentials· 2025-09-25 11:05
产品核心定位与市场表现 - 奇多多AI学伴机是国内首款基于“端到端实时多模态互动模型”的AI互动机器人,于2025外滩大会首次亮相 [1] - 产品在京东预售仅一周,销量便突破10,000台 [1] - 产品功能体验有三大突破:具备视觉能力、实现低延迟反馈、拥有能成长的个性化陪伴感 [1] 团队背景与技术壁垒 - 创始人曾晓东博士师从国际计算机科学院士,是国内较早的机器翻译研究者,曾入选《麻省理工科技评论》MIT TR35榜单,并在阿里巴巴、蚂蚁集团累计任职十年,担任过阿里机器翻译系统核心引擎负责人 [3] - 联创兼CPO小乔毕业于英国爱丁堡大学,是国际红点设计奖、IF设计奖得主,拥有华为、阿里、字节等大厂产品及设计经验 [4] - 公司自研的EVA实时多模态互动模型是核心竞争优势,该模型在业界没有现成开源方案的情况下,于去年8月推出国内SOTA的端到端多模态模型 [22] 行业痛点与产品差异化 - 早教产品行业退货率高达30%-70%,其中AI类产品退货率尤其高,显示现有产品未能满足家长和儿童需求 [5] - 传统AI语音产品存在按压式交互、反馈延迟超过6秒、缺乏视觉理解等问题,无法满足儿童边看边问边学的核心交互习惯 [6][13] - 通用AI模型在儿童早教场景存在四重失效:儿童语音识别错误率高达52%、对任意书籍识别准确率不足35%、对常见物品误识率超40%、复杂概念解释远超认知水平 [8] - 产品定位打破“每个功能都需单买一个早教产品”的行业局面,通过一个设备覆盖0-10岁儿童分龄段的早教刚需,实现“质价比”优势 [16][19] 核心技术优势 - 视觉能力实现突破:EVA模型的“书籍全域识别引擎”支持所有类别书籍甚至手写本,识别准确率达96%;实物识别在复杂环境下保持93%以上准确率;儿童手写和涂鸦识别准确率达94% [24] - 交互延迟优化显著:语音交互延迟≤250ms,视频交互延迟≤400ms,书籍/实物识别延迟≤300ms,即使受硬件限制也可控制在秒级响应,远优于行业6秒以上的延迟 [11] - 个性化记忆引擎结合认知记忆、情感记忆、交互记忆三大模块,通过存储型记忆与参数化记忆技术为儿童打造专属AI伙伴,有效提升使用时长和活跃度 [27][28] - 采用PrivateLoRA技术加强隐私保护,将涉及用户隐私的计算任务本地化,无需原始数据上传至云端,降低数据泄露风险 [30] 开放生态与商业模式 - EVA OS将核心的“眼睛”和“大脑”做成标准化、可插拔的软硬件一体能力包,开放多模态交互API、知识与视觉接口、硬件适配SDK等四类能力,赋能合作伙伴 [31] - 首批合作伙伴已取得成效:某儿童出版社接入EVA后用户阅读时长提升3.5倍;户外玩具厂商通过实物识别API使产品销量增长52% [33] - 公司作为模型厂商,自研模型不仅提升体验,还将成本降低95%,未来不向用户收取AI会员费,提供终身免费AI权益 [19] 分龄段教育功能设计 - 针对0-3岁幼童:提供百万熏听资源,支持APP联动百度网盘下载和AI故事生成,满足大脑神经元突触迅猛发展期的需求 [14] - 针对3-6岁小童:聚焦语言爆发期,培养语言表达能力和阅读习惯,通过48种情绪计算体系和100+种眼神表情互动进行性格养成与社会情商培养 [11][14] - 针对6-10岁大童:强调兴趣探索,结合学校课本内容进行学习互动,抓住10岁前语言中枢逐渐关闭的关键期做好语言阅读与表达 [14][16]