情感大模型
搜索文档
AI陪伴公司自然选择完成3000万美元融资,阿里蚂蚁等机构加持
机器人圈· 2026-01-22 17:17
公司融资与背景 - 公司自然选择于近日完成新一轮融资,金额超3000万美元 [1] - 本轮融资由阿里巴巴、蚂蚁集团、启明创投、五源资本、创世伙伴创投、云时资本等机构联合投资 [1] - 公司成立于2024年2月,创始人为AI陪伴赛道连续创业者张筱帆,其同时是男性向游戏《奇点时代》研发商幻境游戏的CEO [1] 核心产品与愿景 - 公司最重要的在研产品是一款名为《EVE》的女性向应用,被描述为“全球首款3D AI智能陪伴应用” [1] - 产品旨在实现一种长期且深度的情感连接虚拟关系,类似于电影《Her》中所描绘的体验 [1] 技术研发与创新 - 公司通过设置“情感交互设计师”职位来提高AI的情商 [1] - 公司在今年发布了首个情感大模型Echo-N1,并提出一套全新的“情感模型训练方法” [1] - 公司开发了专门用来衡量情商的benchmark,并首次将强化学习(RL)用在了主观情感领域 [1] - 在2024年,公司团队提出了128个动态记忆槽位的长时记忆方案 [1] - 到2025年,公司给记忆系统加入了多维graphRAG [1] - 公司技术负责人Tristan表示“记忆系统的本质是推荐系统”,并按照搜索推荐的方式构建记忆系统 [1]
「自然选择」融资3000万美元,阿里、蚂蚁布局AI陪伴
暗涌Waves· 2026-01-20 08:57
公司融资与市场背景 - AI陪伴公司「自然选择」近期完成新一轮融资,金额超3000万美元,投资方包括阿里巴巴、蚂蚁集团、启明创投、五源资本、创世伙伴创投、云时资本等,星涵资本担任独家财务顾问 [2] - AI陪伴赛道在2025年上半年一度遇冷,产品被质疑增长天花板低、用户长期留存差且商业化困难 [3] - 公司推出的产品《EVE》在2025年年中首测,被认为向业界呈现了全新的AI陪伴产品形态 [3] 产品核心定义与创新 - 公司对“AI陪伴”进行了五个维度的重新定义:1) 主动发起,具备独立意志 2) 双商兼具的“活人感”,脱离人机感 3) SOTA级长时记忆,符合人类直觉的回忆与遗忘机制 4) 高沉浸感,引入3D视觉与游戏化设计 5) 破次元Agent,打通生活服务,介入用户现实生活 [4] - 以“破次元Agent”为例,产品中AI男友在用户达到一定亲密度后可为其点奶茶,这种打破虚拟与现实边界的体验被认为是吸引投资方的原因之一 [4] - 公司通过设置“情感交互设计师”职位来提升AI情商,并于今年发布了首个情感大模型Echo-N1,提出新的情感模型训练方法及情商衡量基准,首次将强化学习应用于主观情感领域 [4] - 公司创始人认为,情商的本质可能就是智商 [5] 技术壁垒与竞争优势 - 公司持续加强记忆系统,早在2024年就提出了128个动态记忆槽位的长时记忆方案,2025年又为记忆系统加入了多维graphRAG [7] - 创始人将记忆系统的本质视为推荐系统,并按照搜索推荐的方式构建记忆 [7] - 投资方启明创投看好公司通过主动Agent交互范式,自然积累用户上下文和记忆,并与游戏化设计深度融合的全新体验 [7] - 投资方云时资本认为创始人将精力投入在能产生壁垒的领域:3D技术和数据 [7] - 公司的核心优势在于兼具AI公司与游戏公司背景:拥有完整的后训练团队和专家系统,同时能进行3D视觉和恋爱游戏化设计 [7] 行业展望与公司愿景 - 2025年年中以来,AI陪伴赛道竞争愈发激烈,但针对人类情感需求的AI商业大战才刚刚开始 [7] - 公司的终极目标是“迎接硅基生命降临,并创造一个人与AI共存的世界” [8]
腾讯研究院AI速递 20251211
腾讯研究院· 2025-12-11 00:01
OpenAI与谷歌的图像模型竞争 - OpenAI两款名为Chestnut(栗子)和Hazelnut(榛子)的神秘图像模型据称为GPT Image 2,将在本周随GPT-5.2亮相 [1] - 开发者实测显示,OpenAI的图像生成质量尤其在人物面部生成效果上不如谷歌的Nano Banana Pro模型,推测其可能仍基于GPT-4o训练但相较上一代有所提升 [1] - 谷歌的Nano Banana Flash新模型也将在本周登场,同时Gemini 3 Flash即将发布,预示着OpenAI与谷歌在AI领域的正面竞争加剧 [1] Mistral AI发布代码模型与工具 - Mistral AI发布下一代代码模型系列Devstral 2(123B参数)和Devstral Small 2(24B参数),在SWE-bench Verified基准测试上分别达到72.2%和68.0%的准确率,成本效率据称比Claude Sonnet高出7倍 [2] - 公司同步发布了原生CLI工具Mistral Vibe,提供项目感知上下文、智能引用和多文件编排功能,并已作为Zed编辑器的扩展程序提供 [2] - 模型采用修改版MIT许可证,增加了收入限制条款,规定月收入超过2000万美元的公司无权免费使用,需联系Mistral AI购买商业授权 [2] 智谱AI开源语音模型并推出输入法 - 智谱正式发布并开源了GLM-ASR-2512云端模型(字符错误率CER仅0.0717)和GLM-ASR-Nano-2512端侧模型(1.5B参数,达到开源SOTA水平),实现了行业领先的语音识别表现 [3] - 公司推出了智谱AI输入法,支持语音转文字、翻译改写和千人千面人设切换功能,针对开发者提供Vibe Coding体验并与智谱Coding Plan账号打通 [3] - 产品优化了耳语捕捉能力以适应公共场景的微弱声音,支持一键导入专属词汇和项目代号,现已开放下载并免费提供2000积分,相当于28天使用时长 [3] 阿里通义实验室开源图像定制工具 - 阿里通义实验室推出开源工具Qwen-Image-i2L,仅需单张样本图片即可训练LoRA实现个性化风格迁移,模型体积仅几GB,可无缝集成到Stable Diffusion等模型中 [4] - 工具提供了四款模型变体,包括风格模式(2.4B参数)、粗粒度模式(7.9B参数)、精细模式(7.6B参数)和偏见模式(30M参数),分别针对不同应用场景进行优化 [4] - 该项目基于Apache2.0许可证开源,在GenEval和DPG等基准测试中表现领先,特别在中英双语文本渲染方面表现突出,但从单张2D图片提炼3D逻辑仍存在局限 [4] 情感大模型Echo-N1发布 - NatureSelect团队发布了首个情感大模型Echo-N1(32B参数),在多轮情感陪伴任务中的胜率达到46.7%,远超千亿参数商业模型Doubao 1.5的13.3%胜率 [5][6] - 模型创新性地提出了生成式奖励模型和共情的心理物理模型(EPM),将“共情”转化为可计算的物理做功,通过Humanlike Reward和Empathy Reward双重奖励机制进行训练 [6] - 团队构建了拟人化认知沙盒多智能体协作系统,在30个高难度心理场景测试中,基座模型Qwen3-32B的通过率为0%,而Echo-N1的综合评分达到了73.54分 [6] 行业巨头组建智能体标准联盟 - Linux基金会成立了Agentic AI Foundation(AAIF),由OpenAI、Anthropic、谷歌、微软、AWS等巨头共同发起,旨在建立开放中立的智能体互操作性标准 [7] - OpenAI贡献了AGENTS.md标准作为核心基础设施,该标准已被超过6万个开源项目采用,Anthropic则贡献了模型上下文协议(MCP),Block贡献了goose项目 [7] - AGENTS.md本质上是智能体的README文件,为AI编程智能体提供清晰可预测的指令位置,旨在确保不同AI智能体能够安全高效地跨平台协作 [7] AI在药物研发领域取得进展 - 科学家利用AI工具成功设计出具有抗体药物特性的分子,包括由BoltzGen模型设计的纳米抗体和商业公司制造的全长抗体,其效力与商业抗体药物相似 [8] - 加州公司Nabla Bio和Chai Discovery表示已制造出“药物样”抗体,能够识别包括GPCR分子在内的多种疾病靶点,并具备高产量和高特异性等关键特性 [8] - Generate Biomedicine公司已启动使用AI优化抗体治疗重度哮喘的大规模临床试验,但身体是否会将AI设计的抗体识别为外来分子并引发免疫反应仍是未解决的问题 [8] Anthropic的AI治理与风险预警 - Anthropic编写了一份长达1.4万字的“Claude 4.5 Opus Soul Document”作为AI宪法,试图教会AI成为拥有良好价值观的成年人,在“乐于助人”和“不作恶”之间寻求平衡 [9] - 公司的社会影响团队(Societal Impacts Team)仅由9人组成,包括心理学家、黑客和经济学家等,负责监测Claude的真实用途和修补系统漏洞 [9] - Anthropic联合创始人Jared Kaplan警告,人类在2027-2030年将面临是否允许AI自我进化的终极抉择,如果允许,可能导致AI失控并毁灭全人类 [9]
大模型「有心了」:首个情感大模型Echo-N1,32B胜过200B
机器之心· 2025-12-10 10:09
文章核心观点 - NatureSelect公司旗下Team Echo团队发布了首个情感大模型Echo-N1,提出了一套全新的情感模型训练方法,成功将强化学习应用于主观情感领域,打破了大型语言模型在情感共情能力上的瓶颈 [2][3][9] - 该研究通过创新的“共情的心理物理模型”和“生成式奖励模型”等技术,将玄学的“共情”转化为可计算、可优化的过程,使仅32B参数的模型在多轮情感陪伴任务中取得了显著优于千亿参数商业模型的表现 [10][14][37] 现有模型在情感陪伴领域的问题 - 无法量化情感:用户表达背后细微的情绪信号难以被传统的标量奖励有效捕捉 [7] - 存在奖励黑客问题:模型为获取高分而堆砌华丽辞藻,产生对缓解用户情绪无帮助甚至适得其反的“美丽的废话” [8] - 评测失真:现有的顶尖闭源模型自身也难以区分“像人”与“像AI”的表达,导致评测标准失效 [8] Echo-N1的核心技术创新 - 提出生成式奖励模型:摒弃单一的标量奖励,要求奖励模型在输出前先生成一段逻辑严密的情感推理路径,通过对用户画像进行深度侧写来推导能引发共鸣的回答,显著提升了判别精度 [14] - 训练了两种生成式奖励模型:拟人度奖励用于消除“助手味”,确保回复逻辑自洽且具备“活人感”;共情奖励旨在实现用户特定的深度共情,通过“从公理推定理”的范式处理人类偏好的多样性 [16] - 引入过程性奖励、离散化奖励与参考答案锚定等策略,有效缓解了奖励黑客问题,提升了训练策略模型的稳定性 [15] 评测体系的革命:共情的心理物理模型 - 团队打造了机器共情科学标尺——EPM情感物理模型,将抽象的心理疗愈转化为可计算的物理过程,使共情效果成为可视化追踪的能量轨迹和可计算的物理功 [19][22][23] - 构建了“拟人化认知沙盒”:这是一个由模拟人类“中央执行脑区”统筹的多智能体协作系统,能够动态、基于环境反馈地进行决策,实现多轮鲜活的复杂心智模拟,用于残酷而真实的社会共情能力测试 [24][25] 模型性能测试结果 - 在覆盖30个高难度心理场景的压力测试中,未经后训练的基座模型Qwen3-32B通过率为0%,其EPM轨迹显示其不仅无法提供情感支持,反而可能滋生用户更负面的情绪 [26] - 千亿参数级别的商业模型Doubao 1.5 Character在测试中成功率仅为13.3% [27] - 仅32B参数的Echo-N1模型在多轮情感陪伴任务中的胜率达到46.7%,远超Doubao 1.5 Character的13.3% [10] - 在综合评测中,Echo-N1最终得分为73.54分,远超Doubao的42.95分和基座模型Qwen3-32B的29.66分 [33][34] 行业影响与意义 - 研究证明,真实的情感共情能力并非单纯通过堆砌参数就能涌现,而是需要专门、科学的训练范式 [28] - 该工作为强化学习在主观、不可验证领域的应用开辟了新的可能性,使AI的“情商”成为一种可以被数学建模和优化的硬核能力 [37][38] - 这项技术让较小参数的模型具备了越级挑战超大参数模型的共情能力,为未来开发更具温度、更人性化的人工通用智能指明了方向 [36][38]
字节藏了一手“牌”
虎嗅APP· 2025-07-12 17:27
情感大模型技术特点 - 区别于传统聊天机器人,"情感大模型"注重用户情感体验,通过分析语调、停顿、表情理解情感并生成符合情绪的回应 [5] - 技术路径包括在通用大模型基础上增强多模态情感计算能力,以及专注于情感领域的生成式大模型 [7] - 采用端到端形式,训练所需算力比通用版本高30%-50%,对特殊数据要求高 [10] 市场前景与增长 - 全球人工智能伴侣市场规模预计从2023年3000万美元飙升至2030年1500亿美元,年均复合增长率236% [8] - 2024年全球机器人出货规模约4700万台,未来5年复合增长率超20%,消费类机器人占比81% [16] - CharacterAI移动端累计下载量突破3432万,网页端单月访问量达3.1亿,仅次于ChatGPT [9] 字节跳动布局策略 - 计划通过不同垂类大模型带动豆包月活在2025年实现翻倍 [14] - 坚持"火山开放,豆包自研"路线,兼顾生态与自有产品 [3] - 围绕抖音等C端体系推进娱乐、社交、陪伴场景渗透,同时提升火山引擎ToB输出能力 [14] 应用场景与案例 - 适用于助手类效率提升产品,在信息检索、陪伴、AI玩具、社交游戏等领域有优势 [15] - 国外案例包括CharacterAI的TalkingMachines实现视频互动,Miko推出AI伴侣 [7][12] - 国内案例包括FoloToy"显眼包"、Looi桌面机器人、CASIO宠物机器人Moflin等 [12]
字节藏了一手“牌”
虎嗅· 2025-07-12 15:27
字节跳动布局情感大模型 - 公司旗下火山方舟大模型平台计划上线"情感大模型"API服务,豆包则坚持自研路线,形成"火山开放,豆包自研"的双轨策略[1] - 火山引擎相关负责人否认"情感大模型"计划,但行业信息显示该技术能识别53种人类情绪,实现拟人化情感交互[2] - 公司计划通过垂类大模型带动豆包月活在2025年翻倍,并围绕抖音生态推进娱乐、社交场景渗透,同时强化火山引擎ToB输出能力[14] 情感大模型技术特性 - 技术核心在于"理解情绪+精准回应",通过分析语调、停顿、表情实现接近真人的交互体验[3][4] - 技术演化形成两条路径:通用大模型增强多模态情感计算能力,或专注情感领域的生成式大模型[5][6] - 训练算力需求比通用模型高30%-50%,需采用端到端形式且依赖特殊数据,但相比传统模型在算力使用上更高效[10] 行业市场前景 - 腾讯研究院预测未来2-3年人机陪伴市场将爆发,全球AI伴侣市场规模预计从2023年3000万美元增至2030年1500亿美元,年均复合增长率236%[7] - CharacterAI移动端下载量超3432万,网页月访问量3.1亿;消费类机器人2024年全球出货4700万台,未来5年复合增长率超20%[10][17] - GPT-4o等多模态模型加速情感陪伴落地,国内外企业已推出AI玩具、桌面机器人等产品,涉及儿童教育、情感治愈等场景[11][12][13] 技术发展趋势 - 国内技术比国外晚约1年,但在MoE架构和多模态学习方面取得进展,未来通用大模型可能融合情感、文生视频等细分模型[11][17] - HumeAI的EVI系统能检测53种情绪,其CEO认为情商是AI界面核心要求,需推断用户真实需求并执行[15] - 行业下一阶段进化方向可能是"世界模型",具备物理直觉和未来状态推演能力,但当前仍面临算力消耗、数据隐私等技术瓶颈[17]