Workflow
情感计算
icon
搜索文档
CVPR 2026 | EmoStyle:情感也能“风格化”?深大VCC带你见证魔法!
机器之心· 2026-03-19 10:59
研究团队与背景 - 该技术由深圳大学可视计算研究中心黄惠教授课题组独立完成,第一作者为杨景媛助理教授,第二作者为硕士生柏梓桓[2] - 深圳大学可视计算研究中心以计算机图形学、计算机视觉、人机交互、机器学习、具身智能、可视化为学科基础[2] 技术定位与目标 - 该技术旨在解决用户因缺乏绘画功底或艺术训练而无法将情感融入图像的问题,用户仅需提供一种“情感”,技术即可完成创作[4] - 该技术致力于图像情感风格化,其双重目标是精准且显著地唤起目标情感,并保持编辑后图像与原图的语义一致性[4][5] - 该技术融合了风格迁移和情感图像处理的优势,旨在生成既能唤起情感又具有艺术风格化的结果[5] 核心技术挑战与解决方案 - 该技术面临两大关键挑战:一是训练数据缺失,缺乏“内容-情感-风格化”图像三元组;二是建立情感与艺术风格之间的有效映射[5] - 为解决数据缺失挑战,研究团队构建了首个AIS数据集EmoStyleSet,涵盖10,041个高质量三元组,为情感风格化提供了基准[7][8] - 为建立情感与风格映射,团队设计了Emotion-Content Reasoner模块,通过跨模态推理,根据图像内容和目标情感确定最合适的艺术风格[12][13][14] - 团队提出Style Quantizer模块,将连续的风格特征离散化为独立的、可解释的原型,以实现可控的风格学习,符合人类对艺术风格作为离散类别的认知[15][16][17] 技术方法与训练 - 网络通过两阶段训练进行优化,结合风格损失、流匹配损失和对齐损失,分别侧重于风格相似性、像素相似性和情感正确性[18][19] - 在构建EmoStyleSet数据集时,团队利用UnZipLoRA和ControlNet等技术生成图像,并经过指标测量和人工筛选以保证数据质量[10] 实验结果与性能 - 在定量实验中,该技术在多项关键指标上超越对比方法,例如其Emo-A(情感准确性)指标达到33.36%,显著高于其他方法[26] - 在对比实验中,该技术在情感表达与内容保留之间实现了卓越的平衡,生成的风格化效果既美观又富有情感感染力[22] - 消融实验表明,Emotion Encoder和Emotion-Content Reasoner对情感感知至关重要,移除会导致情感感染力减弱;Style Quantizer的缺失则会使结果更接近真实图像而非风格化[25] - 该技术揭示了情感强度与内容完整性之间的权衡关系,用户可根据个人偏好调整情感强度以精细调节风格化效果[27] - 该技术构建了八个情感风格词典,每种都提供多样且美观的风格类别,能有效唤起目标情绪,用户可进一步选择特定风格[29] 技术扩展与应用 - 除了图像风格化,该技术还能扩展到文生图任务领域,能够根据文本描述创建富有情感表现力的图像[8][31] 研究脉络与展望 - 该研究是团队在情感计算与AIGC交叉领域的系列探索之一,此前已发布EmoSet、EmoGen、EmoEdit等研究成果[34] - 该技术被定位为首个聚焦于图像情感风格化的研究[34]
“数字亲人”能否温暖“银色孤独”?
新浪财经· 2025-12-24 07:14
行业趋势:养老科技从工具理性向价值理性深化 - 养老科技产品功能正从传统的生活照护,向“精神陪伴”与“安全监护”等情感补位方向深化,反映出对老年人情感尊严与心理需求的关注[1] - 科技正试图回应老龄化社会中长期被忽视的精神孤独需求,通过提供持续的情感响应与心理慰藉来提升老年人生活质量[1] - 该发展趋势体现了养老科技从追求高效解决问题的“工具理性”,向关注使用者作为“人”的“价值理性”的转变[1] 产品创新:聚焦精神陪伴与安全监护的养老机器人 - 一款在博览会上成为焦点的“养老机器人”,具备可定制容貌、声音并能进行基础交互的功能[1] - 产品核心功能锚定于日常对话、用药提醒、应急响应等,旨在成为远距离子女视线的延伸,以缓解老人认知衰退与心理抑郁[1] - 该机器人通过整合声音克隆、外貌仿真、移动避障等相对成熟的技术模块实现,其技术根基来源于已有商业应用的跨界融合与场景化改造[2] 市场与需求:直指情感空缺的银发经济 - 在物质供给与身体照料之外,许多老年人面临日复一日无人交流的精神寂寥,存在明确的情感陪伴市场需求[1] - 商业逻辑在“银发经济”浪潮下,正尝试通过科技产品来回应养老需求,包括对情感陪伴需求的简化乃至浪漫化想象[2] - 产品设计通过记忆唤醒乃至定制亲人形象进行互动,目的是填补情感空缺,提供心理慰藉[1] 技术现状与边界:能力集中于陪伴与安防 - 当前养老机器人的核心功能仍集中于陪伴对话与安防联动,无法承担复杂家务或替代人力照护[2] - 产品技术实现路径基于现有成熟技术的融合与改造,而非突破性的底层技术创新[2] - 其情感交互功能是否真正契合老年人内在的精神需求,仍需进一步观察与评估[2] 未来展望:技术演进以提升生命尊严为尺度 - 养老机器人的未来发展将伴随人工智能、材料科学和情感计算等技术的进步而不断演化[3] - 对技术的根本评价尺度应始终回归到是否真正提升了老年人的生活质量与生命尊严[3] - 当科技能以谦逊、温情的姿态回应因年龄增长而凸显的需求时,才真正闪耀着以人为本的光芒[3]
可精准识别87种复杂情绪状态
新浪财经· 2025-12-23 02:17
文章核心观点 - 安徽进化论科技有限公司发布具身情感智能平台 旨在解决当前AI缺乏“情商”的瓶颈 推动人工智能从“工具赋能”迈向“情感共鸣” [3] 公司产品与技术 - 公司自主研发的具身情感智能平台以千万级真实情感交互数据训练的具身情感交互大模型为核心 [3] - 平台采用“1个多模态大模型+N个专业小模型”的灵活架构 [3] - 平台构建了四大模块化能力 覆盖情感感知、理解、表达、交互全链路 [3] - 细粒度情感分析平台可精准识别87种复杂情绪状态 绘制200余个维度的“情感能力地图” [3] - 立体化情感创生平台让数字人实现“声情并茂”的生命感表达 [3] - 具身情感交互硬件平台为各类机器人提供通用“情感大脑” [3] - 情感边缘计算平台实现本地化、低延迟、高安全的交互体验 [3] - 公司已形成三大特色应用场景:数字生命伙伴PalPet、智慧养老伴侣、主动健康之盾 [4] 行业背景与科研基础 - 安徽省在情感计算、具身智能领域拥有深厚的科研积淀和产业基础 [4] - 中国科学技术大学在机器人、人工智能领域国内领先 在计算机视觉、情感识别等方面有深厚积淀 [4] - 合肥工业大学甄圣超教授团队在具身智能、人形机器人等领域形成特色优势 [4] - 合肥工业大学孙晓教授团队在情感计算领域深耕十余年 取得国际领先研究成果 [4] - 孙晓团队在国内率先构建了普适场景中的情感计算技术体系 在产业落地方面处于引领地位 [4] - 孙晓团队在国际上多次夺得情感识别算法挑战赛冠军 [4] - 孙晓团队构建了国内最大的千万量级情感交互文本数据集 数据体量已达到TB级 [4]
经济日报:推动智慧养老从能用变好用
新浪财经· 2025-12-20 07:22
行业核心观点 - 推动智慧养老产业从“能用”阶段向“好用”和“常用”阶段发展,需要在技术、制度、场景、数据等方面协同发力 [1] 技术发展路径 - 加快关键核心技术迭代,提升具身智能、情感计算、方言识别、大模型嵌入等能力 [1] - 提高智慧养老产品在复杂场景中的稳定性与适应性,目标是让智能机器人更像人 [1] 标准与制度建设 - 需加强智慧养老标准体系建设,制定科学完善、协调统一的行业标准 [1] - 标准需明确算法透明、数据安全、隐私保护等方面的具体要求 [1] - 为情感交互类产品划定伦理边界,确保技术在安全框架内稳健发展 [1] 数据基础建设 - 依托大数据技术,逐步建立全国范围内的老年人健康档案和需求数据库 [1] - 推动相关数据公开,以更好地服务智慧养老产业发展 [1]
AAAI 2026 | 革新电影配音工业流程:AI首次学会「导演-演员」配音协作模式
机器之心· 2025-12-15 09:44
文章核心观点 - 现有AI配音技术缺乏情感表现力的核心症结在于其跳过了真实配音工业中至关重要的“导演指导”与“演员揣摩”环节[2][3] - 内蒙古大学研究团队提出了一种全新的检索增强导演-演员交互学习框架Authentic-Dubber,首次在AI配音中引入“导演”角色,系统模拟真实配音流程中的情感传递机制,让模型学会“先理解,再表达”[4] - 该研究将AI配音的竞争维度从“音画同步”的物理层面提升到了“情感共鸣”的心理层面,通过模拟人类关键互动使AI能更深入地理解并传达复杂情感[19] 技术创新与框架设计 - **导演的“素材库”**:系统构建了一个整合场景氛围、面部表情、台词文本等多模态情感信息的参考素材库,并利用大语言模型进行深度语义理解以提取细腻情感表征[7] - **演员的“高效揣摩”**:系统设计了基于情感相似度的检索增强策略,使AI能像演员一样从海量素材库中迅速检索出情感最相关的参考片段,模拟演员内化情感线索的过程[11] - **最终的“渐进式演绎”**:系统采用渐进式图结构语音生成方法,逐步将检索到的情感知识融合进语音生成,确保输出配音情感饱满、层次丰富[13] 实验性能与效果验证 - **客观指标领先**:在V2C-Animation数据集上,Authentic-Dubber在情感准确率指标上达到47.21,显著超越了所有主流基线模型[14][16] - **主观听感最佳**:在人类听评员盲测中,其在配音情感匹配度和语音情感真实度两项评分上均获得最高分,分别为3.792和3.889[15][16] - **声学特征优势**:Mel频谱图对比显示,其语音在表现“愤怒”时高频波动更剧烈,在表现“快乐”时韵律变化更自然丰富,证明其情感表达具备可量化的声学特征优势[16]
第一批被AI统治的人类
投资界· 2025-11-30 16:23
AI监控技术在教育领域的应用 - AI家教通过视频监控实时纠正儿童学习姿势和专注度 例如提醒"别玩笔了"和"坐姿有点歪" [4] - 家长群体对AI带娃需求旺盛 出现《感谢AI让我彻底躺平》等育儿博主分享 反映市场接受度快速提升 [7][8] - 技术应用存在局限性 对缺乏学习动机的儿童效果有限 出现《把豆包惹生气了》等翻车案例 [9] 情感计算技术的发展历程 - 面部动作编码系统(FACS)将46个基础动作单元组合成可识别七种基本情绪的系统 [13] - 麻省理工学院团队开创情感计算 通过多模态信号(语音/心率/呼吸)量化情绪状态 [14] - 深度学习技术突破传统规则限制 卷积神经网络实现跨模态交叉验证 提升情绪识别精度 [16] AI监控在职场管理的落地场景 - 日本富士通开发专注度监测AI 帮助企业评估员工工作状态 [17] - 美国Cogito系统通过分析语气/音调等数百个参数 实时指导客服调整沟通方式 [17] - 技术应用从广告优化转向员工管理 覆盖金融/银行/护理等多个行业 [17] 监管技术与人类行为的博弈 - 学生发展出备用机/抬头走神等反监控策略 证明行为监管无法控制思想活动 [20][22] - 研究表明被监控组比自由组动机降低23% 显示监控会削弱内在驱动力 [23] - 过度监控导致能量消耗在伪装技巧上 形成"表演艺术家"与AI系统的对抗 [24]
00后谈恋爱,用AI当「僚机」
36氪· 2025-11-24 18:58
行业概览与市场动态 - AI恋爱助手产品正以惊人速度收割年轻用户,例如Lovekey键盘上线一年即获得3100多万元收入,月活用户超过200万[1] - 同类产品蜜小语上线仅8个月就实现了逾越2000万元的收入[1] - 行业从2024年开始随着大语言模型流行而兴起,创业者试图让AI超越简单的消息代回,实现更贴心的关系分析与约会指导[1] 产品类型与商业模式 - 恋爱键盘类产品本质是输入法插件,核心流程为用户复制对话后切换至AI键盘选择回复风格一键生成高情商回复[2] - 产品支持基于用户回复进行润色,并允许用户定制聊天人设以适配不同社交角色[2] - 商业模式成功挑战AI应用付费难瓶颈,通过高单价订阅制实现收入,例如Lovekey键盘终身会员定价128元[2] 产品功能演进与差异化 - 新一代AI恋爱军师产品致力于超越消息代回,提供建档分析、关系进展评估及实用约会攻略等功能[2] - 相较于DeepSeek等通用模型,专门化产品训练了情感语料库,用户可上传心仪对象信息建档并生成可视化关系报告[3] - 产品通过导入聊天记录、填写量表等方式用图表标注暧昧升温节点、矛盾导火索等关键信息[3] 商业化挑战与困境 - 功能更齐全的AI恋爱助手类产品面临商业化困境,高昂的模型成本与有限用户付费意愿导致先行者折戟[1][5] - 赛道内首个做出APP的Lumi已经下架,团队坦言大模型支出较高且商业化动作较慢导致项目终止[5] - 若想盈利产品定价需在100元左右买断制或30-40元/月订阅制,但用户付费意愿难以支撑[6] 技术局限与发展方向 - 仅靠文本分析无法真正理解人类情感复杂性,情感表达涉及语音语调、面部表情等多模态信息[8] - 情感计算领域在基础情绪识别上准确率可达95%以上,但真实场景中因光照、噪音等干扰实际表现不理想[9] - 未来方向是通过音频、视频乃至触觉、嗅觉采集实现实时准确的情感识别,即"普适心理计算"[8][9] 未来发展趋势与生态定位 - 独立产品需在细分场景做出差异化,更多以SDK/插件形态嵌入平台生态,例如赋能Facebook Dating、Tinder等B端平台[7] - 通用大模型将统合大部分通用能力,独立新产品应聚焦跨文化沟通、婚后关系等细分人群形成壁垒[7] - AI可能成为约会基础设施,通过提供底层智能与角色能力赋能大型社交平台[7]
早鸟倒计时6天 | 中国大模型大会邀您携手探索大模型的智能边界!
量子位· 2025-10-17 19:30
大会概况 - 中国中文信息学会将于2025年10月28日至29日在北京举办第二届中国大模型大会(CIPS & CLM 2025)[2] - 大会旨在延续首届会议精神,聚焦大模型的理论突破、技术前沿、产业落地与生态共建,致力于打造更具技术深度与行业影响力的AI盛会[2] - 会议汇聚百余名国内NLP领域顶尖学者与技术专家,参会规模逾千人[2] 核心议程与特邀报告 - 大会荣幸邀请到管晓宏院士和方滨兴院士等多位知名专家作特邀报告[3] - 管晓宏院士(西安交通大学)将作题为“人工智能的奖励函数意味着什么”的报告[5][17] - 方滨兴院士(广州大学)将探讨“伦理与安全驱动的大模型关键技术研究”[5][18][20] - 文继荣教授(中国人民大学)将介绍扩散大语言模型新范式LLaDA,挑战自回归范式的地位[5][30] - 邱锡鹏教授(复旦大学)将提出“情境智能”作为补全AGI的关键拼图,以突破算力与数据瓶颈[6][33] 专题论坛与技术方向 - 大会将组织13场高端专题论坛,覆盖生成式AI、知识图谱、具身智能、情感计算等热点技术方向[3][7] - 专题论坛主题包括大模型与AIGC协同创新、大模型时代具身智能、大模型安全与隐私计算、大模型与民族语言等[7][8][10] - 具体技术议题涵盖智能体革命、大小模型协同、大模型高级推理、长上下文能力构建、多模态具身机器人等前沿领域[8][9][10] 产学研结合与产业应用 - 多个专题论坛聚焦产业落地,如“大模型时代语音技术的产学研协同”论坛将探讨学界和工业界如何协同发展[14] - 产业界代表将分享实践,包括阿里国际数字商业集团骆卫华博士探讨工业级大模型应用的挑战,字节跳动吴烨博士介绍大模型隐私保护推理,中国电信李杰博士分享星辰语音大模型研发应用[10][11][14] - 智慧医疗论坛将探讨AI全科医生构建、多模态医学数据分析、心电大模型等临床应用前景[11][16]
陪伴机器人:AI陪伴的高级赛道
2025-08-25 22:36
行业与公司 * 行业聚焦于AI陪伴机器人赛道,涵盖硬件级AI陪伴机器人、AI玩具及核心零部件舵机市场[1] * 涉及公司包括海外厂商如英国Energy Arts(MEKA机器人)、日本索尼(仿真宠物狗、猫)、软银(Pepper机器人),以及国内厂商如EX机器人(硅胶皮肤技术)、兆威机电、伟创电气等舵机供应商[3][5][11][12] 核心观点与论据 * **AI陪伴机器人成为重要发展方向**:因社会存在严重社交困境,AI社交软件(如豆包、逐梦岛、猫箱)已初步满足部分陪伴需求,但硬件级机器人将提供更真实丰富的互动体验[2] * **表情级陪伴机器人是未来重点**:具备仿真人头部面部表情(上百种表情)、人形基础及正常沟通能力,是应用市场最大领域[3] * **老年市场需求巨大**:中国65岁以上人口占比15.4%(2023年),假设未来老龄化比例达30%,以5%渗透率估算,潜在需求约4,200亿元[5] * **青年市场需求潜力显著**:15-34岁人口占比26%,基于互动性强AI硬件接受度高,以7%渗透率和2万元单价估算,潜在需求约5,000亿元[6][8] * **青年客群规模约5,000万人**:基于潮玩客(4,900万人)和宠物饲养人群(90后与00后占比66%)推算[7] * **AI玩具市场涵盖陪伴与教育**:自闭症儿童是全球重要应用对象,5岁以下患者约60万人,年均花费6万美元,潜在需求36亿-39亿美元[9] * **技术壁垒集中在三方面**:情感计算(文本、语言、视觉)、感知(仿生皮肤如硅胶/高分子/FAIfiber)、控制(微特电机驱动面部表情)[4][10] * **舵机驱动可能成为主流**:因高控制精度和较低价格,中国舵机市场规模预计达690亿美元(2023年为105亿美元),市场由日德企业主导(如日本电产),国内企业参与竞争[10][11] 其他重要内容 * **陪伴机器人分类**:包括桌宠级(小型、基本交互)、宠物级(情感寄托如索尼产品)、表情级(最大市场)[3] * **仿生皮肤技术路径**:硅胶皮肤、高分子皮肤及FAIfiber复合材料[10] * **国内外厂商研发进度同步**:均聚焦面部表情控制与情感感知算法,如Energy Arts实现60多种情绪表达[12]
我们在2025世界人工智能大会上,看到了7大趋势|混沌深度观察
混沌学园· 2025-08-20 20:05
文章核心观点 - 人工智能已从技术展示转向商业化落地 成为推动社会经济发展的新基建 [1] - 人机共生新时代加速到来 AI正从工具转变为协同伙伴 [2][17][18] - 中国AI应用未来三到五年将领跑全球 原生创新企业迎来爆发期 [47][48][50] 人形机器人和具身智能 - 人形机器人从静态展示转向实际应用 去年18家企业中能自主行走的寥寥无几 今年已能执行打螺丝、打麻将等精密操作 [5][6][7] - 麻将机器人实现多模态识别、规则理解与肢体控制深度协同 展示视觉识别与规则引擎突破 [9][11] - 具身智能开启万亿级市场 预测将出现机器人操作系统和应用商店 类似手机时代的安卓生态 [11] AI智能体应用 - AI智能体从概念层面发展为自主执行任务的数字同事 核心能力从回答问题升级为解决问题 [13][14] - 通用智能体如manus具备跨场景适应能力 可同时处理邮件分类、日程管理、会议纪要等多项任务 [16] - 人机协作关系重塑 提出"AI领导力"概念 管理者需同时领导碳基员工与硅基智能体 [17][18] 终端设备与场景应用 - 智能眼镜成为新风口 阿里、小米、华为等企业纷纷进入 实现数字世界无缝连接 [19][21] - AI耳机专注会议场景 提供记录、速记、翻译功能 语音交互不分散注意力且能长期伴随用户 [24] - 游戏领域实现AI实时生成场景交互 工业领域用大模型结合传统AI技术解决视觉识别个性化落地问题 [26] 基础模型技术进展 - 中国企业引领开源潮流 阿里通义、DeepSeek等开源模型推动基础能力建设 [30] - 多模态成为商业化大模型标准配置 AI能同时处理语言、动作和场景理解 [30] - 垂直化发展趋势明显 行业大模型集中爆发 "算法即行业Know-How"成为新理念 [30][31] 多模态交互与人机协作 - AI协作方式趋近人类 从被动接收指令转向主动参与创造关键工作要素 [32] - 情感计算成为新蓝海 1-7月132个路演项目中15%涉及情感计算领域 [35] - 产品设计注重情感价值 具身机器人设计转向温暖风格(如"大白"形象) [37][38] 算力成本趋势 - 算力瓶颈取得突破 通过新技术解决功耗、内存墙和通信墙问题 [40] - 国产算力崛起 华为昇腾等国产芯片研发趋于成熟顺畅 [42] - 算力成本持续降低 产能溢出使AI技术渗透至更多服务领域和产品领域 [43] 行业应用前景 - AI应用覆盖制造业、金融业、能源业、交通业、医疗、教育、气象等众多领域 [45] - 中国工程师展现强大工程化能力 能在原型确定后快速解决成本控制和系统稳定性问题 [47] - 创业者通过"开辟式创新"用AI解决社会问题 在创造社会价值的同时实现商业价值 [47]