AI虚拟人

搜索文档
大胆预测:今明两年,若无异常情况,社会可能迎来“五大趋势”
搜狐财经· 2025-05-19 08:08
房价趋势 - 2022年起二三线城市如郑州、石家庄房价下跌 2023年一线城市上海、深圳房价也开始调整 [4] - 政府通过取消限购、降利率、减税费等措施托底楼市 但难以扭转房价"稳中有降"趋势 [4] - 2023年全国商品房销售面积下降5%-10% 新开工面积下跌10%-15% 一线城市可能先企稳但低线城市仍需调整 [4] - 超过60%的年轻人认为"买房不是人生必选项" 更倾向将资金用于旅行、学习或创业 [4] 就业市场 - 2024年全球青年失业率达12.6% 低技能岗位萎缩明显 [5] - 灵活就业成为趋势 外卖行业吸纳超700万就业人口 其中35%为本科毕业生 [7] - 政府推动灵活就业者社保缴纳和培训补贴政策 但行业仍存在收入不稳定和保障不足问题 [7] 理财趋势 - 2024年银行连续三次降息 一年期定存利率跌破1.5%创历史新低 [8] - 存款总量逆势增长8% 国债和结构性存款等低风险产品收益更高 储蓄国债利率达3%左右 [10] - 2024年A股波动率超20% 仅不到三成散户盈利 黄金和保险成为避险选择 [10] 人工智能发展 - AI应用快速普及 深圳城中村餐馆使用机器人送餐降低成本50% [13] - 银行智能客服取代30%柜员 上海试点无人驾驶网约车 [14] - 社交平台AI虚拟人半年吸引130万用户 40%年轻人愿与AI倾诉 [14] - AI主要替代重复性工作如工厂流水线、客服、物流分拣 创意和管理岗位需求上升 [15] 老龄化问题 - 2025年中国65岁以上人口占比将达18% 每6人中有一位老人 [17] - 生育率仅1.6远低于2.1的世代更替线 养老金收支压力加剧 [18] - "跨代共居"模式在北上广深试点 年轻人租住老人闲置房间并提供日常照顾 [19] - 养老产业创新加速 智能护理机器人和老年兴趣社区等成为万亿级市场 [21]
喝点VC|a16z重磅预测:AI虚拟人将孕育众多市值达数十亿美元的行业巨头
Z Potentials· 2025-04-23 11:49
AI虚拟人技术演进 - AI虚拟人技术从CNN、GANs演进至Transformer+扩散模型 实现从单一面部驱动到半身/全身动态生成的跨越 口型同步与多模态协同表现显著提升 [4][5] - 模型架构发展脉络:2017年起从CNNs/GANs→3D NeRFs→Transformers→扩散模型→基于Transformer的扩散模型(DiT) 引用量最高的论文逐年迭代 [4] - 字节跳动OmniHuman-1模型和Hedra Character-3模型展现前沿技术 支持半身/全身动作生成 情感状态与动作表现可文本设定 [8][9] 核心技术挑战 - 面部需解决帧间连贯性+情境化表情同步难题 如说"我累了"需同步打哈欠动作 [24] - 口型同步依赖音素-视位映射 需协调脸部多部位运动 每人说话风格差异增加建模难度 [4][24] - 实时交互需整合智能大脑(记忆/个性)+低延迟流传输 LiveKit等产品已实现初步突破 [26] 应用场景落地 个人消费者 - 单张图片即可生成动画角色 推动虚拟主播/AI播客/音乐视频创作 Hedra平台支持音频驱动角色生成 [15] - 实时直播技术催生虚拟网红 Praktika已实现外语学习场景的AI教练实时互动 [16] 中小企业 - AI虚拟广告制作成本降低90%+ Creatify等平台实现脚本生成-虚拟演员匹配-素材整合全流程自动化 [17] - B2B企业采用Yuzu Labs工具开展个性化营销 支持原创角色与真人复刻双模式 [18] 大型企业 - Synthesia革新员工培训 自动化生成多语言培训视频 销售谈判模拟系统提升实战能力 [19] - 高管数字分身应用广泛 支持跨国企业内容本地化 Delphi平台实现领袖形象跨时空互动 [19][20] 未来突破方向 - 角色可塑性需支持20+形象切换 HeyGen已实现但需更灵活编辑功能 [27] - 身体动作自然化是下一焦点 当前手势控制依赖预设选项 缺乏情境适应性 [28] - 环境交互能力亟待突破 Topview正研发虚拟人拿取展示产品的广告场景 [29] - 实时应用将覆盖医疗问诊/零售导购等场景 延迟需从当前500ms降至200ms内 [29][30] 市场发展预测 - 底层模型质量提升推动应用层爆发 将诞生多个十亿美元级企业 企业级市场溢价能力显著 [30] - 工作流程工具分化 营销类需整合广告效果分析 内容创作类需场景复用功能 [30]
喝点VC|a16z重磅预测:AI虚拟人将孕育众多市值达数十亿美元的行业巨头
Z Potentials· 2025-04-23 11:49
AI虚拟人技术发展 - AI虚拟人技术正从内容生成迈向内容具身化 实现视觉与听觉维度的图灵测试后 下一个突破聚焦于融合人脸与声音的鲜活角色 [3] - 技术挑战包括口型同步 面部表情与肢体语言协同 以及多模态自然交互 避免"恐怖谷效应"需攻克动画制作 语音合成 实时渲染等难题 [4][21] - 模型架构从CNN/GANs演进至Transformer+扩散模型 实现从单一面部驱动到半身/全身动态生成的跨越 字节跳动OmniHuman-1和Hedra Character-3代表当前顶尖水平 [5][9] 技术构成要素 - 面部需保持帧间连贯性 情境化表情生成仍是难点 如打哈欠动作与语音同步 [22] - 声音要求与角色形象匹配 ElevenLabs提供语音克隆服务 口型同步依赖Sync等专业工具及Meta MoCha模型 [22] - 身体动作和背景交互亟待突破 Topview已实现虚拟人拿取产品的广告场景交互 [22][24] - 实时对话需"智能大脑"支持知识库接入 LiveKit/Agora优化低延迟流传输 Tolan展示外星人伙伴案例 [23] 应用场景落地 个人消费者 - 单图片生成动画角色催生虚拟主播/AI播客/音乐视频 Hedra平台支持图片+音频生成动态形象 Sync实现精准口型匹配 [15] - 实时直播技术推动教育等领域应用 如Praktika的外语AI教练具备个性化互动能力 [15] 中小企业 - AI广告制作成本降低90%以上 Creatify/Arcads实现脚本生成-镜头匹配-虚拟演员选型全流程自动化 [16] - B2B企业采用Yuzu Labs/Vidyard工具开展个性化营销 支持原创角色与产品素材智能融合 [17] 大型企业 - Synthesia革新员工培训 自动化生成合规/产品知识视频 Anam提供销售谈判模拟场景 [18] - 内容本地化依托ElevenLabs语音翻译 单视频可转换数十种语言 Delphi/Cicero构建高管数字分身拓展影响力 [18] 未来发展趋势 - 角色可塑性成关键 HeyGen已实现20种形象切换 Captions Mirage模型提升面部微表情自然度 [24] - 行业将分化出数十亿美元级企业 工作流程工具按场景细分 如广告全链路平台与故事创作工具 [25] - 实时应用场景爆发 涵盖AI医生问诊 虚拟销售助理 FaceTime剧集角色交互等 [24][25]