PolyGen 1.5
搜索文档
腾讯研究院AI速递 20251201
腾讯研究院· 2025-12-01 00:01
AI视频生成模型进展 - 名为Whisper Thunder(aka David)的神秘模型登上Artificial Analysis视频生成榜单榜首,超越Veo 3、Kling 2.5及Sora 2 Pro等所有公开AI视频模型 [1] - 该模型视频时长固定为8秒,运动幅度明显更强,但高动作场景存在抖动等瑕疵 [1] - 基于用户投票机制的排名方式存在局限性,开发者和上手时间目前全网无任何确切消息 [1] 腾讯3D生成技术突破 - 腾讯混元正式推出混元3D Studio 1.1,接入全新美术级3D生成大模型PolyGen 1.5,首次实现端到端四边面直接生成,适配游戏、动画、VR等专业制作流程 [2] - 基础模型升级至混元3D 3.0,支持36亿体素级别超高清建模,几何分辨率达1536³,建模精度相比上一代提升约3倍 [2] - PolyGen 1.5采用统一三四边面混合表征和强化学习策略,布线呈连续边缘环结构,破损率更低面片规整度更高,可直接用于UV展开和动画绑定 [2] AI音乐模型商业化进展 - 昆仑万维发布Mureka V7.6和Mureka O2模型,3月底以来新增注册用户近700万,全球超100个国家和地区用户访问 [3] - 新模型在音乐性、编曲能力、音质质感和Prompt贴合度等多维度显著提升,响应速度和推理效率大幅增强,更适合大规模商业化使用 [3] - 模型延续MusiCoT细粒度音乐建模体系,强化段落关系、乐器互动与情绪走向建模能力,空间声场与音质生成达到更接近专业制作标准 [3] AI对软件开发行业影响 - 斯坦福大学《现代软件开发者》课程鼓励学生完全使用AI工具,讲师表示"如果能上完整个课程而不用手敲一行代码,那才是真的牛" [4] - 斯坦福研究显示22岁至25岁初级开发者相对就业率在AI浪潮中下降13%,到2025年7月该年龄段就业人数预计比2022年底峰值下降近20% [4] - 微软CEO透露30%代码由AI编写,Meta预测2026年一半开发工作将由AI完成,谷歌超过25%新代码是AI写的 [4] AI技术发展路径思考 - Ilya Sutskever澄清扩展确实还能带来进步没有停滞,但即便继续扩大规模有些至关重要的东西依然缺失 [5][6] - 顶尖研究人员共识认为光靠现在技术范式足以给经济社会带来巨大冲击,但要搞定AGI/ASI还需要更多研究突破 [6] - Ilya谈到人类"情绪价值函数"之于预训练的重要性,情绪是决策系统一部分而非多余噪音,这可能是当前AI技术路线缺失的"重要东西" [6] 开源模型与市场格局 - Hugging Face联合创始人表示中国模型已成初创公司探索新场景首选,美国开源复兴是对中国发展的回应 [7] - 他认为LLM泛化能力比预期弱得多,现有技术会遇到天花板难破super intelligence,真正突破需要模型能"挑战旧有假设创造新问题" [7] - Hugging Face团队250人运营效率高,企业版Hub已有数千组织使用包括Salesforce等大型客户 [7] AI投资风险分析 - 吴恩达认为AI不同领域泡沫程度各异:AI应用层被严重低估投资不足,AI推理基础设施仍需大量投资,AI模型训练基础设施风险最高可能存在泡沫 [8] - 开源开放权重模型市场份额若持续增长,斥资数十亿训练模型的公司可能无法获得诱人财务回报,且技术护城河薄弱算法硬件进步使训练成本逐年下降 [8] - 最担心训练设施因过度投资而崩盘可能导致市场对整个AI领域情绪恶化引发非理性资金外流 [8] AI对劳动力市场影响 - MIT联合橡树岭国家实验室开发"冰山指数"模拟工具,创建包含1.51亿个智能体的美国劳动力市场数字孪生体,结论显示现有AI技术已有能力替代美国11.7%劳动力 [9] - 科技IT互联网领域岗位变动只占受AI影响总工资的2.2%,绝大多数冲击发生在金融、医疗、人力资源、物流和办公室行政等白领领域 [9] - 模拟精确到具体邮政编码发现AI影响力全覆盖无避风港,田纳西州已率先使用该指数制定官方《AI劳动力行动计划》 [9]