Workflow
腾讯研究院AI速递 20250901
腾讯研究院·2025-09-01 00:02

生成式AI行业动态 - xAI正式发布编码模型Grok Code Fast 1 该模型从零打造 速度比GPT-5快五倍 性价比高 性能进入全球编码模型前五名[1] - 模型架构聚焦真实编程任务 支持多语言 具备全栈开发与bug修复能力 研发团队以华人学者为主 通过用户反馈迭代优化 并公布多模态与视频生成路线图[1] - Meta因内部旗舰模型进展缓慢 Llama 5尚未成型 正寻求与OpenAI或谷歌合作为旗下应用注入AI 已在内部工具接入外部模型[2] - OpenAI发布语音模型GPT-realtime 具备超自然语音生成 情感语调模仿与多模态理解 准确率与推理能力显著提升 支持指令遵循 函数调用 异步对话与图像输入[3] - Realtime API同步上线 扩展SIP连接 复用提示 内置安全防护 以更低价格开放 推动语音AI智能体落地[3] - Claude更新隐私政策 默认允许收集用户对话与编程数据用于模型训练 不同意则仅保留30天 涵盖免费及付费用户[4] - 美团开源龙猫大模型LongCat-Flash 采用5600亿参数MoE架构 创新引入零计算专家和ScMoE 大幅提升效率与速度[5] - 模型在MMLU ArenaHard CEval等基准表现接近或超越DeepSeek V3.1与Qwen3 指令遵循与Agent任务排名领先 支持128k上下文 推理速度超100TPS 成本仅0.7美元/百万词元[5] - 全球七大LLM参加狼人杀210场对战 GPT-5以96.7%胜率领先 展现超强社交推理与操纵能力[6] - 作为狼人时以逻辑框架与心理战精准瓦解对手 作为村民时靠司法化调查体系抵抗操纵 零误伤关键角色[7] - xAI创始工程师李雪辰套现约700万美元股票后 被指窃取Grok核心代码库并叛逃至OpenAI xAI已提起诉讼指控盗取数十亿美元级别商业机密[8] 前沿科技研究进展 - 清华姚班本科生提出分层规划+强化学习框架 让宇树G1机器人在0.42秒内反应击球 连续对拉达106拍[9] - 高层规划器预测乒乓球轨迹与击球时机 低层RL控制器生成协调动作 融入人类动作参考提升击球自然性 实验中击球率96.2% 回球率92.3%[9] AI硬件投资视角 - a16z合伙人指出AI被局限在网页文本框 需通过硬件实现更自然交互 硬件优势在于被动收集语境信息让AI更精准有价值[10] - 关键突破点在于形态因子社会可接受 功能compelling 场景明确 成功路径是找到精确 有价值 社会认可的应用场景[10]