Workflow
现在就等梁文锋了
投资界·2025-08-10 15:45

硅谷AI圈最新动态 - OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b和gpt-oss-20b,采用Transformer架构和MoE设计,参数规模分别为1170亿和210亿[13] - gpt-oss-120b在核心推理基准测试中性能接近OpenAI o4-mini,可在单张80GB GPU上运行;gpt-oss-20b性能接近o3-mini,支持16GB内存端侧运行[13] - 模型采用分组多查询注意力机制(组大小8)和旋转位置编码(RoPE),原生支持128k上下文[13] - 在RTX5090上运行20B版本,输出速度达160-180tokens/秒[21] - 性能测试显示在远小于DeepSeek R1和Qwen 3的体量下,接近中国开源模型性能[23] 谷歌Genie 3突破 - 谷歌发布文生虚拟世界模型Genie 3,可生成720p清晰度24FPS流畅度的动态交互世界[28] - 模型能实时响应用户指令生成不同内容,要求精准处理物理交互逻辑[29] - 技术突破可能对VR、游戏和文生视频赛道产生深远影响[29] - 目前仍处于官方演示阶段,未开放普通用户试用[29] - 相比前代产品,Genie 3在分辨率、交互时长等方面有显著提升[31] Anthropic专注AI编程 - Anthropic更新顶级大模型Claude Opus 4.1,AI编程能力上限提升2%[34] - 在SWE-bench测试中达到74.5%准确率,领先OpenAI和Gemini同类产品[35] - 终端编程测试(Terminal-Bench)表现达43.3%,显著优于竞品[35] - 公司选择集中资源提升编程能力,保持在大模型商业化赛道的竞争力[38] 华人科技人才贡献 - OpenAI gpt-oss系列核心团队成员包括北大校友任泓宇,曾任职苹果、微软等公司[42] - 上海交大校友Wang Xin参与模型后训练工作[44] - 谷歌Genie 3团队有上海交大本科、哈佛博士Emma Wang参与,优化后实现24fps流畅度和亚秒级延迟[46]