Workflow
DeepConf
icon
搜索文档
腾讯研究院AI速递 20250825
腾讯研究院· 2025-08-25 00:01
开源大模型进展 - xAI开源Grok-2模型权重和架构 采用MoE架构拥有9050亿总参数 推理时激活1360亿参数 支持128k上下文长度 商业使用限于年收入低于100万美元的公司 模型体积超500GB 需8张显存大于40GB的GPU部署[1] - Grok-3将在6个月后开源[1] AI推理优化技术 - Meta AI与加州大学提出DeepConf置信度筛选方法 通过实时监控置信度对推理路径动态筛选和加权投票 使开源模型在AIME 2025达到99.9%准确率 减少85% token消耗 无需外部工具[2] - 提供离线和在线两种工作模式 可直接应用于现有模型无需额外训练 在vLLM中仅需约50行代码集成[2] 企业战略调整 - OpenAI CEO Sam Altman将日常运营移交应用业务CEO Fidji Simo 本人专注筹集万亿级资金和超级计算项目[3] - Simo具有Facebook增长期和Instacart上市经验 将负责ChatGPT等消费级应用商业化 产品线可能扩展至浏览器 最快今年秋季在ChatGPT购物搜索引入联盟链接变现[3] 芯片技术突破 - DeepSeek V3.1使用UE8M0 FP8参数精度 引发寒武纪等国产芯片概念股涨近14%[4] - UE8M0 FP8为微缩块格式 全部8比特分配给指数位无符号位 大幅提高带宽效率和性能 与下一代国产芯片协同优化 让相同硬件运行更大模型 提高国产芯片性价比 多家厂商已联合验证该格式[4] 产业合作动态 - Meta与Midjourney合作获得AI图像和视频生成技术使用许可 将整合到未来AI模型中 开发与OpenAI Sora竞争的产品[5] - Midjourney成立于2022年未接受外部融资 年收入预计2亿美元 今年6月发布首款AI视频模型V1[5] 企业AI应用强制推广 - Coinbase CEO强制要求所有工程师试用GitHub Copilot和Cursor AI工具 对未按要求行动且无合理理由的员工直接开除[6] - 开发者社区对强制推广AI工具存在分歧 部分支持提升效率 部分担忧损害工作品质[6] 生物科技跨界合作 - OpenAI与Retro Biosciences合作开发GPT-4b micro模型 设计全新蛋白质 使细胞重编程技术效率提升50倍[7] - AI设计的RetroSOX和RetroKLF蛋白质命中率分别超30%和50% 不仅加速细胞重编程 还降低DNA损伤水平 为细胞疗法和抗衰老技术开辟新路径[7] 产品开发方法论 - Claude Code采用内部原型测试流程 工程师直接用Claude Code快速做功能原型 内部推广反响热烈后正式发布[8] - 小团队开发者倾向使用自动接受模式开启多个Claude并行处理任务 大企业偏爱先探索代码库制定详细计划[8] - 通过CLAUDE.md文件、自定义斜杠命令和钩子实现高度定制 配套SDK能在30分钟内搭建功能强大的代理原型[8] 平台竞争格局 - AI应用生成平台走向专业化与差异化发展 各平台在细分领域互补共存 形成多元格局[9] - 平台呈现三大类别:Prototyping原型设计、Personal software个人软件和Production apps生产应用 针对不同用户层级[9] - 超七成用户保持单一平台忠诚度 21%高级用户使用多个互补平台 未来各品牌将走向更深层次专业化[9] AI能耗透明度 - 谷歌发布首份AI能耗报告 显示中位Gemini提示词消耗0.24瓦时电力 相当于微波炉运行一秒 碳排放量为0.03克二氧化碳[10] - 能耗构成:AI芯片(TPU)占58% 主机CPU和内存占25% 备用设备占10% 数据中心开销占8%[10] - Gemini能耗一年内下降33倍 每个提示词消耗约0.26毫升水 为科技公司首次发布透明AI能耗评估数据[10]