PaLM - 财报，业绩电话会，研报，新闻

PaLM

搜索文档

突发｜思维链开山作者Jason Wei被曝加入Meta，机器之心独家证实：Slack没了

机器之心· 2025-07-16 10:22

核心观点 - Meta持续从OpenAI挖走顶尖AI人才，最新目标是知名研究员Jason Wei和Hyung Won Chung [1][2] - 两位科学家在AI大模型领域贡献显著，Jason Wei是思维链（CoT）技术的主要作者，论文引用量超1.7万次 [4][6] - Hyung Won Chung是OpenAI o1系统的核心贡献者，参与多个重大项目研发 [4][29][38] 人才流动 - Jason Wei和Hyung Won Chung的Slack账号已被OpenAI停用，离职消息获多方证实 [2] - 两人均毕业于MIT，曾任职谷歌，2023年加入OpenAI后现可能同时转投Meta [6][18][27] - Jason Wei未直接回应跳槽传闻，但社交媒体评论普遍认为其将加入Meta [9][10] 技术贡献 - Jason Wei的CoT论文引用量超1.7万次，总论文引用量达77k，位列前两位的是CoT和GPT-4技术报告 [6][21] - Hyung Won Chung主导开发了OpenAI o1系列模型，强化了推理、搜索及RL策略能力 [29][38] - 两人参与OpenAI关键项目包括o1-preview、o1正式版、Deep Research及Codex mini模型训练 [18][29] 行业影响 - 人才流动反映Meta在AI领域的人才争夺策略，OpenAI面临核心团队持续流失压力 [1][41] - Jason Wei提出的RL"同策略"理念强调差异化研究路径，可能影响未来AI研发方法论 [11][12][13] - Hyung Won Chung的技术落地能力推动AI从理论到应用生态的闭环构建 [40]

思维链（CoT）

强化学习（RL）

Artificial Intelligence

Artificial Intelligence

思维链（CoT）

Codex mini

三位顶流AI技术人罕见同台，谈了谈AI行业最大的「罗生门」

36氪· 2025-05-28 19:59

AI技术发展路径的共识与非共识 - 预训练技术从2023年的行业共识到2025年面临质疑，OpenAI前首席科学家公开认为"预训练已走到尽头"，而DeepSeek R1等强化学习模型崛起[1] - 蚂蚁集团技术开放日圆桌讨论显示，行业分化成两派：曹越、孔令鹏等通过跨架构创新（如语言模型应用Diffusion、视频模型采用自回归）实现突破，阿里则坚持Transformer等传统路径[3][4][14] - 当前行业呈现多元探索态势，参与者形容为"摸彩票"，不同技术路线本质是平衡模型偏差与数据偏差的尝试[7][17][18] 主流架构的技术突破 - 扩散模型创新：Dream 7B以7B参数量超越671B的DeepSeek V3，通过双向学习处理并行任务，在数学/代码任务表现突出[3][8][17] - 视频模型革新：曹越团队将自回归应用于视频生成，突破Sora无时序先验的限制，通过编码时间关系提升信息利用率[10][11][12] - Transformer持续主导：阿里内部多次"魔改"Transformer后仍确认其最优性，但承认MOE架构在扩展性上的潜力[5][14][16] 模型优化与效率挑战 - MOE架构进展：DeepSeek实现1:20+稀疏比，阿里测试显示1:10-1:20区间效果最佳，但专家数增加会降低训练稳定性[19][20][22] - 多模态融合创新：通过Attention稀疏化提升跨模态效率，端到端优化Tokenize到联合建模的全流程[24][25][26] - 硬件制约明显：GPU对Transformer训练非最优，行业呼吁软硬一体解决方案[34][35][36] 预训练与数据应用趋势 - 预训练价值分歧：2024年认为数据枯竭是共识，2025年美国新观点认为仍有潜力，阿里证实数据增量仍能提升模型性能[38][39] - 算力驱动创新：历史显示算力增长可激活曾被放弃的技术，当前需重点优化算力利用率[40][41] - 创造本质探索：将创作定义为搜索问题，通过可能性空间遍历实现智能生成[42][43] 行业现存问题与应对 - 幻觉控制难题：强化学习可能加剧错误推理模式，阿里尝试通过稀疏自编码器(SAE)定位并抑制相关特征[30][31] - 架构选择成本：模型结构需同时兼容预训练与强化学习，当前每次技术押注成本显著上升[20][33] - 技术迭代哲学：行业进步类似飞机航道调整，需动态修正而非预测终极形态[44][45]

自诩无所不知的大模型，能否拯救笨手笨脚的机器人？

虎嗅· 2025-05-06 08:48

机器人技术现状与挑战 - 当前餐饮机器人主要执行重复性任务如制作汉堡、薄饼等但缺乏应对复杂厨房环境和突发状况的能力[1] - 传统机器人依赖预设编程无法处理程序外情况需要定义所有可能动作及效果[1][4] - 工业机器人如Levatas机器狗在限定场景表现良好但无法适应开放环境任务[7][9] 大语言模型(LLM)与机器人结合 - ChatGPT等LLM为机器人提供海量知识库弥补常识缺失实现自然语言交互[5][12] - Google的PaLM-SayCan系统通过LLM理解高阶需求如根据"健身完"自动选择健康饮品[21][22] - 南加州大学ProgPrompt方法将LLM生成代码与机器人执行结合任务成功率显著提升[18][19] 技术突破与创新应用 - LLM参数规模爆发式增长 GPT-4达万亿级北京智源"悟道2.0"达1.75万亿参数[12] - 普林斯顿团队利用GPT-3描述工具特性使机器人掌握未见过工具的使用方法[23] - 多模态模型成为新方向可同步生成语言、图像及行动指令[31] 行业应用前景 - 老年护理、家庭服务等领域潜力巨大但当前技术尚不成熟[26] - 工业检测领域已实现自然语言控制降低操作门槛[6] - 餐饮自动化可能被彻底改写需突破物理执行瓶颈[4][14] 技术局限性 - 机器人传感器与执行器有限难以匹配LLM的广泛语义理解[9][10] - LLM存在"幻觉"问题可能生成不合理指令需传统AI程序校验[27] - 物理世界随机性(如光线变化、物体形状差异)仍制约机器人表现[14] 伦理与社会影响 - 训练数据偏见可能导致机器人行为歧视如面部识别中的种族差异[28][29] - LLM可能放大社会刻板印象需建立防护机制[29] - 非洲等地区语言覆盖不足 LLM在非英语环境表现较差[28]

机器人(SZ:300024)

Large Language Models (LLMs)

Large Language Models (LLMs)

7B参数规模能力超越OpenAI ！小米推出首个推理开源大模型Mimo【附大模型行业发展趋势分析】

前瞻网· 2025-05-05 16:50

（图片来源：摄图网）其中，中国科技公司在大模型领域掀起的开源浪潮，正以技术破局之势重塑全球人工智能创新版图。据"小米大模型"公众号消息，小米开源首个为推理（Reasoning）而生的大模型「XiaomiMiMo」，联动预训练到后训练，全面提升推理能力，目前MiMo-7B的全系列模型均已实现开源。在数学推理（AIME24-25）和代码竞赛（LiveCodeBenchv5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。小米技术团队表示，MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段，模型通过挖掘高质量推理语料并合成约2000亿tokens专项数据，采用三阶段渐进训练策略，累计训练量达25万亿tokens。后训练阶段则引入创新强化学习技术，包括自研的"Test Difficulty Driven Reward"算法和"Easy Data Re- Sampling"策略，有效提升模型在复杂任务中的稳定性。技术团队还开发了"Seamless Rollout"系统，使训练效率提 ...

小米集团(HK:01810)

大模型

人工智能

Artificial Intelligence

Artificial Intelligence

XiaomiMiMo

GPT系列

PaLM