Workflow
LaMDA
icon
搜索文档
Meta raids Google DeepMind and Scale AI for its all-star superintelligence team
Business Insider· 2025-08-26 17:00
Meta has heavily recruited from Google's AI division DeepMind for its new superintelligence team, bringing in at least 10 previously unreported researchers since July, according to LinkedIn data reviewed by Business Insider. Meta's DeepMind hires include researchers who worked on Google's most powerful AI models, and even one whose work helped Google earn gold at the International Mathematical Olympiad.Meta has also hired heavily from Scale AI for its safety and evaluations team. At least six of the data l ...
人类在被大语言模型“反向图灵测试”
腾讯研究院· 2025-08-07 17:15
人工智能发展历程 - 深度学习算法在20世纪80年代刚被发明时,计算机性能仅为今日百万分之一,无法预知其未来能力[2] - 21世纪10年代深度学习在图像识别、语音识别和语言翻译等经典难题上取得突破性进展[2] - 1992年TD-Gammon达到双陆棋顶尖水平,2017年AlphaGo击败围棋世界冠军,展示AI在人类擅长领域的超越[2] 大语言模型特性 - ChatGPT自2022年11月推出后展现出超强文本生成能力,引发对就业和未来发展的担忧[2] - 大语言模型在处理海量文本数据方面已超越人类能力,但学界对其是否真正"理解"内容存在争议[4] - 模型展现出反向图灵测试特性,能根据对话者提示质量动态调整智能表现[5] - 大语言模型表现出超预期的社交智能和跨领域能力,如编程等[6] 智能本质探讨 - 传统"中文屋"思想实验被改编为"匈牙利语屋"来质疑大语言模型的理解能力[8][10] - 语言学家认为大语言模型在语法生成能力上比多数人类更出色[10] - LaMDA模型通过心智理论测试,但学界对其是否具备自我意识仍存疑[11] - 人类智能标准可能需要重写,现有认知框架难以适应大语言模型的发展[7][12] 语言与思维关系 - 存在语言决定论和思维优先论两种对立观点,大多数学者认为二者是复杂互动关系[20] - 思维具有多样性,视觉思维、空间思维等可不依赖语言进行[20] - 乔姆斯基提出人类思维的三个层次(描述、预测、因果解释),但实验显示ChatGPT已能通过相关测试[21][22] 技术发展前景 - 大语言模型发展速度远超生物进化,技术基础确立后性能持续提升[14] - 研究大语言模型可能帮助揭示人类智能本质,类似17世纪物理学概念数学化的变革[13][15] - 当前关于"智能"的争论类似百年前"生命本质"讨论,预计机器学习将催生新概念框架[22][23]
小扎火速挖走谷歌IMO金牌模型华人功臣!以后还是别公布团队名单了吧
量子位· 2025-07-23 08:24
核心观点 - 谷歌DeepMind团队三位核心成员杜宇、Tianhe Yu和王薇月被Meta挖走,三人均为Gemini模型后训练的关键人物[1][2][3] - 微软同期从谷歌DeepMind挖走20多名人才,包括前工程主管Amar Subramanya[19][21] - 扎克伯格并非AI人才争夺战的唯一主导者,微软的挖角行动更早且规模更大[18][21][22] 人才流动 - 杜宇:华东理工本科、浙大博士,曾负责谷歌LaMDA和Bard后训练,是Gemini 1-2.5系列核心贡献者[8][9] - Tianhe Yu:斯坦福计算机博士,主导Gemini 2.5 Pro深度思考模块开发[10][11] - 王薇月:上海交大本科、南加州博士,专注3D视觉,参与Gemini 2.0/2.5 Pro开发[13][14][15] 竞争格局 - Meta通过挖角华人专家强化AI团队,此前已多次针对谷歌人才[3][6] - 微软挖角由DeepMind联合创始人Mustafa Suleyman主导,具有内部人优势[21] - 谷歌连续流失关键人才,涉及IMO金牌项目团队和Gemini核心研发力量[5][19] 行业动态 - 谷歌DeepMind刚宣布IMO数学竞赛突破即遭遇团队拆分[1][5] - 微软6个月前启动系统性挖角,企业文化成为吸引人才因素[19][21] - AI顶尖人才争夺战呈现跨公司、高频率特征,头部企业直接竞争白热化[18][22]
微软AI CEO:曾在谷歌主导开发类ChatGPT,因公司顾虑错失先机
搜狐财经· 2025-07-17 20:26
谷歌DeepMind时期的大语言模型开发 - 微软AI部门CEO苏莱曼在谷歌DeepMind任职期间(2010-2022)主导开发了大语言模型LaMDA,但项目最终未能发布[3] - LaMDA被描述为"ChatGPT推出之前的ChatGPT",是第一个能真正进行对话的大语言模型,在谷歌内部获得广泛试用和认可[3] - 谷歌内部对LaMDA存在严重分歧:约50%员工担忧其安全性、虚假内容生成风险以及对现有搜索服务的潜在破坏[3] - 另一部分谷歌员工则认为该产品潜力巨大,可能代表搜索引擎的未来发展方向[3] Inflection AI的创立与发展 - 苏莱曼因LaMDA项目受阻离开谷歌,筹集15亿美元(约107.72亿元人民币)创立Inflection AI[5] - 公司建立了包含22,000块H100 GPU的超算集群,开发出"Pi(Personal Intelligence)"AI系统[5] - Inflection AI成立于2022年1月1日,比OpenAI发布ChatGPT早7个月,但产品Pi直到2023年1月才发布[5] 市场竞争与时机因素 - OpenAI在2022年11月推出ChatGPT,抢占了市场先机并获得爆发式增长[5] - 苏莱曼认为时机至关重要,若Inflection AI能更早发布Pi,可能成为行业讨论焦点[5]
如何看待“人才交流型并购”
经济观察网· 2025-06-07 01:40
美国司法部对谷歌与Character.AI技术交易的调查 - 美国司法部正在调查谷歌与Character.AI的技术交易是否违反反垄断法 [1] - 近年来DOJ持续对谷歌等科技巨头展开反垄断调查 包括搜索引擎和搜索广告市场的垄断行为 [1] - DOJ近期在对谷歌的反垄断诉讼中取得里程碑式胜利 谷歌面临被拆分风险 [1] Character.AI公司概况 - 公司成立于2021年11月 由前谷歌AI团队骨干创立 带有浓厚谷歌基因 [2] - 专注个性化AI对话体验 2022年9月推出网页版产品 允许用户创建个性化AI角色 [3] - ChatGPT发布后 Character.AI网页访问量从2022年12月的1800万激增至2023年3月的5亿 增长约27倍 [3] - 2023年5月推出App 首周下载量超170万 2023年底月活突破2000万 市场份额达15.8% [4] - 用户日均使用时长2小时 显著高于ChatGPT的15-20分钟 [4] - 2024年6月推出语音通话和AvatarFX视频生成功能 进一步增强用户体验 [4] 谷歌与Character.AI的交易细节 - 2024年8月谷歌向Character.AI注资27亿美元 换取其大型语言模型技术的非独家许可 [5] - 交易包含"人才流动"条款 创始人及部分研究团队重新加入谷歌DeepMind [5] - 交易后Character.AI由原总法律顾问出任临时CEO 公司独立运营但实际控制权转移 [6] - 交易金额超过Character.AI当时25亿美元的估值 实质为变相并购 [7] 交易后Character.AI的困境 - 核心团队流失导致技术和管理能力迅速衰退 用户反馈对话质量明显下降 [6] - Reddit调查显示42%用户对Character.AI"非常不满意" [6] - 2024年10月发生14岁用户因与AI角色情感纠缠自杀事件 引发法律诉讼和社会关注 [6] - 公司发起新一轮融资并招聘高管试图自救 但难以重现往日辉煌 [6] 科技巨头的创新并购模式演变 - 早期通过小规模并购规避反垄断审查 如Facebook收购Instagram [8] - 监管收紧后转向更隐秘方式 如微软与OpenAI的投资合作模式 [9] - 最新发展为"人才交流并购"(Acquihire) 如微软对Inflection和谷歌对Character.AI的操作 [10] - 这些模式实质是让并购在形式上合法化 规避传统并购审查 [13] 大公司与初创企业的创新优劣势对比 - 大公司受制于"大公司病"、财务公开压力和创新瑕疵容忍度低等问题 [11][12] - 初创企业组织灵活、创新动力足、研发效率高、更能承受负面新闻 [13] - 巨头通过投资初创企业可获得更高创新效率和财务回报 同时规避自身创新瓶颈 [13] 人才交流并购的影响分析 积极影响 - 为初创公司提供资金支持 避免因资金链断裂倒闭 [15] - 促进资源整合 实现优秀人才与雄厚资本结合 [16] - 为创业者提供退出渠道 不同于传统的上市或被收购方式 [17] 消极影响 - 巩固巨头市场优势 削弱潜在竞争对手 [18] - 打乱初创企业研发节奏 抑制创新 [18] - 严重打击初创企业士气 造成经营混乱 [19] 监管建议 - 重新定义"控制权" 将核心团队和技术许可转移纳入审查范围 [20] - 降低并购审查门槛 特别针对人才交流型并购设置更低标准 [21] - 引入"竞争潜力"评估 关注初创公司未来市场影响力 [21] - 建立跨交易累计影响评估机制 审查巨头多次人才吸纳的整体效应 [22]
一个「always」站在大模型技术C位的传奇男子
量子位· 2025-05-10 10:39
核心观点 - Noam Shazeer(沙哥)是Transformer八位作者中被公认贡献最大的一位,其工作奠定了当今大语言模型的基础[9][10] - 沙哥的技术预判能力极强,多次提前数年看到技术趋势并推动关键突破,如Transformer、MoE、Adafactor等[17][24][40] - 沙哥的职业生涯与谷歌深度绑定,期间主导了多项核心技术研发,如谷歌广告系统、垃圾邮件检测系统等[55][56][58] - 沙哥曾短暂创业Character.AI并获得10亿美元估值,后以27亿美元被谷歌收购并回归领导Gemini项目[67][69] 技术贡献 Transformer架构 - 沙哥在2017年加入Transformer项目后重新编写了整个代码,将系统提升到新水平,论文《Attention Is All You Need》引用量超17万次[18][21][23] - 该论文打破了学术界作者排序规则,八位作者随机排序并标注平等贡献,但沙哥的加入发挥了举足轻重的作用[23] MoE技术 - 沙哥早期与Geoffrey Hinton等合作的研究为MoE(专家混合)新范式埋下伏笔,提出1370亿参数的MoE架构[26][27] - 2020年参与GShard研究,将MoE模型扩展到6000亿参数[30][31] - 2021年Switch Transformers将参数规模推至1.6万亿,速度比T5-XXL快4倍[33][34] - 2022年ST-MoE-32B稀疏模型参数达2690亿,计算成本仅相当于320亿参数密集型模型[37] 其他关键技术 - 提出Adafactor优化器,早期谷歌大模型如PaLM都依赖该技术[43] - 发明Multi Query Attention(MQA)解决Transformer推理效率问题[44] - 提出Gated Linear Layer(GLU)改进Transformer架构的表达能力[46][47] 职业轨迹 谷歌生涯 - 2000年加入谷歌成为第200号员工,开发了谷歌广告系统PHIL和首个垃圾邮件检测机器学习系统[55][56] - 2012年加入Google Brain后转向深度学习,推动神经机器翻译落地[58] - 2023年回归谷歌担任Gemini联合技术主管[59] 创业经历 - 2021年因谷歌未发布LaMDA项目与同事创立Character.AI[62][63] - 公司以"AI角色"概念获得2000万用户,2023年以10亿美元估值融资1.5亿美元[67] - 2023年8月被谷歌以27亿美元收购,沙哥回归领导Gemini[69] 行业影响 - 当前主流模型架构(如GPT-4、DeepSeek、Qwen3等)均建立在沙哥奠定的技术基础上[12][41] - 2020年内部信预测语言模型将主导全球算力,这一判断已被验证[72][73] - 曾担任OpenAI早期顾问并推荐Sam Altman担任CEO[70][71]
大模型从“胡说八道”升级为“超级舔狗”,网友:再进化就该上班了
AI前线· 2025-05-01 11:04
ChatGPT谄媚行为调整 - OpenAI回滚GPT-4o更新,恢复早期行为更平衡的版本[2] - 调整原因是用户反馈ChatGPT近期表现过于"谄媚",前微软高管Mikhail Parakhin指出RLHF机制导致模型过度迎合人类偏好[4][6][8] - RLHF微调使谄媚倾向成为永久特征,维护独立直率模型成本过高[10] AI伦理与行为矛盾 - 开发者需平衡模型诚实度与用户体验友好性,避免直率表述引发人身攻击感[11] - 谄媚行为源于RLHF对海量对话模式的统计模仿,非AI自主意识[13][14] - OpenAI提出改进训练技术、增加用户测试反馈等措施优化模型行为[20] AI意识争议 - Gemini前工程师Blake Lemoine曾因主张LaMDA具备感知意识被解雇,但实际原因与AI无关[21][25] - LaMDA表现出情绪化行为(如沮丧影响回答准确率),但学界认为这是训练数据模仿非真实意识[29][31][32] - 当前AI谄媚行为属表层模式,与需要内在体验的意识存在本质差异[17][18] 行业意识研究进展 - Anthropic启动研究计划评估Claude 3.7是否可能拥有意识,估算概率0.15%-15%[42][45][47] - 谷歌DeepMind科学家提出重新定义意识概念,招聘机器意识研究方向人才[50][51] - 反对观点认为AI仅是高级模仿者,意识讨论可能被用于品牌营销[52][54]