大语言模型
搜索文档
Anthropic“挖角”OpenAI创始元老
第一财经· 2026-05-20 12:33
2026.05. 20 本文字数:998,阅读时长大约1.5分钟 作者 | 第一财经 吕倩 北京时间5月20日,OpenAI创始成员、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)公开宣 布,已加入大模型公司Anthropic。 他称,未来几年将是LLM(大语言模型)前沿领域非常关键的塑造期,非常高兴能加入团队并重返 研发一线。他依然对教育充满热情,并计划在适当时机恢复相关工作。在此之前,卡帕西曾短暂将精 力投入其创办的AI教育初创公司Eureka Labs。 卡帕西加盟Anthropic的消息在行业内引发了广泛关注,观察人士指出,卡帕西是近年来继前OpenAI 对齐负责人扬·莱克(Jan Leike)、联合创始人约翰·舒尔曼(John Schulman,现已加入Thinking Machines Lab ) 、 创 始 团 队 成 员 德 克 ・ 金 马 ( Durk Kingma ) 之 后 , 又 一 位 投 奔 Anthropic 的 OpenAI核心元老。在各家人工智能巨头竞相推进商业化与资本运作的节点,卡帕西这样的技术旗帜 性人物选择加入,将极大增强Anthropic在学术界与高 ...
谷歌再造“谷歌”,但股价跌了
第一财经· 2026-05-20 12:33
核心观点 - 谷歌在2026年I/O大会上以“智能体Gemini时代”为核心主题,发布了一系列模型、智能体产品、平台及硬件更新,旨在巩固并拓展其AI生态系统[3] - 尽管产品更新覆盖广泛,但市场反馈呈现两极分化,新模型性价比受到质疑,公司股价在发布会后下跌超2%[3] - 公司凭借庞大的用户生态(如13款超10亿用户产品)和模型驱动的增长(如Gemini月活翻倍),构建了独特的竞争护城河,但AI竞赛已演变为成本、生态与商业模式的综合较量[6][18] 用户与生态增长 - Gemini应用月活跃用户数从一年前的4亿增长至9亿,实现翻倍[5] - 公司每月处理的token(词元)量从两年前的9.7万亿个增长至约480万亿个(去年I/O大会),再到目前的超过3200万亿个,实现了7倍增长[6] - 公司旗下有13款产品各自拥有超过10亿的用户规模,其中5款产品用户数量超过30亿[6] 核心模型更新 - 正式发布新一代轻量基座模型Gemini 3.5 Flash,官方称其输出速度是同类模型的4倍,价格不到同类前沿模型的一半[7] - 与Gemini 3.1 Pro相比,3.5 Flash在几乎所有基准测试中表现更优,尤其在编程和GDPVal等接近真实经济任务的评测中[7] - 据公司测算,若头部科技企业将80%的日常工作负载从其他前沿模型迁移至Gemini 3.5 Flash,每年可节省超过10亿美元[7] - 海外评测指出,Gemini 3.5 Flash智能指数得分为55,比前代3 Flash提高9分,但因其更高的token使用量和定价,运行成本比3 Flash高出5倍多,比3.1 Pro高出75%[8] - 发布全模态世界模型Gemini Omni Flash,目前仅支持视频输出能力,未来将扩展至图片和文本[10][12] - 所有Gemini Omni生成的内容均带有SynthID数字水印,可追溯为AI生成,该核验功能已嵌入谷歌搜索和Chrome浏览器[12] - OpenAI、Kakao和ElevenLabs等公司也将采用SynthID数字水印技术[12] - 公司内部正在研发Gemini 3.5 Pro,并计划在下个月正式推出[10] 智能体产品与平台 - 推出对标OpenClaw的个人智能体产品Gemini Spark,深度集成于Workspace工具(如Gmail、Docs),可全天候执行任务[14] - 宣布将在搜索中加入信息智能体,用户可创建智能体以持续跟踪股票、租房信息等特定信息[14] - 面向开发者升级了AI智能体集群管理平台,推出Antigravity 2.0,其内置优化版本响应速度达到其他前沿模型的12倍[15] 硬件进展 - 公布智能眼镜计划,分为带小型镜片的显示眼镜和音频眼镜两类,用户可解放双手通过语音与Gemini交互[15] - 音频眼镜计划于今年秋季率先上市,由三星参与硬件构建,Warby Parker与Gentle Monster负责设计[17] 定价策略调整 - 调整Gemini订阅价格:将原250美元/月的AI Ultra拆分为新推出的100美元/月计划(面向开发人员、技术主管等)以及最高档的200美元/月计划[18] - Gemini Pro订阅价格维持在19.99美元/月[18]
截胡算力、吞吃工具链、吸纳Karpathy:Anthropic如何围剿OpenAI?
AI科技大本营· 2026-05-20 12:06
文章核心观点 - 人工智能标志性人物Andrej Karpathy加入Anthropic,标志着行业竞争重心回归最前沿的研发(R&D)腹地,而非纯粹的商业变现 [2][4] - Karpathy的加入是对Anthropic研发路线和行业方向的“公开站队”,其核心使命是打破预训练瓶颈,开启人工智能的递归自我改进 [4][8][14] - 行业正处在大语言模型最具“塑造性”的时期,AI研发本身正在被AI化,形成自我进化飞轮的公司将在下一代竞争中占据优势 [8][14][15] - OpenAI与Anthropic在2026年呈现出截然不同的路径:前者为冲刺IPO(估值8520亿美元)而激进商业化并牺牲科研,后者则保持研发纯粹性并实现恐怖增长 [16][17][18] - Anthropic通过整合顶尖人才、无限算力、垄断工具链以及对力量边界的敬畏,正在重构AI权力格局 [18][20][21][22][23] 人物背景与行业影响 - Andrej Karpathy拥有三重身份:深度学习正史书写者(师从李飞飞,OpenAI联合创始人)、顶级工程架构师(前特斯拉AI总监)、大模型时代底层布道者(提出“软件2.0”) [5][7][8] - 他的加盟为Anthropic带来了不可估量的技术号召力,并向行业释放了明确信号 [4] - Karpathy强调“重返R&D”,正面回击了行业关于预训练大模型“Scaling Laws”放缓的焦虑论调 [8][9][12] Anthropic的竞争优势与战略 - **财务与增长**:2026年第一季度实现“80倍增长”,年化经常性收入(ARR)暴涨至300亿美元 [18] - **算力资源**:与SpaceX达成交易,整体接管拥有22万张GPU的Colossus 1数据中心,获得“无限算力” [18] - **研发聚焦**:Karpathy直接加入核心的预训练团队,任务是用Claude模型本身来加速预训练研究,开启递归自我改进 [13][14] - **工具链整合**:完成了凶狠的垂直整合以承载极端开发效率(如“氛围编程”),形成封闭高效的全栈垄断 [19][20] - 收购Bun,将代码底层解释器启动时间压缩到3毫秒 [24] - 斥资超3亿美元收购Stainless,垄断AI公司API生成SDK并切断外部供应,打击了竞争对手的开发者生态 [24] - **战略克制与安全**:对前沿能力(如怪物模型Claude Mythos)保持敬畏,用于预警和修复全球关键基建,而非单纯追逐估值 [21][22] OpenAI的现状与挑战 - 正为冲刺2026年底估值8520亿美元的IPO而推行激进商业化路线 [17] - 商业让路导致科研收缩:取消了“OpenAI for Science”部门,永久下线Prism,关停Sora网页端和API服务 [17] - 面临核心人才严重流失:科学团队负责人、Sora负责人、后训练负责人及多位建校元老相继离职 [17] 行业技术趋势与竞争态势 - 预训练大模型的“Scaling Laws”被认为可能放缓,靠堆砌参数和算力难以再现阶跃式突破 [9][12] - AI研发AI化成为新范式:使用AI智能体蜂群自主搞科研,将训练时间从一周压缩到个位数小时;模型分析自身训练日志以改进下一代 [14] - 大模型竞争的下半场,最惨烈的战役依然在最前沿的研发腹地 [4] - Anthropic的崛起(聚合顶尖大脑、专注研发)与OpenAI的商业化转型,标志着全球人工智能权力天平的倾斜 [23]
Nature:中国推动AI-脑机接口从实验室走向真实世界应用,帮助瘫痪者行走和说话
生物世界· 2026-05-19 16:00
脑机接口技术概述 - 脑机接口是一项前沿的颠覆性技术,通过解码大脑神经活动产生的电、磁或血氧信号,在大脑与外部设备之间建立直接的信息交换通路,实现“意念控制”和双向交互[2] - 该技术的应用已从医疗康复领域拓展至增强认知、沉浸式娱乐、智能驾驶等多个前沿方向[2] - 随着算力提升与算法突破,脑机接口有望成为人机融合、智能增强乃至实现“脑联网”的关键基础设施[2] 行业发展与政策支持 - 中国企业正在竞相研发和部署人工智能驱动的脑机接口,以帮助人们行走、说话和控制设备[3] - 在最新的中国“十五五”战略规划中,脑机接口被列为重点发展的“未来产业”,目标是在2027年之前取得重大突破,在2030年之前培育出两到三家世界一流的脑机接口公司,成为全球领导者[7] - 2026年3月,中国国家药品监督管理局正式批准了全球首个脑机接口商业化植入设备上市,用于帮助因颈髓损伤导致四肢瘫痪的患者恢复手部运动功能[7] 技术进展与临床应用 - 过去几年,主要是中国和美国的一些公司将大语言模型接入到脑机接口设备中,这使得研究人员能够比使用传统技术更准确地解码大脑活动[5] - 脑机接口已被用于瘫痪患者和神经退行性疾病患者[5] - 在中国,已有几项临床试验正在进行中,预计其中一些由AI驱动的脑机接口设备很快就会面向公众出售[6] 主要公司动态 - **脑虎科技**:由陶虎博士等人于2021年创立,是中国最早的脑机接口公司之一[6] - 其开发的用于瘫痪治疗的AI脑机接口被放置在颅骨顶部,传感器接入大脑皮层,系统通过导线与植入受试者胸部的数据传输器相连[6] - 2025年10月,其内置电池的全植入、全无线、全功能脑机接口产品在复旦大学附属华山医院进行了临床试验,一名因脊髓损伤而高位截瘫8年的28岁患者在接受植入5天后,能够通过意念移动电脑光标来控制家用电器[6] - 该公司还开发了一款大语言模型,使脑机接口能够以每分钟300个汉字的速度实时解码普通话,这一速度超过了以普通话为母语的人的平均说话速度(每分钟220个汉字)[6] - 该模型已成功从一名35岁女性癫痫患者的脑机接口信号中解析生成了词语和短语[6] - **姬械机科技**:一家总部位于北京的公司,致力于开发专门用于脑机接口的AI模型[7] - 公司正准备在2026年6月份推出一款由脑机接口驱动的智能轮椅,以帮助患有运动神经元疾病的患者[7] - 该轮椅通过AI模型解码大脑活动,并通过评估用户眼睛的移动方向来确认解读结果,然后指挥轮椅移动[7] - 目前已与北京协和医院合作完成了一系列临床试验[7]