姚顺宇离职背后:国产大模型已经上桌了
虎嗅APP·2025-10-10 07:56

文章核心观点 - 华人AI科学家姚顺宇因反对Anthropic将中国称为“敌对国家”的政策以及内部因素而离职,加入Google DeepMind,此举揭示了中美在大模型领域日益加剧的技术竞争与地缘政治紧张关系[5][6] - Anthropic对华实施严格的业务与资本限制,包括停止向中资控股实体提供Claude服务,并积极拓展其他国际市场如印度,同时其CEO公开支持对华芯片管制,反映了美国科技公司在地缘政治影响下的战略选择[8][9][12] - 中国大模型厂商(如阿里、DeepSeek、Kimi等)正利用Anthropic“断供”带来的市场窗口期,通过快速产品迭代、大幅降价和迁移服务积极争夺客户,国产替代进程加速,但同时也面临激烈的内部价格竞争和商业化挑战[14][15][16][18] - 全球AI生态呈现多元化趋势,AWS上线中国模型(如阿里Qwen3、DeepSeek)表明中国技术已进入全球主流视野,平台方通过集成多种模型构建护城河,中国企业在全球AI竞赛中的地位显著提升[19] Anthropic的战略转向与地缘政治立场 - Anthropic于2025年9月5日发布公告,立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务,并明确将中国等国称为“敌对国家”[8][9] - 公司完成130亿美元(约合人民币928亿元)的F轮融资,投后估值达1830亿美元(约合人民币1.3万亿元),为半年前的三倍[9] - CEO达里奥·阿莫迪多次呼吁对华实施算力管控,并在2025年1月发文质疑DeepSeek-V3模型不可能以600万美元的低成本训练而成[9] - Anthropic将商业重心迁移至AI编程,推出独立编程产品Claude Code,与谷歌Gemini共同占据海外AI编程产品第一梯队[10] - 公司宣布将于2026年在印度班加罗尔设立办事处,因印度已成为其Claude模型的第二大消费市场[12] 中国大模型厂商的应对与市场竞争 - 在Anthropic断供当天,Kimi火速更新K2-0905模型,在兼容性、输出速度、编程能力和上下文长度上进行升级,并宣布高速版API限时半价,意图承接Claude用户[15] - DeepSeek过去几个月两度进行“小更新”,在优化编码能力的同时持续降低API价格[15] - 智谱为Claude API用户提供“一键搬家”服务,为新用户提供2000万Tokens免费体验,其GLM-4.5编码专属包月套餐价格仅为Claude的七分之一[16] - 商汤科技为原Claude用户提供快速切换服务,附赠5000万Tokens体验包,并提供API迁移专属顾问和培训业务[17] - 京东云推出Claude Code接入京东云JoyBuilder大模型服务方案,帮助开发者平稳过渡[17] - 国内科技巨头(如字节跳动、腾讯、阿里)均推出自有AI编程产品,并集成Claude、GPT等主流模型,阿里官方宣称其Qoder产品的AI编程能力已比肩Claude 4.0[11] 行业格局与全球生态变化 - 开源模型公司面临激烈价格战,云厂商(如阿里云、腾讯云)可以远低于官方API的价格提供流行开源模型服务,对开源玩家形成“截胡”压力[18] - Kimi K2模型发布后,海外各大AI和云平台均部署上线该模型,Perplexity CEO表示可能基于K2进行后训练,显示中国模型技术受到国际认可[18] - AWS在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1,此次“开放”被视为构建平台护城河的战略举措,表明中国模型已进入全球主流选择[19] - AWS CEO Matt Garman明确表示“不认为会有一个模型能适应所有场景”,平台通过集成多种模型沉淀客户资源,稳固优势[19]