Workflow
缩放定律
icon
搜索文档
姚顺宇离职背后:国产大模型已经上桌了
虎嗅· 2025-10-09 21:19
核心人事变动 - 清华物理系特奖得主姚顺宇于2025年9月离开Anthropic,加入Google DeepMind [1] - 其离职原因中40%为反对Anthropic将中国称为“敌对国家”的政策,60%源于无法公开的内部信息判断 [2] - 姚顺宇于2024年10月加入Anthropic,从量子计算研究转向人工智能,并参与了Claude模型从3.7版本提升至4.5版本的工作 [3] Anthropic的战略转向与融资 - Anthropic于2025年9月5日发布公告,立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务,并将中国等国称为“敌对国家” [7][8] - 在宣布“断供”前两天,公司完成130亿美元(约合人民币928亿元)F轮融资,投后估值达1830亿美元(约合人民币1.3万亿元),为半年前的三倍 [9] - 公司明确将企业级服务API销售作为主要收入来源,并在Claude 3.5推出后将商业重心迁移至AI编程,推出了独立产品Claude Code [15] 技术路径竞争与CEO立场 - Anthropic CEO达里奥·阿莫迪多次呼吁对华实施算力管控,并质疑DeepSeek-V3模型不可能以600万美元的低成本训练而成 [11] - 其立场源于DeepSeek在推理模型上的创新对Anthropic坚持的Scaling Law和预训练模型主导的技术路径构成了挑战 [12] - 以DeepSeek为代表采用的“蒸馏”技术,使大模型厂商能以更快速度、更低成本训练模型,Anthropic采取断供措施以维护其技术壁垒 [13][14] 中国市场替代机遇与竞争 - Anthropic“断供”后,中国科技巨头迅速行动,阿里、腾讯、字节跳动等公司推出的AI编程产品均集成了Claude等主流模型 [16] - 国内大模型厂商如阿里通义千问、DeepSeek和Kimi嗅到国产替代机会,Kimi在断供当天火速更新K2-0905模型,并宣布API限时半价以承接Claude用户 [21] - 智谱、商汤科技、京东云等公司为原Claude用户提供快速切换服务、免费体验Tokens及迁移方案,价格仅为Claude的七分之一,意图争夺市场份额 [23] 全球市场布局与行业动态 - 在疏远中国市场的同时,Anthropic宣布将于2026年在印度班加罗尔设立办事处,因印度已成为其Claude模型的第二大消费市场 [17] - AWS宣布在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1,标志着中国企业在全球AI角逐中已占据核心位置 [28][29] - 海外AI编程产品第一梯队主要为Anthropic的Claude与谷歌的Gemini,而中国企业的模型亦开始被海外平台如Perplexity考虑用于后训练 [16][26]
GPT-5 信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
36氪· 2025-08-07 18:12
发布会信息 - OpenAI将于北京时间明天凌晨1点召开发布会,时长为一小时,预计内容充实 [1] 员工激励 - OpenAI首席执行官宣布向所有员工发放两年期共计150万美元的奖金,包括新入职员工 [2][25] 产品版本与能力 - GPT-5将推出四个版本:标准版gpt-5专注于逻辑推理和多步骤任务、轻量版gpt-5-mini适用于成本敏感场景、高速版gpt-5-nano面向低延迟需求、对话版gpt-5-chat专为企业级复杂多模态交互设计 [4] - 模型在推理能力、代码质量和交互理解方面升级,需较少提示词完成复杂编程任务,并增强Agent能力 [5] - 访问权限分层:免费用户使用基础版本,Plus用户接入更强推理能力模型,Pro用户可访问面向复杂任务的GPT-5 Pro版本,Team账户拥有最全面权限 [5][8][9] - GPT-5 Pro被标注为仅向Pro用户开放,定义为“研究级智能”,是性能最强的高端版本 [8] 性能测试与案例 - 社区用户通过Copilot接入GPT-5,在SimpleBench推理测试中达到90%准确率(10题答对9题),需提示“进行推理”激活复杂思考 [10][12] - 模型可自动启用推理能力处理复杂问题 [13] - 案例包括生成结构清晰的GTA克隆游戏雏形、设计未来科技感网页按钮、用Three.js制作3D飞行模拟器(UI表现较差)、实现具备动画和交互功能的3D太阳系模型 [15][17][19] 技术细节与行业背景 - GPT-5采用统一模型架构,融合GPT系列与推理模型,具备智能路由系统动态调用子模型 [22] - 支持完整多模态能力,整合图像、文字、音频、视频的理解与生成,内容视觉和逻辑一致 [22] - 软件工程能力提升,可处理复杂企业级代码库,微软测试显示代码质量改进且计算资源消耗未显著增加 [22] - Agent能力升级,擅长多步骤复杂任务 [22] - 行业面临缩放定律收益减弱及高质量数据枯竭的挑战,OpenAI截至今年6月未确认哪个版本可称为GPT-5 [22][23] 公司动态 - OpenAI正筹备新一轮融资,估值可能达5000亿美元,并推进内部股权出售计划,允许员工出售价值数十亿美元股份 [25]