缩放定律
搜索文档
谷歌TPU逆袭英伟达,创始人一夜之间跃升全球第二、第三富豪
新浪财经· 2025-11-26 13:34
来源:市场资讯 (来源:机器之心) 谷歌股价涨疯了。 11 月 25 日美股开盘前,谷歌母公司 Alphabet(NASDAQ:GOOGL)股价飙升 2.4% 至 326 美元,刷新 历史新高。事实上,这一涨势已延续数日,仅在前一交易日,该股就大涨 6.2%,过去五个交易日累计 涨幅超 11.5%,近一个月涨幅更是高达 22%。 截至 24 日收盘,Alphabet 市值约为 3.84 万亿美元,位列全球第三,仅次于英伟达和苹果。按照 25 日 盘前涨幅计算,该公司只需较前一日收盘价再上涨不到 5%,即可突破 4 万亿美元大关,成为继英伟 达、微软和苹果之后第四家达成这一里程碑的公司。 股价的持续飙升直接推动了两位创始人的财富排名大幅跃升,全球富豪榜大洗牌。拉里・佩奇以 2684 亿美元成为全球第二富豪,谢尔盖・布林以 2488 亿美元位列第三。这一变化意味着他们成功超越了亚 马逊创始人贝索斯,仅次于特斯拉 CEO 马斯克。 值得注意的是,在谷歌两位创始人财富飙升的同时,甲骨文创办人拉里・埃里森近期却遭遇财富大幅缩 水,从此前的高位排名中跌落。 从年度表现看,谷歌无疑是 2025 年迄今表现最为耀眼的「Mag ...
谷歌TPU逆袭英伟达,创始人一夜之间跃升全球第二、第三富豪
机器之心· 2025-11-26 13:12
谷歌股价涨疯了。 机器之心报道 编辑:杨文 、 +0 11 月 25 日美股开盘前,谷歌母公司 Alphabet(NASDAQ:GOOGL)股价飙升 2.4% 至 326 美元,刷新历史 新高。事实上,这一涨势已延续数日,仅在前一交易日,该股就大涨 6.2%,过去五个交易日累计涨幅超 11.5%,近一个月涨幅更是高达 22%。 截至 24 日收盘,Alphabet 市值约为 3.84 万亿美元,位列全球第三,仅次于英伟达和苹果。按照 25 日盘前 涨幅计算,该公司只需较前一日收盘价再上涨不到 5%, 即可突破 4 万亿美元大关 ,成为继英伟达、微软 和苹果之后第四家达成这一里程碑的公司。 从年度表现看,谷歌无疑是 2025 年迄今表现最为耀眼的「Magnificent 7」(科技七巨头)成员。截至 24 日 收盘价 318.47 美元计算,其年初至今涨幅已高达 87.79%,遥遥领先于英伟达的 35.94%、微软的 12.46%、 苹果的 10.18%,以及 Meta、特斯拉和亚马逊均不足 5% 的涨幅。 股价的持续飙升直接推动了两位创始人的财富排名大幅跃升,全球富豪榜大洗牌。 拉里・佩奇以 2684 亿美 ...
开源!国内规模最大的全尺寸人形机器人真机数据集!哪里值得关注
机器人大讲堂· 2025-11-24 16:31
文章核心观点 - 全球首个面向真实作业场景的全尺寸人形机器人真机数据集“LET数据集”正式发布并开源首批超过60,000分钟数据 [1] - 该数据集旨在解决人形机器人及具身智能领域高质量、大规模、标准化真实世界操作数据极度稀缺的核心痛点 [1] - LET数据集有望驱动行业从“机械执行”到“自主理解与推理”的范式革命 [1] 人形机器人数据稀缺的原因 - 真机数据采集成本高昂,双足机器人每小时仅能采集三到四条有效数据,单条成本高达近二十元 [4] - 即便采用先进设备,百台机器人日数据产出仅为八到十万条,且面临设备周期短、单机投入高的困境 [4] - 依赖人工采集年成本轻易逼近三十万元 [4] - 行业数据生态处于“碎片化”状态,各机构数据格式不一、质量标准参差,形成“数据孤岛” [4] - 仿真数据与真实世界存在“物理鸿沟”,训练出的模型在现实场景中鲁棒性和迁移能力远低于预期 [3] LET数据集的关键特性与优势 - 数据集规模超过六万分钟,基于乐聚“夸父”全尺寸人形机器人真机采集,具备四十多个自由度 [5] - 数据一致性提升至百分之九十以上,时间戳误差严格控制在十毫秒以内 [7] - 构建深度融合的多模态体系,囊括清晰视频流、RGB图像、深度图、关节状态及末端执行器状态等关键信息 [7] - 全面覆盖工业、商业零售与日常生活三大核心领域,细致落地到汽车工厂、3C电子工厂等六大真实作业场景 [8] - 覆盖三十一项关键任务与一百一十七种原子技能,包括抓取放置、多臂协作到工具使用 [8] - 配套提供涵盖数据转换、模型训练、仿真测试与真机部署的全流程工具链,降低使用门槛 [10] 行业影响与未来展望 - LET数据集为验证并推动人形机器人的“缩放定律”提供了坚实基石 [11] - 加速了VLA模型从虚拟仿真到现实应用的落地进程 [11] - 以高标准共建为起点,积极推动国家及行业标准的研制与实施 [11] - 有望开启由数据共享驱动技术迭代,再由技术迭代反馈应用优化的良性循环 [11] - 将加速中国人形机器人从技术突破走向规模化量产的进程 [11]
GEN-0:史上规模最庞大多元的具身真实世界操作数据集!
自动驾驶之心· 2025-11-11 08:00
文章核心观点 - GEN-0是一种新型具身基础模型,专为基于高保真原始物理交互进行多模态训练而构建,其能力随真实物理世界交互数据实现可预测的持续增长 [5][6][9] - 该模型在机器人领域首次观察到明确的扩展定律,证明模型性能随算力、数据和参数规模增长而持续提升 [6][14][15] - 模型在70亿参数规模出现智能“相变”临界点,突破了过去机器人领域模型规模和数据量的限制 [6][11][13] 模型架构与技术突破 - 架构继承视觉语言模型优势并实现突破,原生设计可捕捉人类级条件反射与物理常识 [5] - 核心特性“谐波推理”使模型接受同步思维与行动的无缝训练,在异步连续时序的感知与行动标记流之间建立谐波互锁 [5][6] - 架构原生支持不同机器人平台,已在6自由度、7自由度及16+自由度半人形机器人完成验证 [6] 规模化与扩展定律 - 在70亿参数临界点观察到相变,较小模型呈现固化态势,而更大模型持续提升,目前模型已扩展至100亿+参数规模 [6][11] - 模型展现出强扩展定律,更多预训练数据与算力持续且可预测地提升模型在多任务中的训后表现 [6][15] - 预训练数据规模与下游微调性能之间存在显著幂律关系,增加预训练数据能系统性地提升所有下游任务的模型性能 [15][16][18] 数据规模与演进 - 基于超27万小时真实世界异构操控数据进行预训练,该数据集正以每周1万小时的速度持续扩张且不断加速 [6][20] - 数据采集自全球数千个家庭、仓库及工作场所的多样化作业场景,由覆盖全球的硬件网络及数千台数据采集设备驱动 [20][22] - 正在构建史上规模最庞大、最多元的真实世界操作数据集,涵盖人类能设想的所有操作任务 [22]
姚顺宇离职背后:国产大模型已经上桌了
虎嗅· 2025-10-09 21:19
核心人事变动 - 清华物理系特奖得主姚顺宇于2025年9月离开Anthropic,加入Google DeepMind [1] - 其离职原因中40%为反对Anthropic将中国称为“敌对国家”的政策,60%源于无法公开的内部信息判断 [2] - 姚顺宇于2024年10月加入Anthropic,从量子计算研究转向人工智能,并参与了Claude模型从3.7版本提升至4.5版本的工作 [3] Anthropic的战略转向与融资 - Anthropic于2025年9月5日发布公告,立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务,并将中国等国称为“敌对国家” [7][8] - 在宣布“断供”前两天,公司完成130亿美元(约合人民币928亿元)F轮融资,投后估值达1830亿美元(约合人民币1.3万亿元),为半年前的三倍 [9] - 公司明确将企业级服务API销售作为主要收入来源,并在Claude 3.5推出后将商业重心迁移至AI编程,推出了独立产品Claude Code [15] 技术路径竞争与CEO立场 - Anthropic CEO达里奥·阿莫迪多次呼吁对华实施算力管控,并质疑DeepSeek-V3模型不可能以600万美元的低成本训练而成 [11] - 其立场源于DeepSeek在推理模型上的创新对Anthropic坚持的Scaling Law和预训练模型主导的技术路径构成了挑战 [12] - 以DeepSeek为代表采用的“蒸馏”技术,使大模型厂商能以更快速度、更低成本训练模型,Anthropic采取断供措施以维护其技术壁垒 [13][14] 中国市场替代机遇与竞争 - Anthropic“断供”后,中国科技巨头迅速行动,阿里、腾讯、字节跳动等公司推出的AI编程产品均集成了Claude等主流模型 [16] - 国内大模型厂商如阿里通义千问、DeepSeek和Kimi嗅到国产替代机会,Kimi在断供当天火速更新K2-0905模型,并宣布API限时半价以承接Claude用户 [21] - 智谱、商汤科技、京东云等公司为原Claude用户提供快速切换服务、免费体验Tokens及迁移方案,价格仅为Claude的七分之一,意图争夺市场份额 [23] 全球市场布局与行业动态 - 在疏远中国市场的同时,Anthropic宣布将于2026年在印度班加罗尔设立办事处,因印度已成为其Claude模型的第二大消费市场 [17] - AWS宣布在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1,标志着中国企业在全球AI角逐中已占据核心位置 [28][29] - 海外AI编程产品第一梯队主要为Anthropic的Claude与谷歌的Gemini,而中国企业的模型亦开始被海外平台如Perplexity考虑用于后训练 [16][26]
GPT-5 信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
36氪· 2025-08-07 18:12
发布会信息 - OpenAI将于北京时间明天凌晨1点召开发布会,时长为一小时,预计内容充实 [1] 员工激励 - OpenAI首席执行官宣布向所有员工发放两年期共计150万美元的奖金,包括新入职员工 [2][25] 产品版本与能力 - GPT-5将推出四个版本:标准版gpt-5专注于逻辑推理和多步骤任务、轻量版gpt-5-mini适用于成本敏感场景、高速版gpt-5-nano面向低延迟需求、对话版gpt-5-chat专为企业级复杂多模态交互设计 [4] - 模型在推理能力、代码质量和交互理解方面升级,需较少提示词完成复杂编程任务,并增强Agent能力 [5] - 访问权限分层:免费用户使用基础版本,Plus用户接入更强推理能力模型,Pro用户可访问面向复杂任务的GPT-5 Pro版本,Team账户拥有最全面权限 [5][8][9] - GPT-5 Pro被标注为仅向Pro用户开放,定义为“研究级智能”,是性能最强的高端版本 [8] 性能测试与案例 - 社区用户通过Copilot接入GPT-5,在SimpleBench推理测试中达到90%准确率(10题答对9题),需提示“进行推理”激活复杂思考 [10][12] - 模型可自动启用推理能力处理复杂问题 [13] - 案例包括生成结构清晰的GTA克隆游戏雏形、设计未来科技感网页按钮、用Three.js制作3D飞行模拟器(UI表现较差)、实现具备动画和交互功能的3D太阳系模型 [15][17][19] 技术细节与行业背景 - GPT-5采用统一模型架构,融合GPT系列与推理模型,具备智能路由系统动态调用子模型 [22] - 支持完整多模态能力,整合图像、文字、音频、视频的理解与生成,内容视觉和逻辑一致 [22] - 软件工程能力提升,可处理复杂企业级代码库,微软测试显示代码质量改进且计算资源消耗未显著增加 [22] - Agent能力升级,擅长多步骤复杂任务 [22] - 行业面临缩放定律收益减弱及高质量数据枯竭的挑战,OpenAI截至今年6月未确认哪个版本可称为GPT-5 [22][23] 公司动态 - OpenAI正筹备新一轮融资,估值可能达5000亿美元,并推进内部股权出售计划,允许员工出售价值数十亿美元股份 [25]