AGI
搜索文档
微软CEO纳德拉最新访谈:开源是对赢者通吃的最大制约
IPO早知道· 2025-02-25 10:39
微软量子计算突破 - 微软发布全球首款拓扑量子芯片Majorana 1,采用半导体砷化铟和超导体铝材料,基于全新"拓扑"物质状态构建[3][4] - 该芯片历时近20年研发,目标在2030年前上市并实现百万量子比特规模,被视为量子计算的"晶体管时刻"[3][15][16] - 技术突破在于验证了马约拉纳零能模在新物相中的存在,使量子信息可被可靠隐藏和测量[15][16] 量子计算战略布局 - 微软采用软硬件分离策略,同时与中性原子、离子阱团队合作开发多种量子计算机类型[17] - 计划2027-2029年推出容错量子计算机,预计可容纳百万物理量子比特和数千逻辑量子比特[17] - 量子计算将专注于化学物理、生物学等非数据密集型但需探索指数级状态空间的领域[17][18] AI与量子计算协同 - AI可作为"模拟器的模拟器",量子计算则作为"自然模拟器",两者结合可生成合成数据训练更优模型[18] - 量子计算不会取代经典计算,但能增强高性能计算能力,尤其在材料科学等领域的模拟应用[17][18] AI市场格局判断 - 超大规模云服务(如Azure)和模型层将共存,但AI市场不会形成赢者通吃格局,企业客户会要求多供应商并存[7][8] - 开源模型将制约闭源垄断,政府监管也将介入防止私营公司主导AI领域[7] 计算基础设施需求 - AI工作负载(如ChatGPT)推动计算需求指数级增长,训练和推理阶段均需大规模计算集群[6][9] - 全球分布式计算集群成为刚需,需就近部署存储与计算资源以突破"光速限制"[9] AGI经济影响标准 - AGI实现的真正标志是全球经济增长率达到10%(当前发达国家平均2%),而非技术基准炒作[10][20] - 若实现10%增长,全球年新增价值将达10万亿美元(基于100万亿美元全球经济规模)[10] 智能成本与普及 - 遵循"杰文斯悖论",智能成本下降将刺激需求弹性,尤其在发展中国家医疗等领域的应用[14] - 智能需同时提升能力并降低成本,类似云计算通过弹性付费模式扩展市场的历史路径[14] 技术投资方法论 - 公司选择进入TAM(潜在市场总量)大且能容纳多个赢家的赛道,避免押注赢者通吃领域[8] - 研发需平衡短期需求与长期相关性,保持对失败的高容忍度以探索未来技术[23] 认知劳动演变 - 当前认知劳动可能被自动化,但会催生更高层次的认知任务,形成动态平衡而非完全替代[23][24] - AI工具应作为人类认知增强器,例如开发具备长期记忆的会议协调代理提升决策效率[25] 材料科学革命愿景 - 量子计算+AI有望加速新材料研发,目标在25年内实现传统需250年完成的工业革命级突破[25]
印奇携新身份公开亮相:聚焦「AI+车」,一个产业的发展节奏有时比方向更重要
IPO早知道· 2025-02-24 22:33
印奇对AI+车前景的判断 - 印奇认为AI+车可能是AI+第一个落地的核心应用场景[2] - 车是通向具身智能的必要路径[3] - AI+车未来有可能是第一个落地的场景 其最重要的应用场景是智驾和智舱[4] 产业发展节奏与载体选择 - 一个产业的发展方向和节奏 节奏比方向更重要[3] - 需要在技术成熟的最后3年冲刺期 同时找到一个最核心的载体[3] - 这波大模型时代是AI创业者最幸福的时代 技术上最让人兴奋的是AGI 载体上可能就是车[3] AI+与+AI的区别及现状 - 过去十年+AI最重要的两个成功案例是特斯拉和抖音 是原有产业领军者用AI给产业做的巨大赋能[4] - AI+是AI大模型时代全新的应用 AI比重得超过50% 创造的价值是10倍的价值 但目前这样的应用还没有出现[4] 智驾领域发展预测 - 围绕智驾领域 未来3年进入收敛期 L3 L4逐步推广 这会是车生态智能化的开端[4] - 按篮球比赛来讲 可能是第一节刚打完[4] - 大模型在车上的Agent应用是非常有潜力和有希望的一个点[4] 千里科技合作动态 - 千里科技联合吉利汽车集团 阶跃星辰宣布将加强三方现有技术合作伙伴关系 推动AI+车的深度融合[4] - 通过AI大模型 端到端智驾 驾舱融合等技术的突破 智能汽车体验将实现从量变到质变的跨越[4] - 将在模型优化 产品定义和软硬件研发等领域全面合作 共同打造更安全 更舒适的智能出行体验[4]
晚点对话王小川丨不是文本创作、不是物理模型,AGI 的尽头是生命科学
晚点LatePost· 2025-02-10 17:50
公司战略与定位 - 百川智能聚焦医疗领域,认为医疗是大模型皇冠上的明珠,而非垂直场景,因医疗需求不会被超级模型覆盖[7][19] - 公司提出"造医生等价于AGI",将医生职业复杂度作为AGI标尺,计划2025年实现AI医生助理覆盖海淀居民[7][9][61] - 采取"水涨船高"策略而非"沿途下蛋",医疗场景天花板高,模型能力提升会持续增强应用价值[19] 技术路线与产品进展 - 发布首个全场景推理大模型Baichuan-M1-preview,具备复杂病症诊断能力,案例显示其诊断水平达市一级医院之上[6][12] - 医疗模型采用强化学习技术,2024年7月后明确医疗增强方向,计划2025年Q1推出超级医生模型并落地北京儿童医院[11][24][62] - 坚持语言是智能主轴的观点,认为多模态主要用于交互增强而非智力提升,技术重点在AI使用工具和制造工具的能力[69][75] 商业化与落地规划 - 已与北京儿童医院、海淀卫健委等机构合作,推出"一大四小"产品矩阵,涵盖居家至医院多场景[61][62] - 商业模式设计包含G端(政府)、H端(医院)和C端三层,AI辅助诊断已进入国家医保局服务项目立项指南[63] - 中国年就诊84亿人次,百度日健康搜索请求超5000万人,公司认为医疗具备超级应用潜力[48][49] 行业竞争与差异化 - 避开通用模型红海竞争,选择医疗赛道定位"在大厂射程之外",观察到百度腾讯等减少医疗投入[53][8] - 累计融资超50亿元但未大规模烧钱,被部分投资人评价为"最稳的大模型独角兽之一"[5][27] - 开源14B医疗增强模型促进产学研合作,医疗评测得分超过72B版本,可用消费级GPU部署[34] 创始人理念与长期愿景 - 创始人王小川从2000年基因测序研究起持续关注生命科学,提出"把生命变数学"的技术理想[5][39][30] - 认为AI将推动从科学时代到智能时代的范式迁移,医疗数据未来可支持生命科学研究突破[45][38] - 长期目标是实现"生物自由",通过AI医生解决医疗资源不可能三角,并推动新医学科研范式[87][100]
美国恢复中国小额包裹免税清关;软银拟投资OpenAI400亿美元;车企1月召回超300万辆车丨百亿美元公司动向
晚点LatePost· 2025-02-09 20:51
跨境电商政策调整 - 特朗普暂时撤销对中国低货值商品免税禁令,允许包裹关税豁免直至新系统建立[1] - 新政导致美国海关清关拥堵,Temu、Shein等平台被迫涨价或下架部分商品[1] - 物流服务商云途、燕文取消报关手续费与预收保证金[1] OpenAI融资与估值 - 软银拟400亿美元投资OpenAI,投后估值达3000亿美元,较去年1570亿美元增长91%[2] - 部分资金用于"星际之门"项目,总投资额或达5000亿美元[2] 汽车行业召回事件 - 1月15家车企召回353.7万辆车,创单月新高[3] - 本田召回136.7万辆涉及HR-V等车型,特斯拉召回33.6万辆因后视摄像头故障[3] - 小米、方程豹、通用五菱分别召回3.1万/6843/1116辆车[3] AI技术发展动态 - OpenAI CEO称GPT-5将超越人类智力水平[4][5] - 东风、上汽智己等四家车企宣布接入DeepSeek模型[10] 企业资本运作 - Shein拟伦敦IPO估值下调至500亿美元,较2023年融资估值缩水25%[7] - 雷诺寻求出售所持日产36%股份,富士康为潜在买家[9] 零售与消费行业 - 百果园2024年预计亏损3.5-4亿元,关店965家至5116家,加盟店单店营收下降14%[8] - Coach四季度收入增长10%至17亿美元,新增客户中超半数为年轻群体[13] 房地产政策 - 重庆取消执行7年的住房限售政策,核心区域房价同比下跌20%[11] 科技与社交媒体 - TikTok为美国用户提供Android安装包下载,特朗普或推动主权财富基金收购[6] 服饰行业业绩 - 加拿大鹅四季度营收下降2.2%至6.08亿加元,下调年度利润预期[12]
晚点独家丨字节启动 Seed Edge,加码 AGI 研究
晚点LatePost· 2025-01-23 08:47
字节跳动AGI研究布局 - 公司设立代号"Seed Edge"的AGI前沿研究项目,拟定5大长期研究方向[2] - 研究方向包括下一代推理、感知、软硬一体模型设计、下一代范式及Scaling方向[6][10] - 项目以虚拟项目组形式运行,探索不确定性强的课题[7] - 创始人张一鸣深度参与AI研究,亲自研读论文并与顶尖学者交流[4] - 新加坡团队协助技术研究规划,包括前国立大学教授冯佳时[4] 技术研发成果 - 豆包1.5 Pro模型实现7倍性能杠杆,激活参数量仅为稠密模型1/7[8] - 自主数据生产体系不使用其他模型数据,确保独立性[8] - 豆包App日活突破千万级,成为中国最大大模型应用[8] - 2024年发布100+AI论文,NeurIPS入选近50篇[8][11] - SuperClass论文提出节省50%显存、响应提速20%的视觉预训练方法[11] 人才战略 - 组建Seed团队聚集高水平研究员,来源包括顶尖院校毕业生和行业专家[13][14][20] - 启动Top Seed计划招募30名应届博士[14] - 实施宽松考核机制:延长考核周期,突破后补偿历史绩效[15] - 中国AI领域人才密度最高,吸引MiniMax等公司核心人才[13] 行业定位与战略 - 从工程能力优势转向原创式创新,探索智能边界[3] - 目标不仅是跟进领先模型,更要做下一代突破[8] - 大公司具备投入前沿技术创新的资源优势[21] - 学习调整研发节奏,容忍长期不确定性[22] - 研究深度广度超出外界认知,论文数量接近Google(120篇)、微软(100篇)水平[9][11] 技术争议与验证 - 提出与OpenAI相反的结论:视频生成模型无法提炼物理规则[11] - 获得图灵奖得主杨立昆对研究成果的正面评价[11] - 在CLIP替代方案等基础问题上取得突破[11]
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
晚点LatePost· 2025-01-22 21:56
模型能力与用户规模关系 - 更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型 [5] - 字节跳动发布 Doubao-1.5-pro 模型技术报告,提到通过用户数据飞轮持续提升模型实际使用体验 [5] - 行业误区认为更好的智能水平依赖更多用户,但实际并非如此 [7] MiniMax 公司概况 - MiniMax 的 AI 社区产品 Talkie 最新月活用户数已超 Character.ai,成为同类产品全球第一 [6] - 中国 AI 社区产品 "星野" 用户数、使用时长和留存率均为第一,高于字节旗下同类产品 [6] - 视频生成平台海螺 AI 是全球访问量最高的视频生成网站 [6] 技术驱动与开源策略 - MiniMax 开源新模型系列以加速技术迭代和加强技术品牌 [7] - 明确公司为技术驱动,追求模型能力上限提升而非依赖用户规模 [7] - 模型架构改进:将传统 Transformer 的非线性注意机制改为线性注意力机制,提升 long-context 处理能力 [29] Agent 与多模态发展 - Agent 需在专业领域达到专业人士水平,处理复杂任务 [25] - 多模态能力在 OpenAI AGI 路线图中占据重要位置 [39] - AI 编程助手 Cursor 的成功并非基于特定方向模型 [41] 市场竞争与公司定位 - 大模型竞争与移动互联网逻辑不同,更多人意识到这一差异 [01:11:19] - 未考虑被字节收购,公司目标非出售而是技术突破 [01:12:29] - 大厂投入和竞争激烈程度在预料之中 [01:16:28] 团队管理与 CEO 反思 - 公司需要两种人才:技术能力强和认知能力突出 [01:23:24] - CEO 决策关键在于组织有共同标准,而非个人决策 [01:26:56] - 去年反思最多的问题是认知能力提升速度不足 [01:32:08] 产品与用户洞察 - Talkie 和星野的领先优势源于更懂用户需求 [01:06:48] - 海螺文本的失利因未坚持技术驱动策略 [01:04:44] - 市场可同时容纳模型和应用公司,无需非此即彼 [01:01:38]
晚点播客丨李开复聊零一万物调整:只有大厂能追逐超大模型
晚点LatePost· 2025-01-14 17:35
文丨程曼祺 ▲扫描上图二维码可收听《晚点聊 LateTalk》第 98 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 不再追求 AGI,他第一个讲了出来。 上周初开始,市场陆续出现有关零一万物的新调整传闻,关键词包括:"放弃预训练,资金链紧张、被阿里收购……" 传 闻出现的第二天,我们在零一万物办公地,中关村鼎好大厦,采访了李开复。 他解释了实际发生的变化:零一万物已经和阿里云成立了 "产业大模型联合实验室",零一万物的大部分训练和 AI Infra 团队会加入这个实验室,成为阿里的员工,侧重超大模型研发等。零一自己接下来会聚焦做更快、更便宜、更小,更能 支持普惠应用的模型,同时自己做应用。 在李开复的描述里,超大模型和更快、更便宜、更小的模型的关系类似于 "老师和学生",超大模型可以通过标注结果和 生成更多合成数据的方式帮更小的模型提升性能。 去年 5 月,我们也访谈过一次李开复,当时的话题是从中国 "最年长的 AI 大模型创业者" 开始的,在 2023 ...
AI 一年过山车:从狂想到放下幻想丨晚点回望 2024 ⑤
晚点LatePost· 2025-01-13 19:40
文章核心观点 - 2024年AI行业经历了从年初对技术突破的乐观预期,到年底技术进展放缓、竞争格局剧变的剧烈调整 [4][6] - 技术扩散速度超乎想象,OpenAI等领先者不再能甩开对手,模型“保鲜期”变短,头部模型差距缩小 [110][111][114] - 行业竞争从纯粹的技术模型竞赛,转向依赖价格战、应用矩阵和算力资源的综合实力比拼,大公司开始掌握主动权 [4][27][125] - 当OpenAI不再技惊全场,正是技术扩散的开始;当AI不再被广泛讨论,才是其真正融入和改造生活的标志 [131] 2024年AI行业关键发展脉络 年初的乐观与技术风向 - 2024年初,OpenAI发布视频生成模型Sora,重演了ChatGPT上线时的震撼,确立了多模态竞争的新风向 [3][7][9] - 中国市场上,阿里巴巴在年初连续投资月之暗面、MiniMax等大模型公司,总额近15亿美元,创造了“阿里轮”,显著改变了创业公司的身位 [3][13][19] - 信仰充沛的年初,行业普遍预测视频生成模型将在当年变得实用,并拓展了AGI是普通人每日使用产品的愿景 [9][12] 技术进展放缓与“撞墙”讨论 - 到了年底,大部分乐观期望落空,Sora延期10个月发布,实际效果不如年初演示,GPT-5至今仍未发布 [4] - OpenAI投入可能超过10亿美元训练GPT-5,但性能提升有限,引发大模型性能提升“撞墙”的讨论,互联网公开优质数据耗尽成为瓶颈 [38] - 模型暴露出基础逻辑推理的缺陷,例如难以判断“9.11和9.9谁大”这类简单问题 [40] 价格战与成本下降 - OpenAI发布GPT-4o开启了模型“性价比”优化方向,其API价格比GPT-4-Turbo便宜了一半 [21][22] - 中国公司DeepSeek打响国内价格战,DeepSeek-V2价格仅为GPT-4o的1/36,随后字节、阿里、百度、腾讯全部跟进降价 [25][26] - 大模型推理成本在过去三年降低了1000倍,训练成本也在下降,例如DeepSeek-V3参数达6710亿,仅用了2024张H800 [27] - 模型降价是应用繁荣的前提,类似历史上网费下降推动互联网普及 [27] 算力军备竞赛与芯片竞争 - 英伟达在AI芯片市场占据主导地位,其数据中心业务在2024年Q1的收入和净利润同比涨了4倍和6倍,市值一度超过微软达到3.34万亿美元 [27][28] - 苦于英伟达的高占有率(达97.7%),Google、亚马逊、Meta、苹果等大公司加速自研AI芯片,博通作为设计支持方市值也突破万亿美元 [29][30][31] - 中美算力竞争是另一主题,寒武纪市值从562亿元增长至2747亿元,涨幅超400%,反映了在中国芯片限制下的国产替代预期 [32][37] - 全球科技巨头持续加大算力投入,2024年前三季度,微软、Meta、Google、亚马逊总计在AI算力中心上投入1250亿美元 [54] - 中国公司采购积极,字节跳动和腾讯2024年分别订购了约23万枚H系列GPU,超过Meta、特斯拉等国际公司 [55] 资本聚焦与创业公司收缩 - 2024年全球大模型公司在一级市场筹集560亿美元,其中OpenAI、Anthropic、xAI三家融资额就占近一半 [46] - 美国公司拿走了近9成投资,中国公司中仅月之暗面在单轮融资中获得10亿美元及以上 [47] - 创业公司进入收缩状态,海外如Inflection、Character.ai,中国如零一万物,纷纷将团队出售或并入大公司 [124] - 行业共识转向:创业公司与大厂比拼烧钱训练超大模型难以成功,竞争更依赖资源,进入大厂更擅长的战场 [125] 应用探索与挑战 - 编程成为AI落地最成熟的场景之一,大模型提供了近乎完美的试验场,OpenAI的o3模型写代码能力已排进人类程序员Top 200 [67][68][69] - 普通人对AI的使用仍处于探索期,Slack调查显示超1/3员工已在工作中用AI,但近一半人不愿告诉领导,且产品同质化严重(如出现626个“AI科比”分身) [74][76][77] - AI技术被灰黑产业滥用,2024年用Deepfakes技术欺骗身份验证系统的尝试增长了3000%,韩国一起案件涉及近23万人群组,前10个月抓获474名相关犯罪嫌疑人 [5][81] 硬件尝试与机器人概念 - 2024年卖得好的AI硬件热销并非主要因为AI功能,如Ray-Ban Meta眼镜15个月卖出200万副,主要靠经典造型和渠道 [90][91] - 更“AI原生”的硬件处境艰难,如AI Pin总销量约1万台,且退货量超过新增销量,其母公司寻求出售 [94] - 人形机器人仍处概念和炒作阶段,特斯拉Optimus量产时间数次延后,但A股供应链个股被热炒,部分公司4个月涨幅超过英伟达全年 [96][100] 开源进展与中国模型崛起 - 中国开源大模型在2024年取得显著进展,在Chatbot Arena排名中,全球前6的开源模型里中国模型从1个增长到3.5个 [105] - DeepSeek-V3在多项评测中超越了Qwen 2.5-72B和Llama-3.1-405B等开源模型,其训练成本仅为557.6万美元,是效果相似美国模型的十分之一 [110] - 开源与闭源模型的差距在缩小,两者在Chatbot Arena上的评分分差从1月的99分缩小至12月的58分 [110] 技术扩散与竞争格局固化 - 模型技术扩散速度超乎想象,试图通过模型本身建立通用场景壁垒已几乎不可能 [123] - 年初最强的GPT-4模型,年底在Chatbot Arena的排名已滑落到第42位,新模型“保鲜期”变短 [110] - 头部模型差距显著缩小,第1名与第15名的分差从年初的143分缩窄至年底的75分 [114] - OpenAI高层在2024年几乎换血一遍,核心员工流向直接推动了其大模型技术扩散 [119]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
第三个万亿美元芯片公司;肯德基中国两年来首次涨价;特朗普在硅谷招了批顾问丨百亿美元公司动向
晚点LatePost· 2024-12-25 20:17
博通市值突破万亿美元 - 博通市值突破万亿美元,主要得益于AI业务收入增长220%至122亿美元 [1] - 博通与英伟达同为AI算力投资受益者,但商业模式不同:英伟达出售GPU,博通提供自研AI芯片方案 [1] - 博通正在为Google、Meta、苹果、字节跳动等公司开发AI芯片,尽管字节跳动否认合作 [1] - 今年以来博通市值上涨128%,英伟达上涨182% [1] - 博通CEO透露客户正在规划未来3-5年AI基础设施投资,预计2027年将出现百万AI芯片集群 [1] 特朗普组建科技行业班底 - 特朗普任命a16z管理合伙人Scott Kupor为人事管理局局长,负责政府招聘工作 [2] - a16z普通合伙人Sriram Krishnan被任命为白宫科技政策办公室AI高级政策顾问 [2] - 其他科技行业任命包括:PayPal联合创始人Ken Howery任驻丹麦大使,Scale AI董事总经理Michael Kratsios任白宫科技政策办公室主任,Uber前首席商务官Emil Michael任研究和工程副部长 [2] - 此前特朗普团队已吸纳多位科技高管,包括马斯克密友David Sacks [2] OpenAI模型测试争议 - OpenAI的o3模型在ARC-AGI测试中得分87.5%,较9月o1模型的32%大幅提升 [3] - 测试前o3使用了75%的ARC-AGI公开数据集训练,而其他模型未采用此方法 [4] - OpenAI CEO称未对o3做特殊处理,引发AGI进展讨论 [3] 微软减少对OpenAI依赖 - 微软尝试用自研和第三方大模型驱动365 Copilot,以降低对OpenAI依赖和成本 [5] - 2023年3月微软曾以使用GPT-4作为365 Copilot卖点,但一年半来OpenAI基础模型性能提升有限 [5] - 在某些特定任务如文档总结中,低成本模型表现不逊于OpenAI [5] 餐饮行业动态 - 肯德基中国两年来首次涨价,平均涨幅2%(0.5-2元),优惠套餐维持原价 [6] - 星巴克美国罢工扩大至300多家门店、5000多名员工,因工资谈判分歧(星巴克提议未来几年加薪1.5%被拒) [7] - 库迪咖啡暂停"店中店"招商,该模式曾计划与美宜佳、华莱士等合作,目标2025年5万家门店(目前8170家) [8] 科技与出行行业 - 滴滴上线拉黑异味车功能,用户可12个月内拒乘该车,对差评率高司机采取降分或暂停服务措施 [9] - 菜鸟CFO刘政加入蚂蚁集团将任CFO,曾主导菜鸟IPO筹备工作 [10] - 小红书上线AI搜索产品"点点",基于笔记内容和公开信息提供生活场景答案,日均搜索量达6亿次 [11] 新能源与汽车行业 - 特斯拉上海储能工厂7个月建成,规划年产1万台Megapack(40GWh),2025年Q1投产 [12] - 宁德时代发布电池底盘一体化技术"磐石",称能在120km/h碰撞后保证电池安全,阿维塔将采用该技术 [13][14][15] - 丰田计划在上海新建雷克萨斯电动车工厂,预计2027年运营(官方称非官方消息) [16] - 北汽新能源获宁德时代等81.5亿元增资,与华为合作推出享界S9(起售价40万元) [16]