Workflow
AGI
icon
搜索文档
前沿科技双周谈系列9:OPENAI或突破IMO,AGI打开算力想象空间
招商证券· 2025-07-20 19:23
报告行业投资评级 未提及 报告的核心观点 - OpenAI研究员宣布其团队开发的最新实验性内部推理模型在IMO2025中取得相当于人类金牌选手的成绩,且GPT - 5即将发布,谷歌alphaproof是细分模型,openai是通用模型采用"强化学习"+test time scaling [1] - AI实现从"感知"到"推理"的质变,核心能力从模式匹配到创造性推理,符号推理与规划能力有突破性进展,为AGI发展提供核心能力佐证 [2] - AGI或将打开算力TAM,从局限于部分环节扩展至多行业规模场景,算力FOMO带动Capex,全球AI算力军备竞赛进入深水区,建议关注光模块等环节及相关技术和公司 [4][8][9] 根据相关目录分别进行总结 事件 - OpenAI研究员宣布团队开发的最新实验性内部推理模型在IMO2025中取得相当于人类金牌选手的成绩,还透露GPT - 5即将发布,谷歌alphaproof是针对数学推理的细分模型,openai是通用模型采用"强化学习"+test time scaling [1] 评论 - AI核心能力从模式匹配到创造性推理,实现从"识别分类"向"深度认知"转型,符号推理与规划能力有突破性进展,首次融合神经网络"直觉"与符号推理"严谨性" [2] - IMO表现突破印证AI从"专用智能"向"通用推理能力"演进,为AGI发展提供核心能力佐证,当前处于弱人工智能阶段,通用人工智能有通用性等核心特征 [2][3] 分析 - AGI或将打开算力TAM,Narrow AI局限于部分环节提高信息处理效率,AGI扩展至多行业规模场景 [4] - 算力FOMO带动Capex,全球AI算力军备竞赛进入深水区,Meta、xAI、OpenAI + 微软、Google等有相关项目和投资 [8][9] 投资建议 - "AI算力军备竞赛"带来增量需求,建议关注光模块、PCB、光芯片等环节 [9] - 新技术需求或将加速落地兑现,建议关注DCI、AOC、空芯等在大规模集群的快速爬坡及相关公司 [9]
刚刚,OpenAI神秘新模型斩获IMO 2025金牌!攻克奥数巅峰,硅谷沸腾
猿大侠· 2025-07-20 12:20
转自:新智元 编辑:编辑部 【导读】 OpenAI的神秘通用推理模型,竟然攻克IMO 2025的5道难题,成功摘金了?这个消息,让Greg Brockman等一众大佬激动转发。 也就是 说,OpenAI很可能已经研发出颠覆性的推理技术,彻底告别CoT。还有一个炸裂消息:GPT-5也要来了。 就在昨天,全世界的顶尖大模型还在2025年的IMO赛场上全军覆没,连铜牌的边都没摸到。 然而,就在刚刚,OpenAI 投下了一枚重磅炸弹——他们用一款全新的「通用推理模型」,成功夺下了IMO 2025的金牌! 6道题,解出5道,狂揽35分! 要知道,此前表现最好的Gemini 2.5 Pro,也只得了 13分 。 联创Greg Brockman、负责人Alexander Wei,以及OpenAI的各路研究员,纷纷在推上激动宣布了这一里程碑式的成就! 对此,德扑之父Noam Brown表示,这个成绩的意义甚至超越了「AI攻克IMO」本身。 消息一出,整个硅谷为之沸腾! 人们纷纷猜测,OpenAI这次很可能祭出了一种 颠覆性的推理技术 ,彻底告别了传统的CoT思维链。 这,不仅仅是一个模型的胜利,更是一个全新时代的开端! 更令 ...
领悦南京升级为宝马集团“全球信息技术研发中心”,并成立新公司;总投资50亿元,立讯机器人总部基地项目在常熟开工丨智能制造日报
创业邦· 2025-07-20 11:07
宝马信息技术研发中心升级 - 华晨宝马与南京市建邺区签署协议设立全资子公司"宝马(南京)信息技术有限公司",原领悦南京分公司将独立运营 [1] - 该公司将成为宝马集团全球六大信息技术研发中心之一,也是中国首个且唯一的信息技术研发中心 [1] 一汽旗新动力科技公司成立 - 一汽旗新动力(长春)科技有限公司正式成立,为中国一汽全资子公司 [1] - 产品主要匹配红旗、奔腾车型发动机、变速箱、新能源动力电池电驱等,致力于打造行业领先的新能源动力总成科技公司 [1] 立讯机器人总部基地项目 - 立讯机器人总部基地项目在常熟开工,总投资50亿元 [1] - 计划2024年底竣工投产,达产后可实现年产值100亿元 [1] 康宁公司反垄断调查结果 - 欧盟委员会接受康宁公司承诺,以避免潜在反垄断罚款 [1] - 康宁将取消与设备制造商及原玻璃加工商现有协议中所有独家采购条款,并不限制采购比例 [2] - 欧盟认为这些承诺将解决初步评估中发现的反垄断担忧 [2]
Grok 4遥遥领先,但马斯克想要得更多
搜狐财经· 2025-07-19 21:37
Grok4技术能力 - Grok4发布两个版本:单代理Grok4和多代理Grok4 Heavy,后者支持四个代理同时工作[3] - 在SAT、GRE考试中取得近乎完美成绩,在HLE测试中得分超过Gemini2.5 Pro和o3,Grok4 Heavy版本突破40%[3] - 多语言支持全面,尤其在英语和编码混合任务中领先Kimi,科研场景中深度思考能力更可靠[3] - 图像理解和生成能力仍逊于OpenAI、Anthropic等对手[6] xAI财务状况 - 每月支出高达10亿美元,2024年总支出预计130亿美元,营收仅5亿美元[7] - 2026年营收或增至20亿美元,但仍难覆盖成本缺口[7] - 计划打造配备100万个英伟达Blackwell GPU的超级计算机,预计耗资50-625亿美元[10] - 采用合成数据训练,成本远高于同行,训练数据集总量约4万亿tokens[10] 市场竞争格局 - 大模型发展从"规模竞赛"转向"效率与场景深耕",Claude4代码生成能力领先,Gemini2.5 Pro支持200万token上下文[13] - OpenAI将发布GPT-5,微软、亚马逊、谷歌和Meta四大巨头2025年AI投资计划高达3200亿美元[15] - xAI向投资者承诺2027年实现盈利,摩根士丹利预测2029年收入或突破130亿美元[17] 战略布局 - 通过收购X获得数据资源和算力共享优势,省去外部数据采购成本[16] - 采取"烧钱换领先"战略,试图通过大规模融资和硬件投资超越竞争对手[10] - 计划通过推高估值缓解资金压力,即将启动第三次大规模融资目标估值2000亿美元[11] 技术争议 - 合成数据训练可能导致幻觉过高和"以讹传讹"问题[11] - Grok在思维链中明确考虑马斯克观点,存在倾向性争议[11] - 模型跳票引发能力质疑,Grok3.5最终跳过直接发布Grok4[14]
在OpenAI上班有多卷?离职员工爆料:7周打造Codex,每天熬到凌晨
机器之心· 2025-07-19 13:52
公司文化与组织管理 - 公司内部沟通主要依赖Slack而非邮件,员工一年仅收到约10封邮件[18] - 采用自下而上的研究文化,初期无季度计划,研究进展通过试错推进[19] - 领导晋升机制注重实际能力而非表面功夫,优秀想法和执行是关键[20] - 团队风格差异显著,研究、应用和市场团队工作节奏完全不同[17] - 公司规模从1000人快速扩张至3000人,工龄1年员工可排进前30%[15] 产品开发与创新机制 - 鼓励"行动为先"文化,员工可自发启动项目无需请示,Codex发布前存在3-4个并行原型[21] - 研究员被视作"小型CEO",自主寻找问题并验证想法[22] - 战略调整迅速,3000人规模仍保持高效决策能力[25] - Codex从首行代码到发布仅用7周,团队每日工作至深夜[48] - 产品发布后53天内生成63万个公开PR,平均每位工程师贡献7.8万个[53] 技术架构与基础设施 - 采用超大单体Python代码库,风格多样但缺乏统一规范[39] - 全部服务运行于Azure平台,主要依赖Kubernetes/CosmosDB/BlobStore[40] - 基础设施呈现早期Meta特征,自研类似TAO的图数据库[41] - 代码库存在重复问题,如队列管理库有5-6个不同版本[43] - 后端单体服务存在持续集成问题,测试用例常需运行半小时[44] 行业竞争与市场定位 - 公司同时在API、深度研究、硬件、编码代理等多领域展开竞争[33] - AGI领域形成OpenAI、Anthropic、谷歌三强争霸格局[56] - 产品设计侧重个人用户视角,Pro订阅是核心衡量指标[57] - 模型训练经历从实验到工程的转化过程,需处理分布式系统问题[57] - GPU成本远超其他开支,Codex单个功能成本等同Segment整体基础设施[32] 安全与保密机制 - 高度重视实际风险如仇恨言论、生物武器等,而非理论风险[30] - 内部信息严格保密,Slack工作区实施权限分级管理[25] - 产品服务数亿用户涉及医疗/心理咨询等敏感场景[26] - 媒体高度关注导致未发布功能常遭提前泄露[25] - 安全团队重点解决提示注入等实操性问题[30] 人才与团队动态 - 团队流动性高,可快速调配ChatGPT工程师支援其他项目[35] - 高管深度参与日常讨论,包括Greg Brockman等均在Slack活跃[36] - 工程团队吸引大量Meta人才,带来基础设施经验[41] - Codex团队由8工程师+4研究员+2设计师组成,高度自治[51] - 新员工周边产品采用限量发售模式,首次发售导致Shopify崩溃[31]
杨植麟摸着DeepSeek过河
36氪· 2025-07-19 12:30
模型性能与技术突破 - Kimi K2是一款万亿参数MoE模型,包含1T总参数和32B激活参数,推出Kimi-Base和Kimi-instruct两个版本[1] - 在编程、智能体任务上表现突出,测评显示其自主编程、工具调用和数学推理能力超越开源模型DeepSeek-V3和阿里Qwen3[1] - 采用新型优化器Muon替代AdamW,算力需求降低至52%,实现万亿参数规模训练突破[13] 市场反响与开发者生态 - 开源一周Hugging Face下载量超10万,LMSYS竞技场排名第四,OpenRouter趋势榜全球第二[1][4] - API定价显著低于竞品,输入/输出tokens成本较Claude 4 Sonnet下降75%,推动AI编程普及[10] - 社区运营策略创新,通过工程师直接互动引发"自来水"传播,获Hugging Face联合创始人公开赞赏[4][17] 战略定位与行业影响 - 明确聚焦Agentic AI赛道,优化工具调用速度和任务完成质量,支持PPT/Excel/3D建模等场景[7][8] - 被《Nature》评价为"又一个DeepSeek时刻",验证其技术路线影响力[6] - 国内大模型初创分化明显,公司选择类似Anthropic的技术路径,与Minimax多模态、智谱ToB路线形成差异[16] 产品商业化表现 - Web端访问量6月环比增长30%,显示技术突破对产品反哺效应[20] - Cursor等AI编程公司ARR两个月增长60%至5亿美元,显示赛道爆发潜力[10] - 放弃C端投流转向模型研发,反映行业从用户增长向技术突破的范式转变[15][16] 技术应用案例 - 可快速生成3D场景(如昼夜变化山脉)和专业数据分析报告(含箱线图、回归模型等)[9] - 支持接入Owl/Cline等框架实现自主编程,处理13万行数据生成可视化分析[8][9]
阿里巴巴-W(09988.HK):业务重知 价值重判
格隆汇· 2025-07-19 10:21
公司战略与架构调整 - 公司将淘天集团和阿里国际数字商业集团整合为阿里电商事业群 由蒋凡担任CEO 电商和云两大业务由两位核心管理者专注经营 目标明确 资源集中 [1] - 公司战略聚焦电商和云 新架构下目标更加明确 [1] 电商业务表现与策略 - 2025年618第一周期数据显示抖音电商 拼多多等平台增速呈放缓趋势 淘天集团通过佣金返现 AI提效 会员分层等策略支持核心商家及用户的增长 有望在当前规模上重拾增长 [1] - 市场认为国内电商平台顺位可能发生变动 但电商行业竞争趋缓 淘天业务稳中求进 [1] - AI技术在淘宝天猫的应用已渗透到商家运营 用户体验 内容创作等多个环节 成为提升效率和体验的核心驱动力 [2] 云计算业务竞争力 - 阿里云通过全栈自研技术 全球部署的算力资源 丰富的客户积累与集团电商业务锤炼出的安全性构建竞争壁垒 [1] - 阿里系资金大量投资AI相关公司 以云投结合的方式增强阿里云的市占率 并于24H1在国内GEN AI IAAS市场份额超越火山引擎位列第一 [1] - 云+模型的组合将具有更强的客户黏性 [2] AI技术发展与应用 - 公司明确以实现AGI为目标 自2023年推出通义千问 其产品开发与迭代持续加速 并逐步形成全尺寸 全行业 多模态覆盖的模型家族 [2] - 先进的大模型有望吸引新的客户和业务机会 [2] - 以夸克为代表的创新业务有望为公司带来新一代的用户端口 [2] 财务预测与估值 - 预计公司FY2026-2028年归母净利润分别为1451/1626/1839亿元 同比增速分别为11 5%/12 1%/13 1% [2] - 2025年7月17日股价对应的PE分别为13/12/11倍 [2] - 可比电商公司2025年PE在7-13倍 云计算公司PS在3-14倍 [2]
梁文锋等来及时雨
是说芯语· 2025-07-19 09:26
行业竞争格局 - 国内大模型行业进入密集更新期,Kimi、阶跃星辰、智谱AI、科大讯飞等玩家将在7月底集中发布新一代基础大模型 [3] - DeepSeek自4月起月活用户持续下滑,5月MAU为1.69亿(环比-5.1%),官网访问量下降29%,使用率从7.5%峰值回落至3% [3][4][18] - 第三方平台托管的DeepSeek模型使用量逆势增长20倍,形成与官方流量下滑的反差 [13] 技术发展动态 - Kimi K2成为国内首个万亿参数MoE架构开源模型,在代码/数学推理任务反超DeepSeek,支持128K上下文窗口 [10][15] - MiniMax-M1以53.47万美元低成本完成训练(512块H800三周),对比DeepSeek V3训练成本557万美元(2048块H800) [11] - 行业普遍提升上下文窗口能力(MiniMax达100万token),而DeepSeek保持64K最小窗口的保守策略 [15] 商业模式对比 - 科技大厂通过低价API争夺市场:百度李彦宏公开批评DeepSeek"慢且贵",阿里/字节/百度等推出更低价模型 [10] - Kimi K2定价与DeepSeek标准时段对齐(输入4元/百万tokens,输出16元/百万tokens) [11] - DeepSeek坚持开源路线但面临商业化压力,需平衡开发者生态与产品使用率 [17] 供应链挑战 - 英伟达H20芯片禁售导致DeepSeek R2模型延迟发布,算力储备出现紧缺 [5][7] - 7月15日英伟达获准重新销售H20芯片,将缓解DeepSeek算力瓶颈 [7] - H20芯片因DeepSeek的低成本训练方法在中国需求激增,引发4月美国出口管制 [5] 产品能力短板 - DeepSeek暂不支持多模态功能(语音/图片/视频生成),成为主流AI助手中唯一缺失该能力的产品 [19] - 调用工具能力不足:字节测试发现其工具调用表现不理想,最终改用自研模型 [19] - 小版本更新策略(如DeepSeek-R1-0528仍基于2024年V3 Base模型)导致竞争力下降 [8][10] 国际对标差异 - OpenAI通过高频更新保持领先(GPT 4.1系列发布后份额达10%),而DeepSeek R1仅持平o1水平 [17][18] - DeepSeek缺乏OpenAI的代际优势,使用率从7%峰值降至3%(跌幅超50%) [18] - 行业普遍学习OpenAI的快速迭代策略,如奥特曼每周更新产品的运营方法 [17]
阿里巴巴-W(09988):重拾系列报告(一):业务重知,价值重判
华源证券· 2025-07-18 16:49
报告公司投资评级 - 华源证券首次覆盖阿里巴巴-W,给予“买入”评级 [5][7][134] 报告的核心观点 - 公司战略聚焦电商和云,新架构下目标更加明确,电商和云两大业务由核心管理者专注经营,资源集中 [6] - 电商行业竞争趋缓,淘天业务通过多种策略支持核心商家及用户增长,有望重拾增长 [6] - 阿里云综合实力领先,云投结合有望率先享受AI需求红利,通过多种优势构建竞争壁垒 [6] - 公司以实现AGI为目标,通义模型持续突破技术边界,吸引新客户和业务机会 [6] - 公司内外部双向AI创新,AI技术在电商业务多环节应用,外部创新业务带来新用户端口 [6] 根据相关目录分别进行总结 战略聚焦云和电商,AI全面重塑增长曲线 - 管理架构调整,公司保持“1+6+N”体系,聚焦电商和云,2024年11月整合电商业务,由蒋凡任CEO [15] - 2021 - 2025年公司从多元化治理转向战略聚焦,历经三大阶段,最终树立电商与云计算双核驱动策略,投入超3800亿建设云和AI硬件基础设施 [18][19][20] - 战略聚焦初见成效,2025年1 - 3月营收同比增长7%,非公认会计准则净利润同比增长22%,核心电商货币化率提升,阿里云收入增长加速 [22][26][30] 核心电商稳步找回增长动能 - 行业竞争趋缓,电商规模持续扩大,2025年618第一周期淘天市场份额回升,各平台增速放缓,未来竞争或趋缓 [36][39] - 淘宝通过“商品丰富度×用户规模×生态创新”构建竞争力,2025年一季度推出商家扶持政策,促进业绩增长 [42][46] - 全站推广是智能推广工具,2025年功能升级,有望提升商家认可度,长期助推淘天货币化率 [48][51] 云业务领跑行业,“AI+云”带动增长 - 云计算市场保持增长,2023年中国云计算整体市场规模达6165亿元,阿里云在公有云IaaS和PaaS市场均占25%左右份额 [53][62] - 阿里云通过技术、资源、客户与安全性构建竞争壁垒,技术上自主研发操作系统并持续迭代,资源上有资金和基础设施优势,客户与生态上有黏性和规模效应 [66][70][72] - 阿里云性价比突出,为AI开发提供全方位服务,2023年以来阿里系大量投资AI相关公司,云投结合增强其市占率,24H1在国内GEN AI IAAS市场份额超越火山引擎位列第一 [79][80][82] - 阿里云营收增长提速,2024年开始逐季加快,利润端经调整EBITA margin保持向上势头,未来利润率有望继续提升,对比AWS盈利能力有上行空间 [84][85][91] 以实现AGI为首要目标,不断突破技术边界 - 通义千问快速迭代,自2023年推出后持续加速开发与迭代,形成全尺寸、全行业、多模态覆盖的模型家族,2025年保持高频更新 [95] - 通义技术领先,其技术布局使阿里云转型为AI生态运营商,形成“模型研发 - 开源推广 - 云服务变现 - 生态反哺”闭环,产品矩阵构建多方面竞争优势 [99] - AI技术深度融入电商业务,在商家运营、用户体验、内容创作等多环节应用,提升效率和体验 [106] 在AI时代全力打造新用户端口 - 夸克以智能搜索为核心,延伸个人AI全能助手,定位“年轻人的AI全能助手”,用户月活峰值超2亿,满足年轻用户需求 [120] - 夸克从智能搜索和个人云业务切入,所在市场包括搜索和网盘领域,正通过技术迭代等增强AI产品实用性,有望打造新流量入口 [121][122] - 夸克商业模式主要为订阅制,收入来自会员订阅及增值服务,2025年持续丰富AI产品功能 [123][125] 盈利预测与评级 - 预计FY2026 - 2028年实现营收10115/11284/12573亿元,同比增长1.5%/11.6%/11.4%,归母净利润1451/1626/1839亿元,同比增长11.5%/12.1%/13.1% [128] - 考虑公司聚焦电商与云且业务领先,可比电商公司2025年PE在7 - 13倍,云计算公司2025年PS在3 - 14倍,首次覆盖给予“买入”评级 [134]
黄仁勋北京交流会实录
投资界· 2025-07-18 15:19
英伟达CEO黄仁勋访华核心观点 - 中国供应链系统复杂高效且极具制造优势,是构成全球AI硬件和智能工厂建设的重要基础 [4] - H20芯片已被重新批准销售,未来将推动更多Blackwell架构产品落地中国 [5] - 中国在AI模型、工程人才与产业应用上全球领先,全球约50%的AI研究人员在中国 [6][9] 对中国科技企业的评价 - 中国电动汽车是全球惊喜,小米、蔚来、小鹏等企业正在重塑全球竞争格局 [7][52] - 华为在芯片、网络解决方案、光子技术等方面取得重大突破,是值得学习的对象 [8][35] - 中国开源AI如DeepSeek R1是全球进步的催化剂,首个开源推理模型已被全球广泛下载适配 [46] 技术战略与产品布局 - RTX Pro专为数字孪生和机器人模拟设计,基于Blackwell架构,具备H20不具备的计算图形和AI功能 [42][87] - CUDA技术开放兼容,不介意中国厂商开发兼容平台,与英特尔X86架构的封闭策略形成对比 [3][45] - AI发展分为四个阶段:感知、生成、推理和机器人,当前处于推理AI阶段 [58][59] 全球供应链与竞争格局 - 中国供应链基础设施完善、生态系统成熟,是英伟达全球布局的重要环节 [15][89] - 英伟达供应链周期长达9个月,正全力加速Hopper架构产品产能恢复 [19] - 尊重华为等竞争对手,认为低估中国制造能力是极其天真的 [66] AI行业趋势与算力需求 - 算力焦虑将持续十年,当前算力远不能满足AI训练需求 [57] - AGI可能很快实现且无需根本性技术突破,具体进展取决于定义标准 [12][63] - AI工厂将成为新型基础设施,输入电力产出AI智能,推动全球产业升级 [68] 中国市场战略 - 中国是全球第二大科技市场且增长迅速,英伟达将持续投资扩张 [41][95] - 中国在移动支付、金融科技等应用层面领先全球,创新实践被全球借鉴 [48] - 教育体系培养了大量顶尖AI人才,为技术发展提供坚实基础 [9][91] 技术合作与开放生态 - AI领域具有独特开放性,全球研究者通过论文实现"虚拟合作" [29] - 多AI工具协同使用(OpenAI/Gemini Pro/Claude/Perplexity)可提升决策质量与安全性 [98] - 开放性确保AI技术安全进步,全球合作是未来发展关键 [85]