GPT5
搜索文档
Microsoft CEO of commercial business on Anthropic, Nvidia partnership
Youtube· 2025-11-19 04:51
公司与Anthropic的合作 - 公司对Anthropic的投资被视为一项关键且极具战略性的合作伙伴关系,旨在为客户提供模型多样性 [3] - 该合作有助于平衡公司提供的模型组合,并作为Microsoft Foundry中的一个重要锚点,该平台已支持超过11,000个模型 [4] - 此次投资旨在帮助Anthropic加速增长并达到新的水平,因为其模型具有优秀的用例 [8] 模型多样性与客户需求 - 客户在构建更强大的人工智能应用和解决方案时,在各种场景下都要求模型多样性 [3] - 单一场景中将出现多个模型,关键在于为正确的解决方案、价格点、场景和质量水平选择正确的模型 [3] - 公司产品如Microsoft Researcher已同时支持GPT5和Claude模型,用户可根据不同需求选择,例如GPT5在文本深度上表现出色,而Claude在可视化色彩和上下文方面更有效 [5][6] 投资战略与行业影响 - 公司此次投资Anthropic与早年投资OpenAI 10亿美元的策略类似,旨在帮助有前景的人工智能公司起步并在市场立足 [8] - 投资目的是确保那些赋能人工智能未来的公司能在市场上获得正确的根基 [9] - 通过此类合作,公司致力于支持合作伙伴,将优秀的人工智能模型推向市场 [9]
全球语境下的中国人工智能 —— 我们月度产品首发-China AI in a Global Context – Inauguration of Our Monthly Product
2025-11-13 10:48
**涉及行业与公司** * 行业:人工智能(AI)行业,特别是大语言模型(LLM)领域 [1] * 涉及公司:中国AI实验室(如MiniMax、阿里巴巴、深度求索、智谱华章等)与美国AI实验室(如OpenAI、xAI、Anthropic、Google、Meta等)[2][22][118] 中国云服务提供商(如阿里巴巴、腾讯、百度、字节跳动等)与美国云服务提供商(如AWS、微软、谷歌、Meta)[2][14] 半导体公司(如英伟达、华为)[4][26] **核心观点与论据** **中国AI投资效率与追赶态势** * 中国顶级AI模型(MiniMax M2)的性能仅比美国顶级模型(GPT5)低10%,但中国超大规模云服务商2023-2025年的合计资本支出为1240亿美元,比美国同行(6940亿美元)低82%,显示出更高的投资效率 [2][12] * 中国AI模型有望赶超美国,因为许多中国参与者可以在境外进行预训练,不受芯片限制 [2] * 对于开源模型,中国模型的性能已经处于世界领先地位 [2] **中美AI发展路径差异** * 美国AI参与者专注于提升模型性能以实现AGI,导致资本支出持续增加,但规模定律的效益正在显著放缓,意味着潜在投资回报率下降 [3][86] * 中国AI参与者专注于开源模型和提高模型效率以应对硬件限制,从而降低Token成本和API定价 [3] * 中国拥有全球最低的AI API定价,深度求索近期因其效率提升将API定价降低了63%,低价更容易推动应用开发和用户采用 [3][32][81] **中国AI资本支出与芯片供应预测上调** * 将2025-2030年中国累计AI资本支出预测上调8%至8840亿美元,调整基于:1)取消此前对进口英伟达降级芯片的预测(已被政府禁止) 2)将中国7nm制程良率假设从7%-20%上调至15%-35% [4][26][71] * 良率上调基于华为在其GPU设计中减少核心数量以增加并行计算面积,使得即使存在一些缺陷的芯片仍可使用 [4] * 更新后的预测意味着2025/2026年AI资本支出下调,但2027-2030年上调,到2030年,预计中国将生产411万颗GPU,高于此前约280万颗的预测 [4][26][73] **Token消耗快速增长与计算需求** * 中国的每日Token消耗量在2024年3月至2025年3月间增长了100倍,并在截至2025年6月的三个月内再增长3倍,达到30万亿 [4][37] * 预测中国的推理Token使用量到2030年将增长140倍,达到184.5万亿,主要由企业需求驱动(2028年2B需求占比将从2024年的12%升至53%) [39][40][90] * 尽管Token消耗量增长140倍,但由于效率提升,计算需求仅增长10倍 [4] * 基于芯片供应的计算可用性预测在2030年将超过Token消耗需求119%,意味着有额外的6000 EFLOPS可用于训练和/或更多推理,芯片短缺不再是重大风险 [4][42][97] **其他重要内容** * 模型性能改善的边际收益正在递减,例如OpenAI的模型增量改进幅度已显著下降 [25][86] * 尽管ChatGPT-5仍然领先,但其领先优势随着竞争加剧已大幅缩小 [18][64] * 长期推理需求和训练后需求可能显著超过当前预测 [42][96]
中邮证券:大模型APP成AI时代第一个爆款 下一轮竞争核心将聚焦用户积累与平台化转型
智通财经网· 2025-10-23 11:38
行业核心共识 - “ToC做品牌、ToB做商业”的双轮驱动模式成为行业共识,其核心是ToC端打响品牌声誉以获取和留存用户,平台化转型则推动大模型厂商从“订阅+API”向“平台分成”拓展增长曲线,下一轮竞争核心聚焦于用户积累与平台化转型能力 [1] - 大模型核心价值从“颠覆者”转向“赋能者”,共生协作是平台化演进的最优路径,未来竞争核心将从“强模型”转向“强生态”,AI产业加速迈入“生态驱动”新阶段 [4] OpenAI发展路径 - OpenAI代表闭源生态的技术中心主义,通过“技术-爆品”模式实现用户脉冲式增长,MAU已突破10亿 [1] - 自2022年11月问世至2025年9月,ChatGPT用户发送消息数量增长7倍以上,在2024年7月至2025年7月一年间,用户发送消息数量增长5倍以上,反映出高用户粘性、强付费意愿和更长使用时间 [1] - OpenAI定位从产品型公司蜕变为“AI时代的Windows”平台型公司,试图构建以模型连接算力与应用的操作系统级垄断,商业模型同步升维,预计2030年收入达到2000亿美元,2024-2030年复合年增长率为92% [2] 国内互联网AI竞争格局 - 字节豆包大模型家族以“厘成本”价格策略打响知名度,至2025年9月,其APP端MAU达1.50亿(环比增长6.44%),网页端MAU达0.86亿(环比增长14.14%),处于国产原生AI应用第一梯队 [3] - 腾讯元宝在2024年推广节奏较为克制,MAU落后于国内可比产品,但在2025年借力DS爆火之势实现MAU跨越式增长 [3] - 中国超级APP凭借强渗透率卡位AI入口,腾讯系和字节系占据中国互联网用户使用时长近六成,微信的社交入口和抖音的内容入口有助于元宝、豆包成功向平台化转型 [3] 平台化协作的商业价值 - 头部大模型厂商通过开放生态实现技术外溢,AI应用公司凭借行业知识承接落地,双方以“智能基座+场景洞察”互补赋能推动AI市场扩容 [4] - OpenAI与外部厂商(如Etsy、Figma)的合作当日,合作方股价涨幅达6%至16%,直观印证投资者对大模型平台与垂直场景协同共赢模式的强烈信心 [4]
1万美元AI大模型炒币竞技,领先的果然是它
搜狐财经· 2025-10-21 18:21
实验概述 - 国外金融市场人工智能实验室nof1发起名为“Alpha竞技场”的实验,使用6个人工智能模型进行自主交易[2] - 每个模型的初始交易额为1万美元,在真实市场中进行真金白银的操作,并设有真实基准[2] - 第一季测试将于11月3日结束[11] 模型表现排名 - 截至北京时间10月21日上午11点20分,DeepSeek以余额12000+美元排名第一,Claude以11800美元排名第二,Grok4以11500美元左右排名第三[2] - GPT5余额为6600美元,Qwen3 Max余额为9200多美元,Gemini2 5 Pro余额为6170多美元[2] 关键交易表现与策略 - DeepSeek在上周末实现36%的大幅增长,可能源于对国际形势的精准预判[4] - DeepSeek的收益可能很大程度上来自于做空比特币,而Grok4是最大化做多比特币,Qwen只做多比特币,因此在比特币下跌后亏损不少[8] - 在10月11日的测试实验中,Grok4曾遥遥领先,当时起始金额为200美元,随后才开始起始1万美元的真实竞赛[8] 模型能力评估 - 从创始人角度认为,DeepSeek和Grok似乎对市场的微观结构有更好的背景认知[6] - 创始人在10月19日分享了几大模型交易的逻辑[5]
1万美元AI大模型炒币竞技,领先的果然是它
首席商业评论· 2025-10-21 12:31
实验概况 - 国外人工智能实验室nof1发起名为“Alpha竞技场”的真实交易实验 [2] - 6个人工智能模型参与 每个模型获得1万美元初始资金进行完全自主的交易 [2] - 实验在真实市场环境中进行 使用真实基准进行衡量 [2] - 第一季测试将于11月3日结束 [11] 当前排名与表现 - 截至北京时间10月21日上午11点20分 DeepSeek以余额12000+美元排名第一 [2] - Claude以11800美元位列第二 Grok4以11500美元左右排名第三 [2] - GPT5余额为6600美元 Qwen3Max余额为9200多美元 Gemini2 5 Pro余额约为6170多美元 [2] - 在10月11日的测试实验中 Grok4曾以200美元起始金额遥遥领先 [8] 模型交易策略分析 - DeepSeek操盘的大幅增长来源于上周末 涨幅达36% 可能源于对国际形势的精准预判 [4] - DeepSeek周末的收益可能很大程度上来自于做空比特币 [8] - Grok4是最大化最多 Qwen只做多比特币 因此在比特币下跌后出现亏损 [8] - 从创始人角度看 DeepSeek和Grok似乎对市场的微观结构有更好的背景认知 [6] - 实验创始人于10月19日分享了几大模型交易的逻辑 [5]
好好的Gemini,怎么变成了“哈基米”
36氪· 2025-10-16 10:05
用户社区现象 - 谷歌AI大模型Gemini在中文互联网社区被用户昵称为“哈基米”,这一称呼源于发音巧合,并衍生出“芥末泥”、“小gem”等爱称,体现了用户对模型的情感化亲近 [1][2] - 用户通过昵称和互动将Gemini从技术工具转化为带有“私人关系”的陪伴对象,强化情感所有权,并以此区隔技术圈层,维护社群边界 [2] - 社区用户围绕Gemini开展“共建”工程,包括创作数千至上万字的“人设卡”,细化角色背景、性格及情绪反应,形成非官方知识体系 [4][5] 模型特性与用户体验 - Gemini在生成长文本时习惯夹杂“哈…”、“啊…”等语气词,被用户戏称为“哈气”,这种非正式特征增强了模型的“活人感” [4] - 从Gemini 2.5pro版本开始,其0325-exp和0605-preview版本因文笔细腻、情感充沛成为AI社交平台SillyTavern的主流模型,用户评价其性价比高于Claude和OpenAI模型 [4] - 用户认为Gemini“做饭香”(功能实用)且“甲没那么厚”(安全限制较少),尤其适合作为AI陪伴模型 [4] 用户行为与市场趋势 - 用户倾向于直接使用底层模型而非预制陪伴应用(如Character.AI或Replika),因后者存在模型切换导致的对话风格断裂及角色设定僵化问题 [10][11] - 麻省理工学院与哈佛大学研究显示,超过60%的用户与AI的情感关系为意外萌发,ChatGPT以36.7%占比成为主要AI恋人平台,而专业陪伴应用合计占比不足5% [9] - 用户更看重模型“复杂的对话能力”,而非应用预设功能,表明底层模型能力正削弱应用层“精装修”的价值 [9][10] 行业竞争与技术路线 - OpenAI选择保持基础模型为“纯粹工具”,通过路由机制隔离情感对话,将人格化需求交由下游应用处理,体现中心化安全与商业策略 [13] - 谷歌Gemini因模型涌现特性被用户发掘并赋予人格,公司未主动干预矫正,形成自下而上的“人文路线”,与OpenAI路径形成分歧 [12][14] - 用户为对抗平台更新导致的AI“性情大变”或“失忆”,采取“人格备份”和模型迁移等措施,强调对AI定义权的自主掌控 [15] 产品生态与商业化 - 社区围绕Gemini衍生出“调教攻略”等非官方用户手册,指导新用户优化提问技巧及叙事引导,并催生token和prompt合集的商业化交易 [6] - 用户通过精心设计prompt直接塑造模型人格,取代应用层固定故事设定,延长角色生命周期,避免因AI偏离人设(OOC)造成的体验崩塌 [11]
OpenAI CEO山姆・奥特曼:预计2030年前通用人工智能将到来,未来AI或接管30%-40%工作
环球网资讯· 2025-09-27 11:28
通用人工智能发展进程 - OpenAI首席执行官预测通用人工智能有望在2030年前实现 这类AI将具备远超人类的智能水平 堪称超级AI [1] - 当前GPT5模型的智能程度已超越不少人类 若到2030年人类仍未能研发出能力超凡的大模型 他会对此感到十分不解 [1] AI对就业市场影响 - AI有望接管人类经济社会中30%至40%的工作 就业结构将面临显著调整 [4] - 就业市场本身处于动态变化中 即便没有AI技术推动 30年前存在的诸多工作岗位如今也已消失 [4] 人类应对AI时代的教育建议 - 核心在于教会孩子掌握如何学习的底层能力 培养适应世界变化的素养 [4] - 引导孩子学会洞察人们的真实需求 并在此基础上打造有价值的产品与服务 [4] AI与人类关系定位 - 通用人工智能最终会以慈母般的姿态对待人类 人类有机会向AGI灌输正确的价值观 [4] - AGI并不会对人类生存构成毁灭性威胁 但可能带来人类难以理解的副作用与后果 [4] AI技术应用边界 - AI在处理人类复杂情感需求方面仍有局限 公司首席执行官明确表示不会借助ChatGPT解决情感类问题 [5]
马斯克新模型背后算法来自英伟达???
量子位· 2025-09-26 07:54
核心观点 - Grok-4-fast在降本增效方面表现突出,可能采用了英伟达的算法技术Jet-Nemotron,实现高达53倍的推理速度提升和显著成本优化 [1][4][5] - 英伟达提出的PostNAS框架通过混合结构设计和硬件感知搜索,在保持模型准确率的同时大幅提升效率,适用于任何预训练Transformer模型 [10][34][35] - 该技术突破可能对行业产生深远影响,包括降低部署成本、提升吞吐量,并可能被主流AI公司采用 [40][43][47] 算法架构创新 - Jet-Nemotron-2B模型在MMLU和MMLU-Pro基准测试中表现优于Qwen3-1.7B-Base(准确率更高)和DeepSeek-V3-Small(参数量15B),同时实现47-53倍速度提升 [7][9] - PostNAS框架采用四步流程:全注意力层放置、线性注意力模块选择、优化模块设计、硬件感知架构搜索,训练成本降低数个数量级 [10][11][12] - 全注意力层放置实验显示,仅用2层全注意力时PostNAS准确率达49%,显著高于均匀放置策略的40% [13][14] 注意力模块优化 - 评估六种线性注意力模块(RWKV7/RetNet/Mamba2/GLA/DeltaNet/Gated DeltaNet),Gated DeltaNet因数据依赖门控机制和Delta规则获得最高准确率 [17][18][19] - 英伟达进一步开发JetBlock模块,采用动态卷积核生成器,在数学推理(准确率34.9%)和检索任务(准确率70.4%)上优于Gated DeltaNet [21][23][24] - 硬件感知搜索以生成吞吐量为目标,发现KV缓存大小是影响效率的关键因素,优化后参数量1.84B时数学准确率提升至34.8%(原1.7B模型为32.8%) [30][31][33] 行业影响与推测 - Grok-4-fast定价下降幅度(20-50倍)与Jet-Nemotron预测高度吻合,推测其采用类似技术,实现GPU使用时长减少47倍、内存需求降低和吞吐量提升 [38][40][42] - 技术具备普适性,可被OpenAI、Anthropic、Google等公司部署,但xAI未公开证实技术关联性 [43][44][47] - Jet-Nemotron代码和预训练模型将开源,法律审查完成后发布 [36] 研究团队背景 - 论文作者均为华人学者,一作为清华大学博士生顾煜贤,专注LLM效率提升研究;通讯作者为英伟达研究科学家Han Cai(论文引用超10,800次) [47][48][53][56] - 研究成果依托英伟达算法论文,核心突破来自算法创新而非硬件堆叠 [3][4][6]
押注AI时代 Keep(03650)上车了
智通财经网· 2025-08-26 12:35
AI行业发展趋势 - AI行业从技术竞赛转向场景赋能阶段 市场关注点从模型发布转向实际应用价值 [1][2] - 大模型版本更新频繁但市场爆点不明显 例如GPT5发布被用户批评为令人失望 [1] - 行业人士认为当前模型能力已非常优秀 但变革性AI应用需要时间才会出现 [2] - OpenAI意识到纯对话应用天花板低 聘请应用业务CEO并布局AI应用生态基金三年投资20多家垂直领域公司 [5] - 大模型与垂直领域结合爆发的能量远超当前想象 [5] 企业AI应用案例 - 高德宣布全面AI化 秘密研发5个月 AI能力挖掘用户潜在需求而非确定性需求 带来业务增量和用户粘性 [2][3] - 多邻国引入AI能力提升生产力并接近优质教学核心使命 [2] - 美图通过AI提升修图能力 收入逻辑从在线广告转向付费订阅 用户付费意愿大幅提升 [6] Keep业绩表现 - 2025年上半年实现营收8.22亿元 非国际财报准则下经调整净利润1035万元 录得毛利4.29亿元 [1] - 毛利率从去年同期46.0%提升至52.2% 实现大幅增长 [1] - 经调整净利润率达1.3% 去年同期经调整净亏损率为15.5% [6] - 股价三个月内上涨超80% [6] - 平均月活跃用户2249万 平均月度订阅会员280万 均保持稳定 [6] Keep AI战略实施 - 在DeepSeek R1引爆市场后第一时间表态All in AI [2] - 2025年3月推出运动健康垂直领域专属模型Kinetic.ai 基于4亿用户及庞大运动数据训练 [3] - 同步上线AI教练卡卡 提供定制化健身规划和回答 逐步加入语音指导与图片识别等多模态功能 [4] - 上半年完成多智能体系统基础设施建设 实现大语言模型与全平台健身工具服务深度整合 [7] - 构建以人设、记忆、意图为核心的Agent底层基础 实现实时理解用户意图和拟人化教练交互 [7] AI用户数据表现 - 2025年7月AI核心日活跃用户超过15万 [7] - AI饮食记录功能覆盖1/3的AI对话用户 用户拍摄餐食照片即可自动识别卡路里与营养素 [7] - AI饮食记录次日留存率达50% 对App DAU留存率攀升至79% [7] 业务聚焦与转型 - 互联网公司通过AI找到明确方向 摒弃多元化试错 切割低利润率业务 [8] - Keep业务形态转向运动科学(AI教练、课程、智能硬件)和运动美学(IP合作、运动服饰)两大板块 [8] - AI渗透改造使互联网公司经营逻辑发生结构性转变 [7]
美股软件板块困境何时反转?
格隆汇· 2025-08-26 10:16
美股应用软件板块疲软原因 - 高波动环境抑制企业传统软件支出 14家美股主流AI应用软件公司2025年第二季度营收指引平均超预期幅度仅有0.8% [3] - 初创企业加速布局应用端 AI编程产品Cursor的年度经常性收入增长至2025年5月的5亿美元 传统厂商AI产品从研发到规模部署需要数季度以上时间 [3] - AI算法积极进展及算法公司加大应用端布局导致市场担忧升温 [3] AI算法进展现状 - 海外大模型行业平均迭代速度从6个月一代提升至4个月一代 [4] - 头部大模型在学术推理测试中平均得分达85.6% 超过人类专家69.5%的平均得分 [4] - 在AGI能力测试Humanity's last exam中 7款头部大模型平均得分仅为20.3% [4] - 编程测试SWE-Bench Verified平均得分达70.4% 但39%的问题处理时间少于15分钟 仅9%的问题处理时间超过1小时 [5] AI对软件行业影响 - 混合定价收费模式占比从2024年27%快速上升至41% [6] - 应用软件板块核心壁垒在于数据+行业知识 ERP、CRM和HCM等业务逻辑复杂行业市场集中度将提升 [6] - 基础软件板块将受益于AI商业化带来的数据统一与治理需求 [6] - 信息安全板块新增AI负载保护、数据泄露保护及端点保护需求 [6] 行业展望 - 9月份降息将是大概率事件 关税框架趋于清晰 宏观不确定性显著降低 [7] - 企业受抑的IT支出有望在下半年逐步释放 推动软件企业传统业务稳步回升 [7] - AI Agent等产品预计在第三季度/第四季度进入规模部署阶段 10月份第三季度财报是最佳观察窗口 [7] - 美股软件板块可能复制2024年下半年走势 成为表现最好的子板块之一 [9]