Workflow
生成式AI
icon
搜索文档
AI新子弹要来了!报道称OpenAI正探讨“数百亿甚至1000亿美元融资”
华尔街见闻· 2025-12-18 17:58
OpenAI新一轮大规模融资计划 - 公司正在酝酿新一轮规模空前的资本运作,融资规模可能高达数百亿乃至一千亿美元,旨在巩固其在人工智能领域的统治地位,并为高昂的模型训练成本补充弹药 [1] - 公司在近期与投资者的接触中,讨论了约7500亿美元的估值水平,若以此估值完成融资,将较其去年10月最近一次股份出售的估值高出约50% [1] - 除此前已从Thrive Capital、软银等投资者处筹集超过600亿美元外,公司也已开始为新增融资进行铺垫 [1] 潜在战略投资者亚马逊 - 亚马逊正与公司进行深入接触,洽谈向公司投资至少100亿美元 [1] - 作为交易的关键一环,公司将同意使用亚马逊自研的Trainium芯片 [2] - 公司此前已宣布在未来七年内斥资380亿美元租用亚马逊Web Services(AWS)的服务器,而拟议中的这笔投资将直接为该租赁承诺提供资金支持 [2] 行业竞争格局与影响 - 这一系列融资动态凸显了生成式AI领域日益激烈的昂贵军备竞赛 [2] - 若公司成功引入亚马逊等战略盟友并实现芯片供应链多元化,不仅意味着其现金储备的大幅扩充,也预示着硅谷巨头间关于算力、独家协议与市场份额的竞争关系正变得更加错综复杂 [2] - 如果交易落地,亚马逊将加入包括英伟达在内的科技巨头行列,成为公司最新一轮的重量级投资者 [2]
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 17:46
文章核心观点 - 金融业应主动融入国家“人工智能+”行动,通过平衡开源与闭源模型、协同决策式与生成式AI、优化算力供给与保障安全性等多维路径,提升人工智能应用的普惠性,推动技术与业务深度融合,最终提升金融服务质效和内部管理效能 [3][4][5][8][9] 开源模型与闭源模型 - 开源模型意味着技术平权和自主可控,通过分布式协同创新降低企业应用成本,提升AI普惠性,但存在模型迭代速度较慢、幻觉率较高的特点 [4] - 闭源模型在稳定性和可靠性上相对更高,同等参数规模下性能可能更优,服务支持更成熟,但自主定制化程度受限且模型透明度较低 [4] - 金融业应重点考虑“AI+”应用而非自建大模型,融合开源与闭源优势,围绕场景建设提升服务质效和管理效能 [4] - 以农业银行为例,采取“两条腿走路”策略:在普惠服务、办公等领域加快探索应用开源模型以提高普及率;同时通过本地化部署闭源模型,在客户服务、知识优化推荐等场景确保数据隐私和极致体验 [4] 决策式AI与生成式AI - 决策式AI擅长“确定性优化”,在强可解释性和准确性要求高的场景中仍是最优选择,目前金融业应用占比超过八成,主导风险评估、算法交易和欺诈检测等核心业务领域 [5] - 生成式AI擅长“可能性涌现”,在开放式和创意性场景中泛化能力更好,主要应用于智能客服、知识助手、报告撰写等非核心业务领域 [5] - 随着大模型能力增强、生态完善和算力突破,生成式AI应用可能实现指数级增长,并与决策式AI协同,形成以智能体为主的通用范式,二者边界趋于模糊 [5] - 多智能体配合的“双AI”编排协作模式能更好实现AI能力普惠化,例如在客户营销中,用决策式AI构建客户画像,用生成式AI形成个性化服务方案,提升服务精准性和获得感 [5] AI普惠与算力供给 - AI普惠性提升导致数据处理规模和复杂度指数级增长,数据中心计算量膨胀速度将远大于CPU处理效率进化速度,AI大规模应用意味着进入加速计算时代 [7] - GPU凭借强大并行计算能力能高效应对计算密集型任务,未来通用计算将退化为“控制平面”,高时效高计算负载场景由专用加速计算实现 [7] - AI加速普及过程中,GPU算力需求与供给将始终处于“紧平衡”状态,从绿色发展角度看这种平衡是必要的 [8] - 需从存量挖潜和增量扩容两端发力平衡矛盾:一方面通过算力灵活调度、参数合理匹配、模型压缩加速等工程化手段降低运行成本;另一方面加快建设支持AI高性能计算的智算中心 [8] - 以农业银行为例,依托“农银智+”平台构建参数多样、能力丰富的模型矩阵,通过模型蒸馏、微调等手段精细化匹配业务并充分利用GPU资源,同时建设支持多类型GPU组合的算力云平台,保障AI算力弹性、韧性和可持续供给 [8] 普惠性与安全性 - 提升AI应用普惠性同时必须高度重视安全性,需强化AI稳定性以保障大众利益,未来AI将成为数字世界“基础设施”,需建立模型安全护栏、主动防御等技术手段应对提示词注入、资源消耗攻击等风险,保障AI稳定运行和业务连续性 [9] - 需提升数据质量以增强模型可信度,在AI广泛应用背景下,数据来源更丰富、结构更复杂,数据倾斜、数据投毒等问题会加剧模型决策偏差,引发公众信任危机,需建立全生命周期模型评测和监控体系,加强算法公平性约束,提升模型稳定性和可解释性 [9] - 需避免模型共振以防范系统性风险,随着竞争加剧,市场主流大模型集中度会越来越高,商业银行依赖的模型算法逐步趋同,局部缺陷可能形成机构间模型共振并引发系统性风险,需加快构建更可靠知识体系,开展差异化模型训练,提升金融系统整体韧性 [9]
AI云的“半程路标”:谷歌云和阿里云的逆袭,AWS、微软云的再审视
钛媒体APP· 2025-12-18 16:26
文章核心观点 - 大模型的出现改变了云计算的竞争格局,打破了以往由规模效应驱动的“强者恒强”趋势,为后进者提供了冲击前排的机会 [1] - AI云的核心竞争力已从传统的“卖云”资源,转变为“模型+云平台+芯片”的垂直整合全栈能力,企业购买的最终商品是AI而非云本身 [20][21] - 行业竞争仍处在“半程路标”阶段,胜负未定,但方向已清晰指向全栈能力的构建,不同厂商正基于各自优势采取差异化路径 [22] AI云对行业竞争格局的重塑 - 大模型之前的叙事逻辑是规模效应驱动行业集中度提升,强者愈强 [1] - 大模型让云厂商的生意发生本质变化,为后进者提供了冲击机会 [1] - 对于如何做AI云,即便是顶级云厂商也未很快达成共识 [1] - 在AI云语境下,企业购买的最终商品是AI,云退居为支撑AI的基础设施,未来会逐渐消失在客户账单上 [20] - AI的竞争已从单点竞争转向涵盖基础设施、模型、工程、应用四个层级的系统能力竞争,任何只占据其中一层的厂商都很难长期掌握产业主导权 [19] 主要云厂商的AI云战略与表现 **微软** - 早期凭借对OpenAI的投资拥有GPT优先使用权,希望通过GPT带飞Azure [3] - 与OpenAI的合作从最初的美好变为“貌合神离”,因OpenAI寻求多方云资源替代方案并推出竞争产品 [3] - 微软不得不投资Anthropic并加大自研模型力度以应对 [3] **亚马逊云科技 (AWS)** - 选择大手笔投资OpenAI的竞争对手Anthropic(先于微软)以获得领先模型能力 [3] - 核心策略是“Choice Matters”,在Bedrock上提供多种模型选择,认为不存在适用于所有场景的通用最优模型 [3] - 面临的关键问题是头部模型具有无可替代的重要性,而顶级模型多由竞争对手掌控或企业不愿完全托管,影响了其模型层竞争力 [4] - 在最近的re:invent大会上新增了十多款模型,包括中国的Kimi和Minimax,并更新了自研的Nova模型,以在模型层面不落后太多 [4] - 与微软类似,缺少自研模型,正处于关键的自我修正期,需在保持平台中立的同时补齐模型层的确定性 [22] **阿里云** - 凭借Qwen模型在全球技术圈闯出影响力,是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商 [5] - 业界率先实现“全尺寸、全模态”的全面开源,其他三家头部云厂商均未将自身模型规模开源 [5] - 通义千问Qwen衍生模型数量已突破18万,远超Meta的Llama系列;全球下载量超7亿,据彭博统计截至2025年10月已超越Llama,成为全球第一AI开源模型 [5] - 阿里云的目标是让Qwen成为产业的默认依赖,通过开源成为标准 [5] - 在Gartner报告中,是唯一入围GenAI云基础设施新兴领导者象限的亚太厂商 [10] - 在“GenAI模型”维度,其“特征”指标领先于AWS和微软,仅次于谷歌和OpenAI [13] - 在“GenAI工程”维度,其“特征”及“未来潜力”指标优于AWS、谷歌和微软 [16] - 与谷歌云一同,因在模型、云平台与芯片多个层级形成正向叠加效应而更受资本市场认可 [21] - 其自研AI芯片PPU虽未公开发布,但公司体量支撑得起相关支出,并具备自用和对外输出的想象空间 [22] **谷歌云** - 是低开高走的典型代表,Gemini 3系列模型和第七代TPU Ironwood被视为谷歌AI逆袭的标志 [6] - 公司创始人坦诚,尽管八年前发布了Transformer论文,但内部未给予足够战略重视,在算力扩展上投入过于保守 [6] - 第七代TPU Ironwood在性能、能效比和互联带宽上均显示出对GPU的显著优势 [6] - Gemini 3系列的原生多模态能力和超长上下文窗口将行业标准提升到新量级 [6] - 其“模型+云+芯片”的垂直整合,展现了更深厚的护城河,为行业提供了AI云的参考标准 [6] - 与阿里云一同,因在模型、云平台与芯片多个层级形成正向叠加效应而更受资本市场认可 [21] - TPU已经证明其在性能和成本上的优势 [22] Gartner生成式AI技术栈象限分析 - Gartner发布了涵盖GenAI云基础设施、GenAI工程、GenAI模型以及AI知识管理应用四大维度的新兴市场象限报告,可视为AI技术栈的参考指南 [7] - **GenAI云基础设施**:新兴领导者象限仅有微软、谷歌、AWS和阿里云四家厂商入围,阿里云是唯一入围的亚太厂商 [10] - **GenAI模型**:市场高度集中,主要由少数几家厂商主导,四家云厂商依旧位居领导者象限 [13] - **GenAI工程**:收录厂商数量更多,四家云厂商继续领跑,但与其他厂商的差距并未拉开 [16] - **AI知识管理应用/通用生产力**:评测范围覆盖企业级AI搜索、对话式AI平台及生产力工具,除四家云厂商外,Salesforce等软件厂商也位列其中 [19] AI云的核心竞争力与未来趋势 - AI云的核心竞争力在于模型、云平台与芯片的垂直整合 [21] - 模型决定智能上限,云平台把模型变成可规模化的商品,芯片决定成本下限和性能天花板 [21] - 当AI成为算力、数据、软件栈高度耦合的系统工程,全栈能力使得模型迭代能直接反馈到底层基础设施,也让基础设施投入更快转化为产品优势 [21] - 海外新兴云厂商如CoreWeave和Nebius试图从提供最新GPU裸机服务或AI推理服务等单点优势切入,但很难冲击原有的四强格局 [20] - 云厂商过去二十年的变化是不断在技术栈上叠加新能力,这本身就是护城河 [21]
日美利率差缩小,日元仍贬值之谜
日经中文网· 2025-12-18 15:33
传统利率平价理论失效 - 外汇市场“利率差缩小导致日元升值”的定论已经失效 尽管日美政策利率差已缩小至约3年来的最低水平 但日元汇率仍维持在1美元兑155日元附近 与年初约157日元基本持平 处于接近37年来低点的历史性贬值局面 [2][4] 日本国际收支的结构性压力 - 2025年1至10月日本经常项目收支顺差27.6万亿日元 全年可能继2024年29.3万亿日元后再创历史新高 其中约有5万亿日元流回日本 推动了日元买入 [6] - 贸易收支持续构成贬值压力 截至2024年已连续4年逆差 2025年1至10月也出现1.5万亿日元逆差 因进口货款多需美元支付 [6] - 服务收支问题严重 数字收支截至10月出现5.6万亿日元逆差 而旅游收支得益于访日游客 确保了5.4万亿日元顺差 暂时抵消了数字逆差 [6] - 未来数字逆差可能超过旅游顺差 导致日元持续贬值 据日本经济产业省4月估算 数字逆差到2035年将增至18万亿日元 规模超过2024年原油进口额10万亿日元 [6] - 日本市场的云服务和在线视频多被海外企业掌握 生成式AI普及构成进一步打击 旅游收支则因劳动力短缺及中日关系恶化而增长乏力 [6] - 有观点认为2026年可能成为日本服务逆差固定下来的转折点 [7] 资本外流与财政政策疑虑 - 日本小额投资免税制度NISA成为卖出日元的主要原因 自2024年1月实施新NISA以来 买入海外投资信托导致的资金流出额每月平均为6900亿日元 较以前的3800亿日元大幅增加 全年约有8万亿日元被卖出 [9] - NISA账户数可能从现在的2700万增加到4000万左右 预计至少今后5至10年将维持每年10万亿日元规模的日元卖出压力 [9] - 高市早苗政府提出的财政刺激政策引发疑虑 日本国债信用违约掉期CDS的保证金比率在12月9日达到约2年来的最高点 显示对财政扩张的警惕感正在蔓延 [9] - 2025年度补充预算的一般会计总额创出新冠疫情后的新高 有观点认为即使财政政策能带动经济增长 也存在1至2年的时间差 在此期间日元贬值压力将持续 [9] 历史警示与未来风险 - 文章引用2004年美联储前主席格林斯潘对美国国债利率在加息周期中未上升的“谜题”提出警示 该现象后来引发了金融危机 暗示若不能解决当前日元汇率的类似谜题 日元进一步贬值的局面可能不远 [10]
拿到Photoshop的源码了,发现两个意想不到的秘密......
猿大侠· 2025-12-18 12:11
公司发展历程 - 软件最初由托马斯·诺尔为辅助其博士论文研究而编写的一系列图形处理小程序发展而来,后与其弟约翰·诺尔合作整合成名为Display的软件 [12][14] - 软件随后更名为ImagePro,后因名称被占而改名为Photoshop,其早期版本曾与BarneyScan扫描仪捆绑销售,仅售出约200份 [15][16] - 1988年9月,Adobe公司创始人及艺术总监被其演示的智能选区(魔法棒)和柔边蒙版等先进功能所震撼,决定争取短期授权许可,使其成为Illustrator的辅助软件 [16][18] - 1990年2月,Adobe Photoshop 1.0正式发布,其最初销量预期较低,但随后十年内销量超过300万份,远超竞争对手 [18][21] - 鉴于其巨大成功,Adobe公司最终以3450万美元买断了Photoshop的所有权,使其成为公司的旗舰产品 [21] 产品与技术特点 - 初代Photoshop 1.0的源代码使用Pascal语言编写,而非C语言,且代码中注释极少,但因其架构设计精良、抽象出色而代码清晰易懂 [2][4] - 产品核心创新在于将摄影暗房技术数字化,提供了如智能选区(魔法棒)、柔边蒙版等领先于同时代其他图像处理软件的功能 [16][18] - 软件基于像素编辑,是当时的“硬件杀手”,例如一张A4大小、300DPI的RGB图像在内存中约需25MB空间,远超90年代普通PC的配置,导致运行卡顿并需大量使用硬盘虚拟内存 [20][21] - 初代版本中建立的基本架构,如图块、滤镜、虚拟内存抽象等,在后续版本中依然存在,显示了其架构设计的强大生命力 [4] 市场机遇与成功因素 - 产品完美契合了桌面出版、计算机成像和传统摄影三大趋势交汇的历史机遇,迅速成为PC上的杀手级应用 [21] - 其强大的图像处理能力驱动了用户对高性能、大内存电脑的升级需求,反过来促进了其普及 [21] - 经过数十年发展,Photoshop已完全占领用户心智,其名称甚至从名词演变为“PS一下”这样的动词,成为产品成功的标志 [22] 行业背景与挑战 - 软件诞生与发展正值扫描仪市场发展、扫描质量提升、价格下降,以及彩色显示器、彩色打印机普及的时期 [23] - 个人电脑性能遵循摩尔定律持续提升且价格下降,为Photoshop这类资源密集型软件的普及提供了硬件基础 [23] - 当前,生成式AI技术的出现动摇了Photoshop传统的底层逻辑,其过去的核心功能正在变得普及 [22] - 为应对挑战,公司正通过集成Generative Fill、Firefly等AI能力,将产品从修图软件重新定义为创意加速器 [22]
英矽智能今起招股 入场费12146港元
金融界· 2025-12-18 10:08
公司招股与融资详情 - 英矽智能于12月18日至12月23日进行招股,计划发售9469.05万股H股,其中香港公开发售占10%,国际配售占90% [1] - 每股招股价定为24.05港元,据此计算,公司此次集资总额为22.77亿港元 [1] - 每手交易单位为500股,入场费为12146.27港元,公司股票预期于12月30日挂牌上市 [1] - 本次发行的联席保荐人为摩根士丹利、中金公司及广发证券 [1] 募集资金用途分配 - 公司计划将募集资金净额的48%用于关键临床阶段管线候选药物的进一步临床研发 [1] - 15%的资金将用于开发新的生成式AI模型及相关的验证研究工作 [1] - 12%的资金将用于进一步开发及扩展自动化实验室 [1] - 20%的资金将用于为早期药物发现及开发的研发提供资金 [1] - 剩余5%的资金将用作营运资金及其他一般公司用途 [1]
世界品牌500强2025发布
中国新闻网· 2025-12-18 09:38
榜单总体排名与格局 - 谷歌超越苹果位居2025年度“世界品牌500强”榜首,微软排名第二,苹果退居第三 [1] - 美国以184个品牌入选位居国家分布首位,法国、中国、日本和英国分别有51、50、40和34个品牌上榜 [1] - 中国有50个品牌入选,稳居全球第三,其中表现亮眼的品牌包括国家电网、腾讯、海尔、华润、中国五矿、中国南方电网、五粮液、保利、中国国航、长虹等 [1] 行业分布与新上榜/落榜情况 - 榜单覆盖50个行业,汽车与零件行业以33个品牌上榜排名第一 [1] - 能源、食品与饮料行业各有30个品牌上榜,并列第二 [1] - 银行行业有29个品牌上榜排名第四,零售、计算机与通讯行业各有27个品牌上榜并列第五 [1] - 今年新上榜品牌总计23个,其中包括宁德时代、中国联通和通鼎3个中国品牌 [1] - 美国的金宝汤、固特异、赫兹和日本邮政等企业因业务疲软、盈利下滑、出现重大决策失误或受外部冲击影响品牌声誉等原因落榜 [1] 品牌年龄特征与趋势 - 本年度上榜品牌的平均年龄为98.46岁,相比去年有所降低,主要由于科技行业快速发展带动了一批年轻品牌的迅速成长 [2] - 100岁及以上“百年老牌”达221个,占比超四成 [2] - 中国入选品牌中,茅台、青岛啤酒、五粮液、中国银行、友邦保险超越百龄 [2] 行业研讨与专家观点 - 在香港的发布会上,与会者就“从数据到智能:品牌与营销在 AI 时代的增长操作模型”进行了研讨 [2] - 欧洲工商管理学院讲座教授齐夫·卡门认为,人工智能正在迅速重塑品牌、营销和组织决策,但其对增长和收入的贡献仍然参差不齐 [2] - 世界品牌实验室创始人丁海森表示,生成式AI会为品牌创意带来双刃剑效应,而品牌作为当代文化符号的核心载体,需要人类判断注入独特价值 [2]
AI新子弹要来了!报道称OpenAI正探讨“数百亿甚至1000亿美元融资”
华尔街见闻· 2025-12-18 08:54
公司融资动态 - OpenAI正酝酿新一轮大规模融资,估值水平讨论约为7500亿美元,融资规模可能达数百亿美元,最高可达1000亿美元 [1] - 若以此估值完成融资,将较公司去年10月最近一次股份出售的估值高出约50% [1] - 公司此前已从Thrive Capital、软银等投资者处筹集超过600亿美元 [1] - 亚马逊正与OpenAI深入接触,洽谈投资至少100亿美元 [1] 战略合作与资金用途 - 拟议中的亚马逊投资将直接为OpenAI未来七年内斥资380亿美元租用亚马逊AWS服务器的承诺提供资金支持 [2] - 作为交易关键一环,OpenAI将同意使用亚马逊自研的Trainium芯片 [2] - 融资旨在为公司高昂的模型训练和运行成本补充弹药,进一步扩大其现金储备 [1] 行业竞争格局 - 融资动态凸显了生成式AI领域日益激烈的昂贵军备竞赛 [2] - 若成功引入亚马逊等战略盟友,将意味着公司芯片供应链的多元化 [2] - 此举预示着硅谷巨头间关于算力、独家协议与市场份额的竞争关系正变得更加错综复杂 [2]
腾讯控股(00700.HK):海外云与游戏双轮驱动 AI赋能构筑新增长引擎
格隆汇· 2025-12-18 04:14
海外云业务 - 公司采取“基础设施先行”策略,加速全球数据中心布局,目前已覆盖全球22个地区,运营64个可用区,全球加速节点超过3200个 [1][3] - 2025年计划在中东投入1.5亿美元建设沙特首个数据中心,在印尼投入5亿美元建设第三个数据中心,并在日本大阪新建第三个可用区,形成深耕亚洲、发力中东、辐射欧美的格局 [3] - 核心优势在于技术领先与深度本地化服务,技术层面媒体云、音视频传输、Fintech场景服务全球领先,本地化层面通过建设本地IDC提升响应速度,成功迁移印尼GoTo、泰国正大集团等标杆客户 [1][4] - 海外市场竞争相对温和,公司主攻SaaS和PaaS业务,以“高性价比”和优化架构切入市场,客户主要包括中企出海和本地互联网企业,已成为90%以上出海互联网企业、95%以上出海游戏公司的首选云服务商 [1][3][5][6] - 面对芯片供应问题,公司优先保障内部模型训练芯片储备,同时利用CPU资源支撑推理场景需求,并帮助已拥有GPU资源的海外客户更好地利用这些资源 [1][5] 海外游戏业务 - 2025年第三季度国际市场游戏收入同比增长43%至人民币208亿元,预计2025年全年海外游戏收入达757亿元,同比增长31%,占公司游戏总收入比例提升3个百分点至32% [2][6] - 增长动力主要来自公司工业化能力成熟以及前期收购的海外工作室(如Supercell、GGG)经过4-5年积累后开始贡献收入,新发布的PC及主机游戏《消逝的光芒:困兽》销量表现良好 [2][6] - 公司通过国内团队的工程师红利与GaaS(游戏即服务)能力与海外团队的创意优势协同,成功将国内验证的GaaS模式复制到全球,例如《三角洲行动》通过千人团队实现每周迭代,内容产出效率远超西方工作室 [2][7] - 未来将聚焦深化GaaS运营模式以延长产品生命周期,并强化IP价值挖掘,通过电竞、影视化等方式打造全球化长青品牌 [7] AI赋能游戏 - AI工具已广泛应用于游戏生产制造环节,以光子工作室为例,95%的员工使用AI工具,实现2D美术制作效率提升50%,3D建模单任务成本下降8% [3][8] - 在游戏体验端,AI队友、AI教练等应用提升了用户留存,AI Bot可创造千人千面的游戏体验,同时AI也赋能技术运营,如异常图片检测和智能外挂检测 [8] - 公司在AI原生游戏技术方面取得突破,已跳出纯大语言模型框架,开始具备基础的“场景连贯性”和“实时生成能力”,例如实现了“玩家奔跑后转身,身后场景实时动态生成”的演示 [3][9] - 公司凭借游戏原生基因与大模型布局,在针对性打造游戏专属世界模型方面具备先发优势,未来将通过自研AI大模型提升跨平台适配效率与内容生产能力,降低本地化开发成本 [3][7][9] 财务预测与增长曲线 - 海外市场已成为公司游戏与云业务明确的第二增长曲线,前期战略投入进入成果兑现期 [3][9] - 维持盈利预测,预计公司2025年至2027年调整后净利润分别为2626亿元、3013亿元和3454亿元 [3][9]
腾讯研究院AI速递 20251218
腾讯研究院· 2025-12-18 00:01
行业核心动态:AI模型与产品密集迭代升级 - OpenAI推出全新图像生成模型ChatGPT Images,图像生成速度提升4倍,API价格比前代降低20% [1] - Meta开源音频分割模型SAM Audio,支持文本、视觉和时间跨度提示,在超过1亿条视频上训练,运行速度快于实时处理 [2] - 小米开源大模型MiMo-V2-Flash,总参数3090亿,活跃参数150亿,在SWE-bench Verified得分73.4%超越所有开源模型 [3] - 腾讯混元世界模型1.5开源,支持创建实时交互3D世界,以24FPS速度生成720P高清视频 [4] - 谷歌在Gemini中深度整合Opal工作流,推出Super Gems功能和新工作流构建器 [7] - OpenAI发布专家级科学能力评估基准FrontierScience,包含700余道题目,GPT-5.2在奥赛赛道得分77% [8] 模型性能与技术创新 - ChatGPT Images支持添加、删减、组合、融合等多种编辑,文本渲染能力增强,内置数十种预设滤镜和提示词 [1] - SAM Audio核心引擎PE-AV基于Perception Encoder扩展,实现多模态融合,在多种音频分离任务上达到SOTA水平 [2] - MiMo-V2-Flash采用5比1混合滑动窗口注意力机制,使KV缓存减少近6倍,轻量级多Token预测使推理速度提升2-2.6倍 [3] - 腾讯混元世界模型1.5核心创新包括重构记忆机制实现分钟级几何一致性、Context Forcing蒸馏方案和基于3D的自回归扩散模型强化学习 [4] - Vidu Agent具备分镜级可控力,能保持产品人物场景在15-30秒视频中的一致性,并支持精细化编辑 [5][6] - FrontierScience基准的研究赛道采用基于量规的10分制评估,关注推理步骤正确性,揭示模型存在推理逻辑错误等问题 [8] 商业化与成本策略 - ChatGPT Images功能向所有ChatGPT用户推出,API以GPT Image 1.5形式提供 [1] - MiMo-V2-Flash后训练采用多教师在线策略蒸馏,仅需传统方法1/50算力达到教师性能峰值,API限时免费开放,成本为每百万token输入0.1美元输出0.3美元 [3] - Vidu Agent首推多模态Agent API,为企业提供端到端交付结果,支持上传爆款视频和产品图批量产出同类高质量视频 [5][6] - 谷歌Gemini的新工作流可直接生成可分享链接并公开发布,不再依赖Google Drive权限设置 [7] 行业战略与研发投入 - 原DeepSeek成员罗福莉加入小米并发表演讲,强调AI进化的下个起点是能与物理世界交互的模型,认为真正护城河是科学研究文化与将未知问题转化为可用产品的能力 [9] - 罗福莉提出开源是实现AGI普惠化、确保人类智慧共同进化的唯一路径 [9] - 小米未来五年研发投入预计超2000亿元,2026年预计投入约400亿元 [9]