AGI
搜索文档
“国民级”AI应用追逐升级 蚂蚁CTO详解“灵光”孵化前后
中国经营报· 2025-11-25 21:28
产品发布与用户增长 - 蚂蚁集团全模态通用AI助手“灵光”于2025年11月18日正式发布,上线六天总下载量突破200万[2][3] - “灵光”首次达到百万下载用时4天,第二个百万下载时间压缩至2天,增长速度超过公司预期[2][3] - 截至11月25日下午,“灵光”在苹果App Store中国区免费应用榜单中排名第六,排名前三的应用为豆包、红果短剧及阿里旗下“千问”[2] - “灵光”6天突破200万下载的速度高于ChatGPT首周的60.6万和Claude的15.7万[3] 团队构成与开发背景 - “灵光”项目团队规模约为200人,目前仍为独立的Inclusion AI(普惠AI)项目组[2][3] - 项目于2025年3月正式立项,通过三位一体方式统筹研发、工程和产品[3] - 公司前期技术积累为产品快速发展提供底层支撑,包括蚂小财、AQ等理财和健康AI助手的技术转化[4] 技术架构与产品定位 - “灵光”主对话功能基于蚂蚁自研百灵大模型,同时整合通义千问等多款主流开源模型[2] - 产品定位为技术产品和智能出口,旨在成为AGI领域最普惠的国民级应用[2][4] - 核心目标为打造大规模AGI产品,将放弃部分短期场景和B端场景,延续公司用前沿技术做普惠产品的策略[4] 核心功能特点 - 首批上线三大核心功能:“灵光对话”支持全模态内容包括3D数字模型、图文回答和信息图表[5] - “灵光闪应用”实现30秒快速生成可交互应用的功能,具备多智能体调度和协调能力[5] - 主对话模式天花板和灵活度被评估为依然较高,闪应用功能形成与市场产品的差异化竞争优势[5] 市场竞争格局 - 截至2025年9月国内AI应用月活跃用户前三名为字节豆包(1.72亿)、DeepSeek(1.45亿)、腾讯元宝(3286万)[6] - 公司认为大模型应用仍处于发展早期,类比移动互联网的iPhone4时刻尚未到来[6][7] - 尽管入场时间相对较晚,但参考抖音与快手的竞争案例,市场机会依然存在[6]
意图是 AI 时代的新入口|AGIX PM Notes
海外独角兽· 2025-11-25 20:03
AGIX指数定位与表现 - AGIX指数旨在成为衡量AGI(通用人工智能)科技范式转换的重要指标,如同纳斯达克100指数之于互联网时代,目标捕获AGI时代的beta和alpha收益 [2] - 截至本周,AGIX指数年内上涨19.56%,自2024年以来累计上涨64.68%,显著跑赢QQQ(44.09%)、标普500(38.43%)和道琼斯指数(22.70%)[4] - 指数成分中基础设施板块权重最高达37.34%,应用和半导体硬件板块分别占33.41%和23.98%,本周三大板块均下跌,基础设施板块跌幅最大为2.50% [5] AI时代商业模式变革 - AI时代竞争焦点从互联网时代的"消费意图"转向"完成意图",核心从抢夺眼球入口转变为深究工作流逻辑,起手式从打开应用变为定义或发现意图 [9][10] - 意图识别具有强外部性,聚类后的意图价值应流向用户,平台通过变现聚类意图实现模型迭代,类似Scale AI等数据公司为人类知识意图定价的模式 [11][12] - 高价值意图取决于产品形态,复杂长程任务意图更珍贵,因此收集用户复杂意图的coding agent产品比单一text agent产品更有价值 [12] - AI Native产品价值评估标准应从DAU和停留时长转向"信噪比",如任务完成率、自动拆解步骤和结果采纳率等指标 [13] 上周AI板块市场动态 - 尽管NVDA财报后AI板块出现超过9%的大幅回撤,对冲基金在AI高敞口板块资金流动保持平静,卖出规模未超过1个标准差 [14] - TMT板块整体呈现净买入,高质量AI科技受益股受青睐,半导体和软件行业成为净买入最多板块 [14] - 对冲基金业绩落后基准,全球基金平均下跌80基点,美国多空基金下跌1.1%,AGIX指数下跌5.65% [16] 主要公司AI布局进展 - 微软推出AI智能体安全解决方案Microsoft Agent 365,提供智能体控制平面功能,Defender平台每日分析100万亿威胁信号实现预测性屏蔽 [16] - Alphabet旗下Intrinsic与富士康成立合资公司开发智能机器人系统,结合AI软件与智能制造平台执行复杂制造任务 [17] - 亚马逊Prime Video推出AI生成"视频回顾"功能,利用生成式AI创建影院级质量季度回顾,推动影视AI应用升级 [17] - Cloudian发布基于Nvidia平台的HyperScale AI数据平台,使向量数据库操作比基于CPU方案快8倍,解决80%机构知识存储于非结构化数据的困境 [18] - 甲骨文与微软深化多云合作,在超过30个微软区域部署Oracle AI数据库,支持客户将Oracle工作负载迁移至Azure应用AI服务 [18] - Adobe以19亿美元现金收购Semrush,溢价近一倍,应对AI搜索变革,零售网站来自生成式AI聊天bot流量同比激增1200% [18] - Cloudflare收购AI部署平台Replicate,整合5万多个容器化AI模型,增强Workers AI服务并扩展自定义大语言模型部署能力 [19]
杨震原:2021 年字节团队曾训出大语言模型,但当时 “没眼光”
36氪· 2025-11-25 19:26
公司技术发展历程 - 2014年公司创始人提出使用大规模机器学习系统搭建推荐系统,以解决图片、文字、视频等多种媒体形式的推荐问题,并设定了万亿级别特征规模的激进目标[1][5] - 公司早期在优化算法上进行了多路径探索,包括CDN优化器项目和SGD-FTRL项目,最终SGD-FTRL方案在几个月内成功上线,实现了稀疏化万亿特征的目标[8] - 2014年底公司引入FM类算法,并演化为更通用的深度学习体系,从上线第一天起就是一个流式训练系统[9] 科学计算领域探索 - 2020年左右公司开始探索AI在科学计算领域的应用,认为通过求解薛定谔方程可以模拟世界绝大部分现象,并利用模拟产生有价值数据驱动机器学习进步[10] - 公司在神经网络量子蒙特卡洛方法领域进行投入,2021年后的多项工作已达到业界前沿,其中LAVA项目显示出该问题与大模型一样存在Scaling Law[16] - 公司提出首个能适用于固体体系的NNQMC方法DeepSolid,并用于研究拓扑绝缘体等材料,发现MoTe2二维材料在特定条件下会变为拓扑绝缘体[17] - 在分子动力学领域,公司开发了GPU4PySCF实现GPU加速DFT计算,达到1GPU≈500~1000CPU core的加速效果,算力成本降低1个数量级[20][21] - 公司开发了Bamboo-MLFF和ByteFF两类分子动力学力场,其中ByteFF-Pol在无实验数据zeroshot预测电解液性质上实现业界SOTA精度[21] - 公司与比亚迪成立联合实验室,将高通量自动化实验与科学计算算法结合,探索AI for Science在电池材料领域的工业落地应用[21] XR技术研发进展 - 2021年字节跳动收购Pico团队,最初有两条产品路线并行推进,2023年决定减少内容和营销投入,更坚定地投入技术路线[22] - 在清晰度方面,公司2022年启动MicroOLED定制,目标达到近4000PPI,最终成品平均PPD40,中心区域超过45,达到行业领先水平[24][26][29] - 公司为解决MR技术挑战,2022年6月立项全链路自研头显专用芯片,2024年回片并进入量产阶段,系统延迟可做到12毫秒左右[30][31] - 公司建设了专业的高精度测试系统用于环境识别和交互校准,并开发了专门的3D重建机制与高精度手势数据采集系统[33] - 新的MR产品计划于2026年发布[33] 大模型技术布局 - 公司在2021年曾有机会早期关注大语言模型,但当时评估认为LLM暂无实用价值,2022年ChatGPT发布后公司快速调整并加大投入[1][34] - 目前豆包是中国最流行的AI对话助手,火山引擎的大模型服务根据IDC报告是中国MaaS市场第一名[2][34] - 公司在Infra方面具备积累,大规模稳定训练系统MegaScale在训练任务上MFU超过55%,是当时主流开源框架的1.3倍以上[34] - 公司在模型结构、自研服务器上有很多探索,实现了大模型的低调用成本,能够打破业界价格下限同时保证不错毛利[35] - 公司的GenMedia模型、VLM、语音模型表现良好,长期属于国际一流水平,还在进行Seed Edge等前沿探索[35]
从推荐算法优化到AI4S、Pico和大模型,杨震原长文揭秘字节跳动的技术探索
机器之心· 2025-11-25 17:37
公司技术发展历程 - 2014年公司开始构建大规模机器学习推荐系统,第一版即计划做到万亿级别特征规模 [7] - 2020年左右公司开始探索AI在科学计算领域的应用,认为求解薛定谔方程可模拟世界绝大部分现象 [13] - 2021年公司收购Pico团队进入XR领域,初期有两条产品路线,2023年决定更坚定投入基础技术研发 [27] - 2022年公司开始在大模型方向投入,火山引擎大模型服务已成为中国MaaS市场第一名 [39] 推荐系统技术突破 - 2014年工业界主流大规模机器学习系统用于搜索广告,公司将其原理应用于推荐系统面临工程与算法挑战 [7] - 公司优化器准备两套方案,SGD-FTRL项目数月上线成功实现稀疏化万亿特征目标,框架灵活 [10] - 2014年底公司引入FM类算法并演化成更通用的深度学习体系,上线第一天即为流式训练系统 [11] 科学计算AI应用 - 公司从2020年开始持续投入AI for Science,在神经网络量子蒙特卡洛方法领域已做到业界前沿 [16][19] - 公司发现科学计算问题与大模型一样存在Scaling Law,使用更多参数可提升仿真精度 [19] - 在分子动力学领域,公司开发GPU4PySCF实现GPU加速DFT计算业界SOTA,1GPU算力相当于500-1000CPU核心 [24] - 公司开发的Bamboo-MLFF和ByteFF力场模型在无实验数据zeroshot预测电解液性质上实现业界SOTA精度 [24] - 公司与比亚迪成立联合实验室,将高通量自动化实验与科学计算算法结合,探索AI在电池材料领域工业应用 [25] XR技术研发进展 - 公司为解决XR设备清晰度问题,2022年启动MicroOLED定制,目标达到近4000 PPI,约为iPhone 17 ProMax的九倍 [29][32] - 通过导入微透镜提升亮度并结合光学设计优化,最终成品平均PPD达40,中心区域超过45,处于行业领先水平 [33] - 为应对MR技术挑战,公司自研头显专用消费电子芯片,2024年回片并进入量产,系统延迟可做到12毫秒左右 [34][35] - 公司建设了专业高精度测试系统、3D重建机制与高精度手势数据采集系统,以提升交互体验 [36] - 预计2026年将有新产品发布 [36] 大模型战略与成果 - 火山引擎大模型服务根据IDC报告是中国MaaS市场第一名 [39] - 公司在Infra方面积累深厚,大规模训练系统MegaScale的MFU超过55%,是当时主流开源框架1.3倍以上 [39] - 通过模型结构、自研服务器等探索实现大模型低调用成本,在保证不错毛利前提下打破业界价格下限 [40] - GenMedia模型、VLM、语音模型表现长期处于国际一流水平 [40] - 公司对未来大模型发展提出思考,关注模型持续学习能力、与世界的交互能力等基础问题 [43]
全球半导体:AI 价值链-美国有芯片缺电力,中国有电力缺芯片…… 谁在落地更多算力?-Global Semiconductors_AI Value Chain_The US has chips but no power, China has power_but no chips... Who is actually bringing more compute online
2025-11-25 13:06
涉及的行业与公司 * 全球半导体行业与人工智能计算产业链[1] * 美国与中国在AI算力竞赛中的对比分析[2][14] * 涉及公司:NVIDIA (NVDA)、Broadcom (AVGO)、AMD (AMD)、华为(Ascend 910B芯片)、中科曙光 (688041 CH)、寒武纪 (688256 CH)[9][10][11][12][21] 核心观点与论据 中美AI算力竞赛现状 * 美国及其盟友在2025年将增加超过25 ZFLOPS的AI算力(FP16稀疏),而中国增加不足1 ZFLOPS[3][15] * 预计中国2025年出货约150万颗本土AI芯片(以华为昇腾910B为基准,每颗0.4 PFLOPS),带来0.6 ZFLOPS增量算力,加上进口的NVIDIA/AMD低端芯片(约0.2-0.3 ZFLOPS),总计仍低于1 ZFLOPS[3][15] * 相比之下,约400万颗NVIDIA Blackwell芯片(每颗4.5 PFLOPS)将贡献18 ZFLOPS算力,加上TPU和其他AI ASIC,美国阵营总量至少达25 ZFLOPS[3][15][22] 数据中心与电力投资差距 * 中国2025年总电力产能增加超过500 GW,远超美国的约30 GW,但2024年数据中心电力负载增加仅为3.9 GW,低于美国的5.3 GW[4][19][27] * 中国云服务提供商(CSP)在AI投资上更为保守,预计2025年AI资本支出约为900亿美元,仅为美国/欧洲超大规模云服务商约4000亿美元资本支出的20%[4][19][29][31] 半导体制造能力瓶颈 * 中国占全球半导体晶圆总产能的约30%,但主要集中在落后制程/模拟/分立器件,逻辑芯片产能份额仅为约20%[5][19][35][37] * 在关键的7nm及以下先进制程产能中,中国仅占7%(超过50%位于台湾),且因设备出口管制,其7nm产能可能通过14nm设备多重曝光实现,存在产能和良率问题[5][19][40] * 中国先进逻辑芯片的实际产出份额远低于产能份额,导致AI芯片产出差距比逻辑产能差距更大[19] 未来展望与地缘政治影响 * 即使中国7nm等效AI芯片出货量以100%的年复合增长率增长至2030年,算力也仅达到19 ZFLOPS,仍低于美国当前水平[6][18] * 美国在芯片和电力上实际也依赖盟友(如韩国、台湾),这解释了美国对华AI和半导体设备禁令的合理性,并推动了美国本土化制造努力[7][20] * 美国在AI领域的领先可能加剧紧张局势,中国或因感到压力而采取更激进行动(如台湾问题)[7][20] 其他重要内容 投资建议 * NVIDIA(优于大市,目标价275美元):数据中心机会巨大且仍处早期阶段[10] * Broadcom(优于大市,目标价400美元):2025年AI增长轨迹强劲,软件、现金部署及利润率支撑增长[10] * AMD(与大市持平,目标价200美元):AI预期高,与OpenAI的新协议可能推动增长[10] * 中科曙光(优于大市,目标价220元人民币)[11] * 寒武纪(与大市持平,目标价1100元人民币)[12] 性能与能效差异 * 华为昇腾910B芯片的能效为1.33 TFLOPS/W,而NVIDIA Blackwell芯片为3.75 TFLOPS/W[21] * 中国领先芯片在性能/功耗上落后于美国领先芯片,进一步拉大了实际算力差距[19][21]
蚂蚁另起炉灶,「灵光」向外求AI to C入口
36氪· 2025-11-25 10:24
产品发布与市场表现 - 蚂蚁集团于11月18日高调上线全模态通用AI助手“灵光”App [1] - 灵光上线首周表现亮眼,6天突破200万下载量,突破100万下载量仅用4天,速度快于Sora的5天 [1] - 阿里巴巴另一款AI to C产品“千问”App一周内应用下载量已突破1000万次,App Store中国区免费榜Top6中阿里系AI产品已占据两席 [1] 产品定位与核心功能 - 灵光定位“普惠”,明确放弃主流“陪聊”功能,专注于提升信息获取与处理效率 [2] - 产品理念是利用大模型能力帮助用户完成信息的总结、归纳和推理 [2] - 首批上线三大核心功能:灵光对话(生成含3D模型、动态图表的多模态内容)、“闪应用”(用自然语言30秒生成可交互应用)、“开眼”(提供视觉交互入口) [2] - 该技术路线对模型代码能力与工程优化要求极高,代码量是纯文本的5-6倍 [3] 公司战略与行业背景 - 蚂蚁集团此次推出独立AI应用,而非将其作为新功能塞入支付宝,意在支付宝之外“另起炉灶”,寻找新的用户入口 [7][8] - 行业竞争激烈,DeepSeek、豆包、文言以及同门的夸克、千问等均在争夺AI to C入口 [4] - 蚂蚁集团CTO何征宇表示公司目标是做一款国民级应用,DeepSeek的火爆推动了公司的焦虑和内部资源的快速集结 [5] - 公司形成新的组合打法,既挖掘自身生态潜力(如蚂小财、AQ),也开始在更广阔的AI to C赛场布局 [13] 挑战与未来展望 - 灵光上线仅两天,“闪应用”功能因流量过大而“被挤爆” [4] - 支付宝作为超级流量入口,长期面临用户“用完即走”、难以高频使用的困境,削弱了用户连接 [12] - AI to C入口的成功关键在于能否真正唤起用户的“消费”热情,形成使用习惯,而非仅靠技术或概念 [14] - 百万级下载量只是开始,真正的挑战在于用户留存和活跃度,这是支付宝一直试图解决的老问题 [14]
企业AI落地,还差一口“气儿”
36氪· 2025-11-25 08:31
行业共识与核心目标 - 人工智能未来发展最重要的目标是实现通用人工智能(AGI),这是科学、战略和各国经济上的科技高地[1][3] - 行业关注方向已从技术本身转向AI大模型真正面向产业的落地应用,“场景驱动”是AI从技术革命走向产业革命的关键跃点[3] - AI下一个十年不是比谁的模型更大,而是比谁能把技术扎进产业里[17] 企业级AI应用现状 - 当前已有43%的企业部门或岗位进入规模化使用AI阶段,27%仍处在试点期,28%实现了广泛渗透,还有1.9%尚未确定是否应用[5] - AI在企业内部落地更多从营销、客服、研发等边缘业务推进,很难应用到企业管理和中台等核心业务场景[6] - 企业级AI落地现状呈现“一半是海水,一半是火焰”的分化局面,很多传统企业推进AI业务整体进展相对缓慢[4][6] AI落地面临的主要挑战 - 大模型真实落地效果未达企业预期,核心问题在于AI的准确率,客户习惯“零误差”交付标准但AI本质是概率性模型[8] - 企业决策层对AI无限期待与技术团队现实困境存在认知错位,导致AI项目目标模糊或急于求成[9][11] - 数据、组织、技术协同构成三重壁垒,数据流通难、跨部门协同阻力大、技术适配“最后一公里”棘手[14][15] - AI技术迭代太快,今天先进的方案明天可能落后,不确定性让企业不敢大规模投入[11] 成功企业的实践策略 - 新希望集团采取“有节奏的all in”策略,去年试点100多个场景,今年聚焦AI+管理、AI+运营、AI+业务创新三条路线[19] - 中数睿智聚焦工业、能源、国防等技术难度大、战略价值高的领域,通过多智能体协同自进化技术实现全流程调控[17] - 帆软不做行业大模型,而是用最强通用大模型通过上下文工程让其更懂企业业务[22] - 中数睿智通过“基础设施层、能力支撑层、应用构建层、场景应用层”全链贯通,实现大型项目几周内落地,客单价达数百万到千万级别[23] 推动AI落地的关键路径 - 认知层面要“先试点后推广”,从重复劳动多、痛点明确的场景入手,通过小范围成功案例建立信心[21] - 技术层面要“不贪大求全,聚焦核心能力”,企业不必非要自己训练大模型[21] - 生态层面要“开放协同,破解资源壁垒”,通过政府引导建立脱敏数据共享机制,加强产学研协同[24][25] - AI落地需要长期主义,新希望“AI+全链节粮”计划目标是每年节省1%的饲料,体现AI与产业知识深度融合[19]
腾讯研究院AI速递 20251125
腾讯研究院· 2025-11-25 00:14
生成式AI技术进展 - 谷歌发布嵌套学习新机器学习范式,将模型视为一组嵌套的优化问题以减轻灾难性遗忘 [1] - 该方法通过关联记忆、更新频率分层和优化器即记忆模块实现早期层高频刷新、后期层低频整合的新训练框架 [1] - 基于此推出的HOPE模型在语言建模困惑度和常识推理准确率上表现最优,在长上下文任务中展现卓越内存管理能力 [1] OpenAI竞争动态 - OpenAI内部备忘录显示奥特曼承认谷歌近期AI进展可能给公司带来暂时经济阻力 [2] - OpenAI研究员已知晓谷歌开发了超越Gemini 3的模型,奥特曼间接承认开始落后谷歌 [2] - OpenAI或将在未来几个月推出代号"Shallotpeat"的新模型,专门修复预训练过程中的错误以追赶谷歌 [2] AI应用产品更新 - 设计Agent Lovart正式接入Nano Banana Pro,支持一次性处理14张图片元素并生成专业级设计成品和视频 [3] - Lovart推出Touch Edit功能,通过简单点击即可精准修改细节,还支持"编辑元素"功能将图片分层可编辑 [3] - 北大哲学博士刘耕创办Elser.AI,这款AI短剧生成Agent在无宣传情况下积累了20万全球活跃用户 [5] - Elser.AI支持从剧本到分镜到成片的全流程创作,用户可控制角色形象、构图景深、运镜动作等所有细节 [5] 行业标准与交互范式 - MCP社区由OpenAI和Anthropic核心维护者联手推出MCP Apps提案,规范对交互式用户界面的支持 [4] - 该提案引入拼接轨迹图、状态转移场和预先声明的资源技术,使MCP服务器能直接提供可视化操作界面 [4] - MCP Apps基于MCP-UI和OpenAI Apps SDK,已被Postman、Shopify、Hugging Face等公司采用 [4] AI科研突破 - 陶哲轩使用Gemini Deep Think十分钟完成了Erdős 367号问题的证明补全,该问题涉及连续整数结构的乘法数论 [7] - 近期Erdős问题网站上陆续有6个困扰数学界多年的难题通过AI辅助方法得以解决 [7] 跨平台兼容与技术落地 - Google宣布Pixel 10系列正式支持原生AirDrop能力,可直接向iPhone隔空投送照片及文件 [8] - 香港科技大学团队实现全球首个能在真实场景中完成篮球动作的机器人demo,使用宇树G1完成三步上篮等技能 [9] - 该成果基于SkillMimic-V2技术,通过拼接轨迹图、状态转移场等创新在低质量数据条件下训练出复杂交互策略 [9] 行业领袖观点 - DeepMind CEO表示谷歌AI叙事正从"奋力追赶"转变为"处于领先地位",Gemini 3在"人类终极考试"得分从21.6%飙升至37.5% [10] - 预测通往AGI还需5-10年及一两个重大突破,目前扩展定律仍有效但存在边际效用递减 [10] - 认为种子轮投资可能存在泡沫,但在应用层和前沿科技领域蕴含巨大真实价值 [10]
MiniMax 和月之暗面:中国 AI 创业公司的两种路径和共同难题
晚点LatePost· 2025-11-24 19:11
核心观点 - 一时的技术成果或用户增长难以成为AI公司的持久竞争优势 公司需要建立能持续产生技术和用户增长的组织能力[5] - 在资本密集、巨头林立的竞争环境中 创业公司需要证明其长期独立存在的价值 这需要技术突破和维持高密度研究团队的罕见能力[26] 公司发展历程与融资 - 月之暗面起步融资遇挫 后在红杉、真格等机构投资下于2023年上半年完成首笔融资[11] 2023年底再融资时获阿里投资近8亿美元 估值达23.4亿美元[13] - MiniMax首轮融资由高瓴领投2000万美元 投后估值2亿美元[8] 同期获阿里投资6亿美元资源 估值超过月之暗面[13] - 两家公司2024年初融资合计超14亿美元(约100亿元人民币) 超过中国大模型创投领域上一年公开融资总额[13] 产品与技术突破 - MiniMax早期产品Glow上线4个月注册用户超500万[12] 近期开源模型M2在部分测评中位列全球开源模型第一[4] 其视频生成模型宣称在一些场景超过Google的Veo3[4] - 月之暗面产品Kimi上线后连续数月月活用户环比增长超100%[12] 近期发布的开源MoE模型K2宣称部分基准测试得分超过GPT-5[4] 其K2 Thinking模型在自主编程等维度超过DeepSeek-V3和阿里Qwen3[20] 创始人风格与管理策略 - 闫俊杰崇尚系统理性 将公司视为可优化函数 管理核心是找到梯度下降最快方向[23] 敢于决断并接受冲突 创业初期即叫停与长期技术路线不符的3D数字人项目[21] - 杨植麟相信人才力量 公司核心产品Kimi以其英文名命名[5] 看重共识驱动 愿为招揽技术人才从北京飞深圳聊十小时[23] 倾向于先达成共识再迅速行动[24] 竞争环境与挑战 - 字节跳动发动饱和式进攻 产品线覆盖全面 并严格控制外部AI产品在抖音投放[19] 豆包等字节系产品享受投放折扣[19] - 两家公司估值约40亿美元 远低于OpenAI的5000亿美元、xAI和Anthropic的近2000亿美元估值[25] 面临巨头阿里、字节、腾讯等拥有主营业务供血的竞争[25] - 早期增长吸引大额投资后 MiniMax陷入多条产品线并进的纠结 月之暗面视频模型效果未达预期 出海产品Ohai和Noisee停止运营[15]
阿里AI猛补课,蚂蚁的“灵光”灵不灵?
36氪· 2025-11-24 18:20
产品发布与市场表现 - 蚂蚁集团于11月19日正式推出全新AI应用“灵光”,定位为“全代码生成多模态内容”AI助手,其回复可交付为可交互的网页,包含图文、3D模型、动画、地图、表格、音视频等全模态内容[1] - 阿里于11月18日将旗下AI To C应用翻新整合,以“千问”App形式重新推出,与“灵光”的发布仅相隔一天,标志着公司在AI To C市场开始快速“补课”并全力出击[4] - “灵光”上线后至发稿时下载量已超100万,位列App Store总榜第6位,其破百万下载量的速度已超越近期现象级AI应用Sora2(后者用时5天)[4] 产品定位与核心功能差异 - “千问”基于阿里旗舰模型Qwen构建,定位为展现模型实力的出口,擅长处理通用知识问答、长文本写作和复杂逻辑推理任务[6] - “灵光”更侧重移动端交互创新,核心差异在于信息展现形式,其目标不是通用助手入口或陪伴功能,而是定位为效率工具[6] - “灵光”核心功能包括“灵光对话”(生成多模态内容)、“灵光闪应用”(用户输入自然语言可在30秒内生成可编辑、可交互的小应用)和“灵光开眼”(通过图片识别理解内容并提供信息或执行操作)[1][4] 技术路径与工程挑战 - 相比纯文本输出,生成代码的膨胀率约为5-6倍,例如对一个15字指令生成可交互组件,所需代码量可达几十甚至上百字符,这对计算资源、性能稳定性和工程实现提出高要求[10] - 技术难度体现在需要代码生成、精准推理、工具调用、数学能力及深度理解用户意图等多方面综合能力,公司内部将“灵光”定义为在技术最不稳定边界上建立的产品[11] - 产品特色在于可直接在移动端生成并运行应用成品,工程难度更高,公司选择聚焦可长期积累、可复用的模块化迭代,以便在基础模型升级时优化能叠加而非推倒重来[11][14][15] 公司战略与行业背景 - 公司采取多方向押注策略,不将资源集中于单一方向,以应对模型能力快速变换的不确定性,如同在沙漠中多路找水[5] - DeepSeek R1的发布是公司决定全力投入AGI的转折点,其以较小资源投入实现AGI给予公司极大信心,促使公司反思并整合技术积累以直接向用户传递价值[12] - 公司战略不意在争夺AI通用助手入口,而是聚焦细分方向:强化编码能力与全模态内容生成,定位效率工具,旨在做AGI时代的“二维码”,以最小成本找到新技术与市场的契合点[13][15]