Workflow
Software and Internet
icon
搜索文档
Microsoft Spending on Anthropic Approaches $500 Million a Year
PYMNTS.com· 2026-01-15 02:27
微软对Anthropic的投入与合作深化 - 微软已成为Anthropic的主要客户之一 预计每年将花费约5亿美元在其产品中使用Anthropic的人工智能技术 [2] - 微软已告知其Azure云业务的销售人员 向云客户销售Anthropic AI模型将计入其销售目标 这与销售微软自有软件待遇相同 [3] - 微软为销售OpenAI产品提供了相同的激励措施 这意味着销售人员销售Anthropic模型与其主要竞争对手的产品具有同等动力 [3] 微软对AI公司的投资与股权结构 - 微软在2023年9月决定向Anthropic进行高达50亿美元的投资 [4] - 微软已向OpenAI投资超过130亿美元 获得了该初创公司27%的股份 [4] - OpenAI在2023年10月将其营利部门转变为公益公司 此安排使微软持有该部门27%的股份 估值约为1350亿美元 [5] 微软AI业务的商业模式与收入分成 - 微软在向Azure客户销售OpenAI模型时保留80%的销售收入 [4] - 微软在销售Anthropic的AI模型时保留的收入分成比例较小 [4] - 微软增加向云客户销售Anthropic AI模型的关注度 这可能为两家公司带来更多收入 [2] 微软在零售业的AI战略布局 - 公司推出了新的智能体AI能力 旨在通过增强人类决策来帮助零售商更快行动 更高效率运营并以更相关的方式吸引购物者 [6] - 该方法侧重于将传统上分散的功能(商品销售、市场营销、门店运营和履约)连接成协调的工作流程 以预测需求并实时行动 [6] - 这一转变反映了行业内更广泛的趋势 即转向为速度、韧性和规模而创建的智能驱动零售运营模式 [7] - 这表明公司正在将AI“更深地推入零售运营” 将智能自动化定位为整个零售价值链的统一层 [7]
Alphabet further strengthens Gemini, giving it access to other Google apps (GOOG:NASDAQ)
Seeking Alpha· 2026-01-15 01:40
公司战略与产品更新 - Alphabet旗下谷歌于周三采取进一步措施加强其Gemini人工智能工具 使其能够访问用户的其他谷歌应用 包括YouTube和Gmail [2] - 这项名为“个人智能”的措施旨在“个性化”Gemini 使其变得“特别有帮助” [2]
让AI当「动作导演」:腾讯混元动作大模型开源,听懂模糊指令,生成高质量3D角色动画
量子位· 2026-01-14 19:19
行业背景与痛点 - 3D角色动画创作领域长期面临高质量动作资产匮乏的制约,游戏、动漫、影视与数字人等产业面临高昂的成本困局,专业动捕采集起步价为数万元,动画师手工精修骨骼动画以“天”为单位 [1] - 生成式AI领域的文生动作(Text-to-Motion)因高质量数据稀缺与计算范式局限,长期处于“小模型”阶段,难以根据复杂的自然语言指令生成正确动作 [1] - 部分研究尝试通过大语言模型扩展词表进行动作生成,模型规模得以扩大,但由于采用离散的动作Tokenizer,生成的动作质量往往不理想 [1] 核心解决方案与发布 - 腾讯混元团队借鉴其在视频生成大模型上的成功经验,提出了一套全新的文生动作解决方案,旨在突破当前瓶颈 [2] - 该方案通过构建严格的数据处理与标注管线,覆盖大规模预训练、高质量精调、强化学习对齐的全阶段训练流程,并将Diffusion Transformer模型扩展至10亿级别参数量 [2] - 成功研发了混元Motion 1.0这一业界领先的动作生成基础模型,并于2025年12月30日对外开源 [2] - 核心思路是将动作生成任务从“手工作坊”式训练升级为“现代化工业”级别的大模型构建范式,在规模上实现里程碑式突破,并通过全链路算法创新确立新的技术范式 [2] 核心技术:数据引擎 - 构建了标准化的数据处理管线,沉淀出总计超过3000小时的动作数据,以支持10亿参数模型的性能 [4] - 整合了单目视频动捕、光学动捕及艺术家手K动画资产等多源数据,以平衡模型的泛化能力与生成质量 [6] - 通过自动化工具进行数据清洗与标准化,将所有异构数据统一重定向至一套标准骨骼,剔除异常片段,最终统一为30fps对齐的切片数据 [6] - 采用“渲染→VLM初标→人工校验→LLM结构化扩写”的标注闭环流程,利用视频多模态模型捕获语义,结合人工修正,最后通过LLM进行描述多样性扩充 [6] - 数据覆盖基础移动、日常生活、社交休闲、健身户外、体育竞技、游戏角色动作6大领域,超过200个细分动作类别 [6] 核心技术:生成管线 - 设计专门的LLM Prompt Engineering模块,用于用户Prompt改写及动作时长估计,充当“动作导演”角色 [7] - 构建了包含{用户指令,优化指令,动作时长}的三元组数据集,利用Gemini-2.5-Pro模拟海量真实、模糊的用户Prompt,并与高质量描述及真实时长进行精准对齐 [7] - 采用两阶段微调:SFT阶段基于Qwen3-30B-A3B进行微调,使模型具备将多语言模糊指令转化为“结构化英文描述+精确时长”的能力;GRPO强化学习阶段引入Qwen3-235B作为奖励模型,从“语义一致性”与“时序合理性”维度进行打分优化 [7] - Prompt Engineering模块最终将用户的中文或模糊指令转化为“英文动作描述+精确时长”,显著提升生成的可控性 [8] 核心技术:模型设计 - 核心生成架构采用Diffusion Transformer结合Flow Matching [10] - 模型结构采用“双流→单流”的混合架构,在双流阶段动作Latent和文本Token独立处理并通过self-attention交互,在单流阶段两者拼接为统一序列进行深度多模态融合 [12] - 针对长序列生成中的逻辑崩坏与动力学断裂,通过“语义防污染”与“局部约束”双管齐下,确保动作演进既符合指令逻辑又满足物理连续性 [12] 核心技术:全流程训练 - 将LLM领域的RLHF范式完整迁移到动作生成中,完整跑通“Pre-train->SFT->RLHF”三阶段训练 [13] - 大规模预训练阶段:在3000小时全量数据上进行,让模型学会各种动作的基本范式 [15] - 精细化微调阶段:筛选400小时的精标高质量数据进行微调,显著减少动作抖动和滑步,提升画质 [15] - 强化学习阶段:采用“DPO + Flow-GRPO”策略,并引入非对称掩码机制与窗口注意力机制 [15] - DPO阶段基于超过9千对偏好数据,通过最大化优胜样本似然差,解决“动作像不像”的审美对齐问题,大幅提升生成Pass Rate [16] - GRPO阶段引入包含语义一致性与物理约束的奖励函数,强化动作的物理真实感 [16] 模型性能表现 - 得益于参数规模及数据质量提升,HY-Motion 1.0在SSAE(语义结构自动评测)指标上达到78.6%,指令遵循能力远超SOTA模型 [17] - 在人工5档打分中,HY-Motion 1.0在多个类别及平均分上均领先于MoMask、GoToZero、DART、LoM等对比模型,平均分达到3.43 [18] - 模型在复杂时序逻辑(如“行走中突然停下惊恐环顾”、“跑酷跳跃后翻滚”)、动作覆盖度(如“跳舞扭胯”、“张弓搭箭”)及细粒度控制(如“顺时针绕圈行走”、“举右手挥手同时左手插口袋”)等维度上均有实测表现展示 [19][21][22][23][24][25] 社区反响与应用 - 自开源发布以来,HY-Motion 1.0在各平台热度持续上升 [26] - 游戏开发者、AI设计师、动画师、影视/广告创意导演等相关从业者纷纷投入使用并分享实测效果 [27] - 游戏开发者将其集成至ComfyUI等主流AI工作流中,实现3D动作资产的“即插即用”;社区涌现一系列自动化重定向脚本与工具,支持将生成动作一键映射至用户自定义角色 [27][29][31] - 有开发者尝试将模型输出作为视频生成模型的控制信号,使生成的动作更可控和可编辑 [31][33] 行业影响与展望 - HY-Motion 1.0的研发模式依托腾讯在游戏、数字内容等领域深厚的业务场景,真实且高标准的落地需求驱动模型在视觉美感与工业精度上不断对齐 [33] - 对社区及个人创作者而言,该模型使其在缺乏高昂动捕设备的情况下,依然能产出高质量动作资产,为产业上下游提供了更具性价比的AI解决方案 [33] - 当前的3D动作生成模型仍面临滑步处理、极端物理交互等行业性难题 [34] - 腾讯选择将核心能力开源,旨在通过技术普惠激发社区共建力量,在真实产业应用中迭代,共同推动3D角色动画制作从“手工精修”向“智能生成”的范式转型 [34]
苹果将基于谷歌Gemini模型等推出新版Siri
证券日报· 2026-01-14 00:49
苹果与谷歌达成AI合作协议 - 苹果与谷歌宣布达成多年期合作协议 苹果下一代基础模型将直接采用谷歌Gemini模型及Google Cloud基础设施 首批落地场景为预计2026年晚些时候推出的新版Siri [1] - 消息公布后 谷歌美股股价当日上涨1.09% 收于332.73美元/股 市值首次突破4万亿美元 [1] - 苹果方面表示 谷歌的技术为苹果基础模型提供了最强大的支撑 [2] 双方合作历史与AI战略调整 - 苹果与谷歌的合作可追溯至2002年 Safari首次把谷歌设为默认搜索引擎 2005年升级为收入分成协议 谷歌以广告分成换得独家默认席位 [3] - 自2014年起 谷歌每年向苹果支付约200亿美元 占苹果服务收入近两成 成为其搜索广告的核心流量入口 [3] - 人工智能层面的谈判早在2025年8月浮出水面 苹果拟每年掏10亿美元换取Gemini AI对Siri的底层赋能 11月进一步传出消息 新版Siri锁定2026年春季发布 [3] - 此次合作标志着苹果AI战略的重大调整 转而采用借力外部技术、叠加自有体验的路径 即在第三方AI能力之上构建独特的苹果层 [3] - 苹果公开强调 与OpenAI的现有协议不变 行业分析师认为 苹果刻意搭建多模型供应商架构 意在分散风险 避免单点依赖 [3] - ChatGPT目前仍留在苹果生态内 负责知识型与生成式查询 Gemini则下沉到内核层 承担更基础的模型推理 [3] 苹果在华市场面临挑战 - 2025财年第四财季(截至2025年9月底) 苹果大中华区营收为144.93亿美元 同比下降3.6% 成为全球唯一出现负增长的区域 [4] - 本土品牌凭借高性价比产品 不断挤压苹果份额 同时在当前消费者高度关注的人工智能功能方面 苹果相比中国竞争对手尚未形成明显优势 [4] - 2025年12月 字节跳动与中兴努比亚联合推出的豆包AI手机引发空前热度 官方定价3499元 发售价为4089元 初期溢价590元 其二手一度较发售价溢价超3000元 [4] - 2026年春季新版Siri的落地效果 将成为检验苹果AI战略成败的关键试金石 [4]
Apple: Trapped Between Google & A Hard AI Phase (NASDAQ:AAPL)
Seeking Alpha· 2026-01-13 20:43
苹果公司人工智能战略更新 - 苹果公司正式宣布其备受期待的语音助手Siri的重大更新 [1] - 苹果公司选择谷歌母公司Alphabet的生成式人工智能模型Gemini来为Siri提供技术支持 [1] 分析师背景 - 分析师Uttam专注于科技领域的成长型股票研究 [1] - 其研究重点覆盖半导体、人工智能和云软件等关键行业 [1] - 研究范围还包括医疗科技、国防科技和可再生能源等其他领域 [1] - 分析师曾在硅谷工作 领导过包括苹果和谷歌在内的全球最大科技公司的团队 [1]
Apple selects Google’s Gemini models for Siri upgrade
Yahoo Finance· 2026-01-13 18:43
核心合作与战略布局 - 苹果公司将于今年晚些时候在其Siri语音助手中整合谷歌的Gemini AI模型 双方达成了一项新的长期协议[1] - 此举强化了苹果与谷歌母公司Alphabet之间的合作关系 并扩大了Alphabet在生成式AI领域的影响力[1] - 该协议达成之际 Alphabet正与OpenAI竞争以影响苹果的AI功能[1] 技术整合与功能提升 - 此次整合将使Siri能够直接在iPhone上处理更复杂的查询 同时增强个人上下文理解和屏幕内容识别能力[2] - 苹果智能系统将继续在苹果设备和私有云计算上运行 并维持其行业领先的隐私标准[3] - 整合前 苹果已于2024年底在其设备中增加了ChatGPT集成 使Siri能够利用该聊天机器人的功能 当时苹果表示对ChatGPT集成不会有重大改变[6] 市场影响与覆盖范围 - Alphabet的技术已支持三星的Galaxy AI 但与苹果的新合作将其技术覆盖范围扩展至全球超过20亿台活跃设备[3] - 此次合作的具体财务细节尚未披露[2] Gemini AI模型技术细节 - Gemini 3 Flash是谷歌Gemini系列的最新模型 于2025年12月推出 现已成为Gemini应用和谷歌搜索AI功能的默认模型[4] - 该模型支持高级推理 性能接近实时 其推理能力可与Gemini 3 Pro和GPT-5.2等更大模型相媲美[4] - Gemini 3 Flash的运行速度约为Gemini 2.5 Pro的三倍 且更具成本效益 它能同时处理来自文本、图像、音频、视频和代码等多种格式的输入[5] - 该模型支持交互式应用开发 并能以最小延迟管理涉及多个步骤的技术任务[5] - Gemini 3系列于2025年11月开始推出 包含多个变体 Gemini 3 Pro专为高级推理、数学和编程任务而设计[5] - 另一个版本Deep Think面向Ultra订阅者提供 采用迭代规划处理复杂的科学和分析工作 Nano Banana Pro则专为该系列的图像生成而设计[6]
It's Official: Apple and Alphabet Are Teaming Up for an AI-Powered Siri. Why This Is a Win for Both Companies.
The Motley Fool· 2026-01-13 14:03
合作概述 - 苹果与Alphabet于1月12日宣布达成一项多年期合作,将把Alphabet的Gemini模型引入下一代Siri,目标是今年推出“更具个性化的Siri” [1] - 此次合作表明,苹果愿意与长期竞争对手合作,以加速其设备功能的开发 [1] - 对于Alphabet而言,这是将Gemini置于日常消费者行为中心的罕见机会,而不仅限于其自身的Google应用和服务 [1] 苹果公司的获益 - 苹果下一代基础模型将基于Alphabet的Gemini模型及其云技术,这意味着苹果将使用谷歌的Gemini AI作为未来Apple Intelligence功能(包括Siri升级)的核心引擎 [3] - 苹果在声明中表示,“苹果确定谷歌的AI技术为苹果基础模型提供了最强大的基础”,这显示苹果认为Gemini是提升其设备AI功能的最佳途径 [4] - 苹果智能(Apple Intelligence)将继续在苹果设备和私有云计算(Private Cloud Compute)上运行,以维护其品牌所重视的隐私与安全 [5] - 更智能的Siri将使苹果整体的硬件、软件和服务生态系统更有用,有望推动更多设备升级,并可能助力其高利润的服务业务增长 [6] Alphabet公司的获益 - 此次合作为Alphabet带来了分销渠道和信誉的双重胜利,Gemini将默认内置在苹果设备中,而不仅限于通过谷歌应用与之交互的用户 [7] - 苹果活跃设备的装机量超过22亿台,此次合作为Gemini带来了巨大的用户基础,有助于维持其在AI领域的强劲发展势头 [7] - 苹果选择Gemini而非其他模型,是对其能力的有力证明 [7] - 双方在搜索领域的默认合作历史悠久(谷歌是iPhone和此前Mac的默认搜索引擎),此次AI合作有望为双方带来类似的互利效果 [8][9] 财务与战略背景 - 苹果当前股价为260.22美元,市值达3.8万亿美元,日交易量150万股 [10] - Alphabet在最近一次财报电话会议中表示,预计2025年资本支出在910亿至930亿美元之间,并且明年资本支出将大幅增加,因为支持AI的云计算是资本高度密集型的业务 [10] - 苹果将核心用户体验与外部AI提供商绑定,可能会限制其产品差异化的能力 [11] - 总体而言,该协议为苹果提供了通往强大Siri和增强版Apple Intelligence体验的快速路线图,使其能专注于自身擅长的用户体验领域;Alphabet则为Gemini获得了更广泛的分销渠道和来自全球最重要科技公司之一的信任票 [12]
刚刚,苹果官宣 iPhone 将搭载最强 AI,马斯克第一个跳出来骂
36氪· 2026-01-13 07:56
合作核心内容 - 苹果与谷歌达成多年深度合作协议,下一代“苹果基础模型”将直接基于谷歌的Gemini模型和云技术构建[1] - 基于Gemini模型彻底重造的Siri将于今年晚些时候推出,Apple Intelligence将在设备端或通过“私有云计算”运行以保护隐私[3] - 谷歌的Gemini将成为苹果设备的“默认智能层”,而OpenAI则退居“辅助角色”[5] - 国行版AI Siri预计不会使用Gemini,可能与国内本土厂商合作或使用自研模型特别版本[5][21] 合作背景与动因 - 苹果在AI大模型技术上存在短板,其现有模型参数为1500亿,而谷歌提供的Gemini模型拥有1.2万亿参数[8] - 苹果AI团队面临严重人才流失,自去年7月至今已有约数十名核心成员跳槽,包括团队负责人被Meta以2亿美元挖走[8][10] - 苹果的保密文化、算力资源起步较晚以及因隐私政策限制导致的训练数据相对匮乏,制约了其大模型研发进度[10] - 苹果需要时间弥补技术差距,选择与谷歌合作是为了获得一条现成的“捷径”,以提升按时交付新版Siri功能的概率[6][19] 谷歌的优势与选择原因 - 谷歌的Gemini 2.5 Pro在大多数大模型排行榜上名列前茅,技术实力强大[11] - 谷歌AI团队每月处理的Tokens用量达到1.3千万亿,算力消耗创行业历史纪录[13] - 根据SimilarWeb数据,Gemini全球网页端流量份额在1月份首次突破20%,而ChatGPT份额从86%跌至64.5%[13] - 谷歌拥有全球顶尖的云计算基础设施和工程团队,能支撑Siri每日海量请求[15] - 苹果与谷歌有长期合作历史与信任基础,例如Safari每年支付超200亿美元的搜索引擎协议[16] - 谷歌在协议中做出妥协,同意Gemini模型运行在苹果的“私有云计算”服务器上,用户数据不接触谷歌系统[18] 交易细节与市场影响 - 根据此前爆料,苹果计划每年支付约10亿美元来使用谷歌的AI技术[6] - 消息公布后,苹果和谷歌股价一度双双上涨,Alphabet市值直接突破4万亿美元大关[3] - 马斯克批评此合作导致谷歌权力过度集中,因其已拥有Android和Chrome[4] 技术整合与产品策略 - 新版Siri采用模块化设计,设备端小模型负责简单任务,云端大模型负责复杂推理,天然支持“插拔式”模型切换[21] - Gemini预计将负责Siri中的摘要器和任务规划等核心功能,其他功能仍由苹果自家模型处理,形成“双轨并行”策略[19] - 此次合作被视为苹果用资本和生态壁垒换取宝贵的“时间窗口”,以提振iPhone销量并保住Apple Intelligence的口碑[23]
美股异动|谷歌A收涨1%,市值突破4万亿美元
格隆汇APP· 2026-01-13 06:55
公司股价与市场表现 - 谷歌A类股(GOOGL.US)于1月12日收盘上涨1.00%,收报331.860美元,盘后交易中进一步上涨0.25%至332.700美元 [1][2] - 当日股票成交额高达111.32亿美元,成交量达3380.56万股 [1][2] - 公司总市值突破4万亿美元,流通市值约为3.63万亿美元,总股本为120.67亿股 [1][2] 公司估值与交易数据 - 公司股票市盈率(TTM)为32.76倍,市销率(静)为41.28倍,市净率为10.351倍 [2] - 当日股价振幅为2.75%,换手率为0.31%,52周股价区间为140.143美元至334.040美元 [2] - 股票历史最高价为334.040美元,股息率(TTM)为0.250% [2] 行业合作与战略发展 - 苹果公司计划与谷歌达成一项为期多年的合作,旨在为苹果今年晚些时候推出的Siri等产品的人工智能功能提供技术支持 [1] - 此次合作将借助谷歌的Gemini模型和云技术,以助力苹果开发未来的基础模型 [1]
Apple Picks Google Gemini to Power Siri
CNET· 2026-01-13 03:21
核心交易与合作 - 苹果公司选择谷歌的Gemini作为其下一代Siri的底层技术 双方于周一发布联合声明 新版Siri预计今年晚些时候推出[1] - 该交易结束了数月来的市场传闻 此前有报道称苹果将选择Gemini而非OpenAI的ChatGPT来升级Siri[1] - 根据去年11月的一份报告 苹果公司每年将向谷歌支付10亿美元以获取其人工智能技术能力[1] 技术选择与战略考量 - 苹果公司经过评估 认为谷歌的人工智能技术为其基础模型提供了最强大的基础 并期待其为苹果用户带来创新的新体验[2] - 苹果智能(Apple Intelligence)将继续在苹果设备和私有云计算上运行 同时保持苹果行业领先的隐私标准[2] - 尽管苹果是全球最具价值的公司之一 但它在人工智能竞赛中处于落后地位 报道称其自研基础模型的进展并不顺利[4] 市场竞争与行业影响 - 谷歌去年11月发布的Gemini 3模型产生了巨大影响 据报道这使得OpenAI进入了“红色警戒”状态[1] - 此前 苹果曾与OpenAI合作 为其“苹果智能”提供技术支持 但即使有Siri的更新 苹果的AI助手最初也未达预期 尽管后来被证明更有用[4] 财务关系与反垄断背景 - 苹果与谷歌的交易进一步加深了两家美国科技巨头之间已达数千亿美元规模的资金往来[5] - 在针对谷歌的反垄断审判中 法庭文件显示 谷歌在2022年向苹果支付了200亿美元 以确保谷歌搜索成为苹果设备的默认搜索引擎[5] - 如今 部分资金将回流至谷歌 以支持Siri获得急需的升级[5]