硬AI
搜索文档
从“吞噬”到“受益”,中国软件有望吃上“龙虾肉” !
硬AI· 2026-03-12 17:04
AI Agent发展带动Token消耗与需求变化 - OpenClaw的出圈带动AI Agent的Token消耗量飙升,其调用量最高可达传统聊天交互的15倍 [3][5] - OpenRouter平台的周度Token调用量在3月2日当周达到14.8万亿,在约两个月内增长了约160% [3][5] - AI应用变现与算力消耗曲线因Token爆发而被同步抬升 [3] 中国AI模型的全球竞争力提升 - 智谱GLM5、Minimax M2.5、月之暗面Kimi K2.5等中国模型凭借性能与成本效益优势,正持续抢占美国大模型的全球Token份额 [11] - 在OpenRouter平台上,2月9日当周排名前9的模型中,中国模型的Token周调用量占比首次超过美国模型 [11] - 在相似用量限制下,中国AI厂商的按月订阅定价约为海外厂商的20%至30%,成本效率成为推动Token迁移的重要变量 [12] 对AI基础设施与IDC需求的影响 - 强劲的Token调用量增长将提升对AI软件基础设施与数据中心(IDC)的需求 [3] - 超融合基础设施(HCI)与软件定义存储(SDS)可能迎来结构性机会 [12] - AI Agent普及带来的计算需求增长,有望推动国内IDC供应商订单增长 [12] AI Agent的产品形态与产业定位 - OpenClaw作为代表性AI Agent,可自动完成软件安装、脚本执行、文件组织和网页监控等任务,GitHub星标数已突破29.9万 [5] - Agent被定位为建立在既有软件、数据与权限结构之上的“智能调用层”与“任务编排层”,核心价值在于提升自动化与流程管理效率 [12][13] - 企业级Agent落地需要深度接入企业数据与权限控制,并设置安全防护,做到可观测、可评估、可审计 [15] 软件板块的价值重估 - 软件板块正迎来价值重估,AI Agent将软件的价值重心从“功能呈现”推向“流程编排、数据与权限治理” [3] - 软件公司正利用原有的流程入口和数据壁垒,快速将Agent产品化,而非被动挨打 [15] - 市场情绪从对“AI吞噬SaaS”的极端悲观叙事中修复,开始评估哪些公司受冲击最小或能在AI化浪潮中受益 [15]
Anthropic年化收入飙至190亿美元,拟联手黑石成立AI咨询公司
硬AI· 2026-03-12 17:04
核心观点 - Anthropic正在加速商业化扩张,其年化收入从去年底的90亿美元飙升至190亿美元,几乎翻番,与OpenAI的营收差距迅速收窄[2][5] - 公司正与以黑石和Hellman & Friedman为首的私募股权机构联盟洽谈,计划成立一家专注于人工智能的合资企业,仿效Palantir模式,向私募机构旗下的超过250家被投公司销售Claude技术与咨询服务[2][4][10] 财务表现与商业化进展 - Anthropic年化收入已突破190亿美元,较去年底的90亿美元几乎翻番,增速显著[2][5][7] - 业务增长的强劲驱动力来自其编程工具Claude Code及职场自动化产品Cowork,这两款产品近几个月在企业市场引发广泛关注[8] - 尽管与美国国防部的纠纷可能对业务造成负面影响,但该风波也为公司带来了全球范围内的广泛关注,使众多消费者和企业首次注意到这家公司[8] 战略合作与生态布局 - Anthropic正与黑石、Hellman & Friedman等私募股权巨头洽谈成立一家独立的AI合资公司,相关谈判已持续数月[4][10] - 拟议的合资公司将采用类似Palantir的模式,提供AI集成咨询服务,协助企业将Anthropic技术落地应用,这与OpenAI的策略高度相似[10] - 黑石旗下拥有超过250家被投公司,包括Smartsheet和Bumble等,这些私募机构有借助AI提升效率、削减成本的强烈意愿[10] - 黑石此前已投资Anthropic,持有约10亿美元的股权,公司整体估值约为3800亿美元,同时黑石也是OpenAI的投资方[10] - 与国防部的纠纷曾使谈判短暂受阻,但据知情人士透露,相关谈判仍在推进,双方有望达成协议[5]
英伟达豪掷260亿美元下场造AI模型,直接叫板OpenAI
硬AI· 2026-03-12 17:04
英伟达宣布巨额研发投资与战略转型 - 公司宣布未来五年将投入260亿美元研发开源AI大模型,标志着其从硬件巨头向全栈AI企业的战略转型 [2][3] - 此举旨在直接挑战OpenAI、Anthropic与DeepSeek等前沿AI实验室的市场地位 [3] - 从宏观视角看,这代表公司的战略重心从单纯的硬件与软件栈供应商,转变为能与顶级AI实验室直接竞争的全栈AI企业 [4] Nemotron 3 Super模型性能 - 新发布的Nemotron 3 Super拥有1280亿参数,规模与OpenAI GPT-OSS最大版本相当 [5][6] - 在人工智能指数综合评分中,Nemotron 3 Super获得37分,超越了GPT-OSS的33分 [6] - 在专门评估模型对OpenClaw控制能力的新型基准测试PinchBench中,该模型位列第一 [6] - 公司公开了提升模型推理、长上下文处理及强化学习响应能力的多项创新训练方法 [6] - 公司应用深度学习研究副总裁透露,近期已完成一个5500亿参数模型的预训练工作 [6] - 自2023年11月发布首个Nemotron模型以来,公司已陆续推出面向机器人、气候建模及蛋白质折叠等垂直领域的专用模型 [6] 硬件与模型双轮驱动战略 - 公司未来的AI模型将不仅服务于芯片研发,还将用于优化超算级数据中心的整体架构,以构建硬件架构路线图 [9][10] - 开源策略具有长远商业意义,公开模型权重及技术细节有助于形成围绕英伟达硬件生态的开发者网络,强化其芯片的市场黏性 [10] - 公司高管表示,帮助生态系统发展符合公司利益,此举是深度绑定硬件路线图的战略布局 [10] 行业评价与意义 - 行业研究人士对此次布局反应积极,艾伦人工智能研究所的研究员称自己是“Nemotron的铁杆支持者” [11][12] - 专注AI开放性的非营利机构创始人将这笔投资定性为里程碑式信号,认为这是公司对开放性信念的一次史无前例的表态 [12] - 通过开源策略深度绑定自家硬件生态,公司在挑战其他实验室的同时,旨在进一步巩固其在AI算力市场的绝对主导地位 [2][3]
“疯了吧?” 中国"养龙虾"如此轰动,全世界都惊了!
硬AI· 2026-03-11 17:11
MiniMax公司IPO表现与市场热度 - 高盛亚洲销售Philip Sun表示,MiniMax的IPO项目创下了其个人纪录,从未见过一只股票在两个月内上涨740% [3][6] - MiniMax于2026年1月9日以165港元挂牌,到3月11日交易价格已达1220港元,涨幅为740% [6] - 同期,另一家中国AI公司智谱AI(ZhiPu)自1月8日上市后,两个月涨幅也达到560% [6] - MiniMax管理层路演在跨年夜(12月31日)下午3点的香港场次依然座无虚席,显示出极高的市场关注度 [8] - MiniMax是一家员工平均年龄29岁的公司,其市值已与百度相当 [10] OpenClaw(“龙虾”)AI智能体在中国的普及现象 - OpenClaw是一款由奥地利程序员开发的开源AI智能体软件,其标志是一只龙虾,功能远超普通聊天机器人,可替用户清理邮箱、处理文件、写代码、发朋友圈,并24小时自动完成复杂任务 [13] - 英伟达CEO黄仁勋在摩根士丹利科技大会上称,OpenClaw可能是有史以来最重要的单一软件发布 [14] - 在深圳腾讯总部大楼外,腾讯员工摆摊免费为路人安装OpenClaw,现场有近千人参与,参与者包括退休航天工程师、家庭主妇、在校学生等各类“非典型用户” [11][14] - 用户反馈积极,例如上海设计师Mark Yang感觉拥有了“虚拟员工”,企业家傅盛在14天内基于OpenClaw搭建出名为“三万”的AI助理,能自动群发拜年消息、设计并上线网站 [15][16] - 高盛销售员接触的中国年轻投资者普遍拥有多只“龙虾”,分别用于总结市场新闻、分析投资决策和担任“监工” [17] “养龙虾”热潮的社会扩散与生态构建 - “养龙虾”(即部署和使用OpenClaw)热潮已从程序员圈子扩散至普通大众,包括大爷大妈群体 [19][22] - 北京、深圳、杭州等地线上线下涌现大量OpenClaw分享会和装机活动,例如深圳一场活动注册人数超过900人 [20][21] - 小红书、微信等平台出现付费装机服务,价格从几十元到几百元不等,且供不应求 [21] - 该热潮的快速扩散得益于低成本和低门槛:OpenClaw是开源软件,中国云厂商(如阿里、字节、百度)提供了“一键安装”的傻瓜式配置方案,结合通义千问、DeepSeek等高性价比国产大模型作为底座,用户无需懂代码即可使用 [32][33] - 主要平台生态整合速度极快,企业微信、钉钉、飞书、淘宝等几乎同步接入了OpenClaw架构,使其直接嵌入数亿人的日常工作生活入口 [35] - 地方政府反应迅速,深圳、苏州、合肥等城市在热潮兴起几天内就推出了针对OpenClaw项目的补贴政策,并建设产业园、向“一人公司”提供资金支持 [37] 中美社会对AI技术接纳度的差异分析 - 中国对AI的公共叙事高度统一,将其定义为经济增长机遇,并写入国家五年规划和政府工作报告,例如今年两会报告明确提出“推动新一代智能终端和AI智能体加快应用,鼓励人工智能在重点领域大规模商业化应用” [29] - 观察人士指出,美国国内对AI的讨论则更为分散 [30] - 文化背景差异显著:欧美一代人受《终结者》《黑客帝国》等影视作品影响,对机器颠覆人类存在文化基因层面的恐惧;而中国人亲历了工业化和城镇化带来的生活巨变,对新技术的本能反应是“它能让我的日子更好过” [31] - 国际社交媒体(如Reddit)上的外国网友对中国“养龙虾”的规模和速度感到震惊,有网友指出深圳从宣布活动到大规模装机仅用了72小时,这种部署速度在其他地方难以复制 [23][25] - 有网友评论称,中国对AI的接受程度非常高,甚至考虑让女儿学习中文 [22][27] 中国科技生态的“第二行动者优势”模式 - 从共享单车、移动支付、直播带货到当前的“养龙虾”,中国科技生态的“标准模板”是:不一定第一个发明技术,但一定是第一个做到规模最大、落地最快、商业化最狠的 [39] - 学界称之为“第二行动者优势”,即无需在技术早期烧钱踩坑,待技术成熟后,凭借更强的执行力和更完整的生态将其放大为改变亿万人生活的基础设施 [40] - OpenClaw在西方更多是极客圈子里的“酷玩具”,但在中国已成为退休工程师、家庭主妇和在校学生都在使用的“国民基建” [41]
对标谷歌Gemini?OpenAI拟在ChatGPT开启视频生成功能
硬AI· 2026-03-11 17:11
公司战略调整 - OpenAI计划将旗下AI视频生成工具Sora整合进ChatGPT,标志着产品策略的重要转向 [2][3] - 整合计划将于近期落地,旨在集中资源冲击10亿周活跃用户目标 [2][3] - 面对谷歌Gemini等竞争对手的紧逼,公司正将更多资源集中押注于ChatGPT这一核心产品 [14] 竞争与市场考量 - 谷歌旗下Gemini应用已凭借Veo AI提供视频生成功能,对ChatGPT形成直接竞争威胁 [4] - 将Sora能力引入ChatGPT,是在视频生成赛道上正面迎战Gemini的战略选择 [15] - 此举有望借助ChatGPT庞大的用户基础提振AI视频生成的竞争力 [2] 用户增长目标与现状 - 目前ChatGPT周活跃用户约为9.2亿,距公司去年设定的10亿目标仍有差距 [4] - 将Sora整合进ChatGPT,是激活存量用户、冲击10亿周活目标的现实路径 [15] Sora独立应用表现 - Sora独立应用上线后迅速登顶苹果App Store免费榜榜首,但热度很快消退,目前排名已滑落至第165位 [6] - Sora用户中公开分享视频的比例极低 [7] - Sora独立应用将继续运营,但其长期定位尚不明确 [7] 成本与算力压力 - 将Sora整合进ChatGPT将显著推高OpenAI的AI推理及服务器运营成本 [4] - 视频生成在算力消耗上远超图像生成,一旦出现病毒式传播效应,公司面临的算力压力将更为严峻 [12] - 公司预计从现在到2030年,仅用于支撑ChatGPT及其他产品运行的AI推理成本一项,累计支出将超过2250亿美元 [12] - 公司已着手储备足够的计算容量,以应对爆发式功能所带来的用量峰值冲击 [12] 产品策略背景与先例 - OpenAI近期产品策略频繁调整,例如撤回了在ChatGPT内部直接引入购物功能的计划 [13] - 公司对此次整合寄予厚望,部分原因在于有先例可循:去年3月大量用户涌入ChatGPT生成宫崎骏“吉卜力”风格个人写真,引发病毒式传播 [9] - 此后,ChatGPT已成为个人及企业客户(包括家居和服装设计领域)的重要AI图像生成工具 [11]
黄仁勋罕见发文:AI是这个重塑世界的重要力量,是电力、互联网一样的基础设施
硬AI· 2026-03-11 17:11
AI产业的核心定位 - AI不应被理解为单一模型或应用,而是如同电力和互联网一样不可或缺的、正在形成的基础设施体系 [4][5][20][33] - AI产业正在经历一次类似工业革命级别的、人类历史上最大规模的技术基础设施建设之一 [6][13][27] AI产业的“五层蛋糕”结构 - 产业框架是一个五层技术栈,各层之间为强耦合关系:能源 → 芯片 → 基础设施 → 模型 → 应用 [7][9][24][26] - **能源层**:是AI基础设施的第一性原理和硬性约束,实时生成的智能需要实时产生的电力 [9][24] - **芯片层**:处理器旨在将能源大规模高效转化为计算力,其进步决定了AI扩展的速度和智能的可负担程度 [9][24] - **基础设施层**:包括土地、电力、冷却、网络等,核心是协同成千上万处理器组成“AI工厂”,旨在制造智能而非存储信息 [9][24] - **模型层**:能理解语言、生物、化学、物理、金融、医学等多类型信息,最具颠覆性的工作正发生在蛋白质AI、化学AI、物理模拟、机器人等领域 [10][24] - **应用层**:是创造经济价值的地方,包括药物发现、工业机器人、法律助手、自动驾驶汽车、人形机器人等 [10][25] AI基础设施建设阶段与规模 - 全球AI基础设施建设仍处早期阶段,目前仅投入了数千亿美元 [6][12][27] - 未来仍需建设数万亿美元规模的基础设施 [7][12][27] - 芯片工厂、服务器组装厂和AI数据中心正在全球加速建设 [13][27] AI对劳动力市场的影响 - AI数据中心建设催生对大量技术工人的需求,包括电工、管道工、网络工程师、设备安装人员等 [13][27] - 参与这场变革并不一定需要计算机博士学位,提供了高技能、高薪酬的就业机会 [14][27] - 大部分劳动力尚未得到培训,大部分机会尚未被发掘 [19][32] 开源模型的推动作用 - 全球大量AI模型是开放的,企业、研究机构和国家级参与者都依赖开源模型参与AI发展 [15][29] - 当开源模型达到先进水平时,会激活并带动整个产业链的需求 [15][29] - 以DeepSeek-R1为例,其公开推动了应用开发,并向上拉动了对训练算力、基础设施、芯片和能源的整个产业链需求 [16][30] AI引发的根本性技术变革 - AI打破了“预录制软件”模式,使计算机首次能够理解非结构化信息,并能根据上下文实时生成智能 [22] - 由于智能是实时生成的,支撑它的整个底层计算技术栈都必须被重新发明 [23][31] AI的广泛经济与社会影响 - AI是一场工业级转型,将改变能源生产方式、工厂建设方式、工作组织方式以及经济增长模式 [18][19][31] - AI正在推动整个知识经济的生产力提升,例如在放射学领域,AI承担重复性工作后,提升了效率并创造了新的服务容量,最终带来增长和更多就业 [27] - 过去一年AI跨过重要分水岭,模型变得足够优秀,能在宏观规模上发挥实用价值,基于AI的应用开始产生真正的经济价值 [28] - 在药物发现、物流、客户服务、软件开发及制造业等领域的应用已展现出极强的产品市场契合度 [29] - 每一家公司都将使用AI,每一个国家都将建设它,其影响不会局限于单一国家或领域 [20][32]
剑指阿里字节!报道:腾讯秘密布局微信AI智能体,年内或向全用户开放
硬AI· 2026-03-10 23:43
微信AI智能体开发计划 - 公司正为微信秘密开发一款高优先级AI智能体,计划于2024年年中启动灰盒测试,并在第三季度向全体用户推出 [2][3] - 该智能体将嵌入微信,以对话形式呈现,旨在接入平台内数百万小程序,替代用户完成打车、外卖等任务 [2][3] - 此举旨在拓展AI智能体在国内的应用场景,并直接挑战阿里巴巴与字节跳动在该领域的先发优势 [2][3] AI智能体战略布局 - 公司近期加速AI Agent布局,在一天内密集推出三款产品,分别切入个人、协作与办公场景:QClaw(微信远程操控电脑)、企业微信机器人和WorkBuddy(多平台办公助手)[6] - 战略核心是放弃推广独立应用,将AI能力直接嵌入微信、企业微信、QQ等高频应用,依托现有生态完成能力注入 [6] - 目标是将AI从“需要专门打开的工具”转化为“对话流中原生存在的服务”,通过自然语言调用抢占下一代人机交互的核心入口 [6] 微信生态的优势与挑战 - 公司将AI智能体嵌入微信的核心逻辑在于其无可替代的生态规模,微信拥有14亿月活用户和八年积累的数百万小程序生态 [3][8][13] - 然而,公司面临两难处境:不能冒险以不成熟的技术破坏微信庞大的用户体验 [8] - 公司此前推出的独立AI应用“元宝”市场反响平平,截至2024年2月月活用户约1.09亿,远低于字节跳动豆包的3.15亿和阿里巴巴通义的2.02亿 [8] 底层模型与研发能力 - 在底层模型选型上,微信团队尚未确定采用公司自研的混元模型,因混元模型在行业内尚未跻身顶尖水平 [11] - 微信团队已测试智谱、阿里巴巴及DeepSeek等多家外部模型,同时也在评估自研的小型模型,采用外部模型可能拉长整合验证周期 [11] - 公司从OpenAI引入姚顺雨担任首席AI科学家主导混元研发,微信团队也由张小龙领衔推进独立AI模型研发,并已发布相关技术论文 [11] 行业竞争与战略意义 - 全球科技巨头正竞相推出能自主完成复杂任务的AI助手,争夺下一代人机交互的制高点,公司在此竞逐中既有筹码也有压力 [13] - 竞争焦点正从“功能”转向“入口”,主战场从独立应用迁移到用户原本活跃的通讯与办公工具中,离用户更近的入口更具价值 [15] - 公司的核心命题是如何在不动摇微信既有用户体验的前提下,将小程序生态优势有效转化为AI竞争力,进而实现反超 [13]
加剧全球缺芯?三星工会本周启动罢工投票
硬AI· 2026-03-09 15:47
劳资谈判与潜在罢工 - 三星电子三大工会正与管理层就薪资问题进行谈判,工会代表约8.9万名员工,占公司约13万名员工总数的近七成 [3][4] - 工会核心诉求包括:7%的薪资涨幅、取消绩效奖金上限、提高奖金计算方式的透明度 [2][3] - 工会将于3月11日至3月18日期间进行投票,若提案通过,计划于5月21日至6月7日发起持续18天的罢工 [2][3] 潜在罢工的影响与历史对比 - 若罢工发生,将是三星历史上第二次大规模停工,但计划持续18天,远超2024年的首次罢工 [2][6] - 2024年的首次罢工被公司评估为未对生产或管理运营造成影响,但本次三大工会联合行动,代表员工基数更大,潜在冲击力不同 [6] - 罢工窗口期正值全球半导体市场需求回暖、供应链处于敏感调整期,对供应稳定性的关注度高 [3][6] 行业背景与潜在风险 - 三星是全球最大的存储芯片制造商之一,其生产动态对全球DRAM及NAND闪存供应格局有直接影响 [2][6] - 工会对绩效奖金上限的不满,源于半导体行业景气周期中员工希望分享公司利润,而现行机制被认为压缩了员工实际收益空间 [4] - 潜在的大规模停产可能进一步加剧全球芯片供应紧张的局面 [2]
“龙虾”刺激之下:开年2个月,MiniMax年化经常性收入(ARR)增长50%,M2模型Token用量增长6倍
硬AI· 2026-03-09 15:47
MiniMax商业化加速与财务表现 - 受“OpenClaw生态”(龙虾效应)刺激,公司商业化加速超预期,正从技术验证期快速切换至规模变现期[2][3] - 年化经常性收入在两个月内从1亿美元飙升至1.5亿美元,增幅超过50%[2][3][4] - 摩根士丹利维持增持评级,目标价990港元,较当前股价有约23%上行空间[4] M2模型运营与成本优化 - M2模型Token用量在2026年2月相较2025年12月暴增6倍[2][4][6] - 每Token推理成本同步大幅下降超过50%[2][6] - 成本下降主要驱动力包括算法优化、规模效应带来的边际成本摊薄,以及公司对算力供应商的较强议价能力[6][7][8] - 公司已暂停海螺视频生成产品v2.3之后的更新,将资源集中用于下一代架构研发[6] 产品战略与未来展望 - 即将推出的M3系列模型目标直指真正的全球第一梯队能力,代表模型能力的阶跃式提升[9][10] - M3模型已明确设定为比现有模型交付更高的毛利率[10] - 公司认为推理速度是关键差异化竞争力,将持续在成本与速度间寻求最优平衡[10] 平台战略与竞争护城河 - 公司对“平台公司”的定义在于推动智能边界的突破,而非掌控互联网流量或充当消费者入口[12][13] - 编程产品和智能体流水线展现出强劲增长势头[13] - 公司的护城河核心是“模型进化速度”的竞赛,快速且持续的模型迭代是锁定开发者生态的根基[13]
伊朗之战:历史上第一场“AI战争”
硬AI· 2026-03-09 15:47
文章核心观点 - 在美以对伊朗的军事行动中,人工智能首次被大规模应用于实战,这或许是历史上的第一场“AI战争” [3] - AI技术在情报收集、目标筛选、任务规划和战损评估等环节显著提升了军事行动的效率 [2][3] - 然而,AI在战争中的应用也伴随着数据质量、系统误差及过度依赖等巨大风险,可能导致灾难性后果 [2][3] 情报处理 - 传统情报流程存在瓶颈,人类分析师通常最多只能查看约4%的情报素材 [5] - AI最大的即时影响在情报领域,解决了因人力不足而无法评估关键情报的问题 [5] - 以色列情报部门依赖AI从海量截获信息(如被黑入的交通摄像头视频和监听通信)中筛选可用线索 [5] - AI的机器视觉能快速从海量视频与图像中识别目标并区分特定型号,也能从截获语音中抓取并总结对话 [5] 任务规划与后勤 - 传统军事行动规划需要多方协作,耗时数周,而AI的介入有望将这一过程缩短至数天 [6][7] - AI能够瞬间处理规划中细节改变引发的复杂连锁反应,计算其对整体部署的影响 [7] - 五角大楼正利用AI运行模型和数字兵棋推演,通过处理数以百万计的迭代方案来优化目标优先级并制定行动方案 [8] 技术应用的风险与挑战 - 构建军事AI面临训练数据过时或不够清晰的难题 [10] - AI系统的误差和不准确性在战场上可能导致致命后果,例如情报失误可能导致平民伤亡 [10] - 对AI决策的过度依赖是一个严重问题,需要实施保障措施以限制风险,但目前相关基础设施投资不足 [10] - 在战争中,人类的判断力始终是不可替代的 [10]