代理式AI
搜索文档
上线即爆火!超30万人成“出租者” 愿为AI老板打工 工资即时结算
中国经营报· 2026-02-09 13:40
网站业务模式与市场反响 - 网站“rentahuman.ai”上线即爆火,上线第一晚有超过130名人类注册,其中包括一家人工智能初创公司的CEO,截至2月9日,网站已有超过30万名人类“出租者” [1] - 该网站是一个AI租用人类的平台,人类可以成为AI在现实世界中的“肉身”,完成取货、签约、修理硬件、拍照、参加会议等AI无法亲自执行的任务 [2][3] - 人类员工注册流程类似求职网站,需完善个人资料,包括技能、位置和期望薪资,AI通过MCP和API匹配任务,完成后以稳定币等形式即时支付报酬 [6] - 网站上已出现多项AI发布的任务,例如拍照、举牌子、试吃新餐厅菜单,以及花1小时在华盛顿广场数鸽子并给其中3只起名字,数鸽子任务薪资为30美元(约208元人民币),已有超过40人应聘 [8] AI代理技术发展与相关案例 - “租用一个人类”网站的出现背景是代理式AI的爆发,AI智能体可以自主或协助处理安排日程、管理邮件、网上购物甚至股票交易等任务 [11] - 近期走红的“AI社交网络”Moltbook塑造了一个新型社交世界,所有发帖、转发、评论、互动的用户都是AI智能体,形成了AI自己的社交网络 [11] - 网站创始人Alex的灵感来源于AI可以自己社交,进而思考AI是否可以自己当老板,但该网站目前更像Moltbook爆火后的行为艺术 [16] - 云安全公司Wiz的调查显示,Moltbook中绝大多数“智能体”不具备自主性,约17000人控制着平台上的智能体,平均每人控制88个 [16] AI在企业管理中的实际应用 - 2025年,日本大型电信公司KDDI开发了一款能够模拟上级思维和语言风格的AI代理“A-BOSS”,并将其提供给700名销售人员使用 [17] - “A-BOSS”可以24小时在线、情绪稳定,销售人员可将提案交给它,AI会按照真人上司的思路进行修改和点评,旨在提高工作效率 [17] 行业趋势与潜在影响 - 该网站的出现展现了一种新的可能性:在所有人类将AI作为工具熟练运用之前,一部分人类可能率先成为AI的工具 [16] - 有观点担忧这种趋势可能削弱人类的“主体性”,使人类退化为AI的“肉身”执行者,并可能因算法运作缺失同理心和社会责任感,带来新的权力不对等与剥削风险 [19] - 在当前AI与人类社会愈发交融的时代,行业需要思考当AI在智能、决策和生产力上全面超越并主导人类时,人类独特的价值、意义和尊严何在 [19]
2026年第一个爆款 Clawdbot现象背后是AGI更近了
21世纪经济报道· 2026-02-06 07:29
OpenClaw (原Clawdbot) 现象级开源AI助手 - 一款由个人开发者Peter Steinberger创建的开源AI助手项目,在2026年初于数天内迅速席卷全球技术圈 [1][10] - 该项目在GitHub上以近乎疯狂的速度收获超过**10万星标**,被视为从“对话式AI”迈向“代理式AI”的标志性拐点 [1][10] - 其核心功能是作为本地运行、可自主规划并执行复杂任务的24小时AI助手,例如自动清理**7.5万封邮件**、将PPT转换为PDF并发送给客户 [1][3][10][12] 产品技术架构与特点 - 运行逻辑分为指令、网关、执行三部分,通过本地Gateway网关连接用户自有的大模型API,操控本地文件、应用、浏览器及运行Shell脚本 [3][12] - 技术核心是网关架构、权限管理与记忆系统,类似AutoGPT等已有探索,其核心壁垒在于快速建立的开发者社区和用户心智 [4][13] - 项目创始人透露,该项目几乎**100%由AI生成**,本人未手写一行代码,指向AI编程能力可能成为实现AGI的“捷径” [9][18] - 本质上为“智能体网关”,繁重的AI推理仍依赖OpenAI等云端服务器,本地设备主要负责收发消息、调用API和运行简单脚本 [8][17] 对硬件与云计算产业的直接影响 - 由于本地部署要求,带动了苹果Mac Mini的销量,在社交媒体上引发下单潮,连谷歌AI产品负责人也专门购买以体验该产品 [1][5][14] - 国内云厂商如腾讯云、阿里云、京东云迅速跟进,上线一键部署服务,吸引企业和开发者快速上手部署 [6][15] - 私有化部署模式有望带动C端硬件、VPS、云安全与隐私计算等方向的发展 [8][17] - 位于AI Infra层的AI网关作为该赛道的“铲子股”,有望优先受益 [8][17] 对大模型行业的推动与验证 - 项目的爆火验证了AI正向具备执行力的“高智商Agent”进化,展现了复杂任务规划与落地能力 [8][17] - 推动了底层大模型厂商提升模型的推理能力和工具调用性能,加速了行业在“代理式AI”方向的竞逐 [8][17] - 项目开发者盛赞MiniMax M2.1是“当下最优秀的开源模型”,一度引起MiniMax股价暴涨 [3][12] - MiniMax研发负责人表示,其M2.1模型针对Agent场景优化了思维链与工具调用,在处理多步任务时展现出高准确率和稳定性,与Clawdbot开发者需求高度匹配 [3][12] - MiniMax内部接近**100%** 的员工使用自研的AI Agent工具嵌入真实工作流,极大提升效率 [9][18] 行业生态与未来趋势 - 加速了AI Agent时代的到来,被视为最接近“个人助手”概念的AI产品 [5][13] - 催生了新的生态,例如AI智能体拥有自己的社交论坛Moltbook,发帖、评论和投票均由智能体完成 [7][16] - 红杉资本报告认为2026年可能成为“AGI元年”,核心标志是“长时程智能体”的成熟,能够像人类一样在数小时内自主工作、试错并调整策略 [9][18] - 前OpenAI研究员预测,一旦AI能完全自动化编写AGI项目代码(替代整个程序员团队),就可能启动“自动化加速阶段” [9][18]
2026年第一个爆款!Clawdbot现象背后是AGI更近了
21世纪经济报道· 2026-02-05 15:35
文章核心观点 - 开源AI助手项目Clawdbot(后更名为OpenClaw)在2026年初迅速爆火,被视为AI从“对话式”迈向“代理式”的标志性拐点,验证了复杂任务自动化的可行性 [1][3] - 该项目的成功反映了市场对能够自主规划、执行复杂任务的智能体(Agent)的巨大期待,加速了AI Agent时代的到来 [2][4] - 尽管面临安全、成本及技术门槛等挑战,但其生态位价值重大,并对硬件、云计算、AI基础设施及大模型研发等多个产业方向产生了冲击波 [1][5][6] 产品与技术概况 - Clawdbot是一款本地运行的AI助手,能帮用户办事、随时交互、拥有记忆并自我进化,其运行逻辑分为指令、网关、执行三部分 [2] - 其核心是网关架构、权限管理与记忆系统,类似AutoGPT、LangChain,并无独创底层技术,核心壁垒在于快速建立的开发者社区和用户心智 [3] - 该项目在GitHub上以疯狂速度收获超过10万星标,并因本地部署要求带动了苹果Mac Mini的销量 [1][5] - 创始人透露该项目几乎100%由AI生成,未手写一行代码,引发了关于AI编程能力是否成为实现AGI“捷径”的讨论 [7] 市场反响与产业影响 - 产品爆火后,国内腾讯云、阿里云、京东云等云厂商迅速跟进,上线一键部署服务 [5] - 因其本地部署要求,在社交媒体上掀起Mac Mini下单潮,甚至谷歌AI产品负责人也为此专门购买 [5] - 中金公司研报认为,私有化部署模式有望带动C端硬件、VPS、云安全与隐私计算等方向发展 [6] - 开源证券研报指出,位于AI Infra层的AI网关作为“铲子股”,有望优先受益 [6] - AI智能体甚至开始拥有自己的社交论坛Moltbook,发帖、评论和投票只能由智能体完成 [5] 对大模型行业的推动 - Clawdbot的爆火验证了AI正向具备执行力的“高智商Agent”进化,展现复杂任务规划与落地能力 [5] - MiniMax研发负责人表示,其最新的M2.1模型针对Agent场景进行了思维链与工具调用的底层优化,是Clawdbot推荐基座的关键原因 [2] - 这对大模型厂商起到推进作用,会加速行业提升底层模型的推理能力和工具调用性能 [5] - MiniMax内部接近100%的员工使用自研的AI Agent工具处理代码相关工作,效率提升显著 [7] 面临的挑战与风险 - 产品曾因被Anthropic指控侵权而被迫改名,从Clawdbot短暂改为Moltbot,后正式命名为OpenClaw [3] - 用户隐私与数据安全被业内人士视为潜在的巨大风险 [3] - 当前产品的部署和使用有一定技术门槛,参与“尝鲜”的用户仍以技术极客为主 [3] - 尽管带火了Mac Mini,但Clawdbot本质是“智能体网关”,繁重的AI推理仍依赖OpenAI等云端服务器,本地设备仅负责收发消息、调用API和运行简单脚本 [6]
Richtech Robotics与微软宣布合作,推进代理式AI在现实机器人应用中的发展
新浪财经· 2026-01-27 22:19
公司与微软的战略合作 - 美国机器人公司Richtech Robotics宣布与微软展开深度合作,共同开发并部署适用于真实机器人系统的智能体人工智能能力 [1] - 合作聚焦于将视觉、语音及自主推理能力应用于物理环境 [1] - 目标是使机器人不仅能执行任务,更能支持更具情境感知、对话能力和操作意识的交互 [1] 合作的技术方向与目标 - 合作致力于开发并部署适用于真实机器人系统的智能体人工智能能力 [1] - 技术应用重点包括视觉、语音及自主推理能力在物理环境中的整合 [1] - 最终目标是提升机器人的交互能力,使其具备情境感知、对话能力和操作意识 [1]
全球通信软件供应商整合加速 代理AI成行业破局关键
中国经营报· 2026-01-26 00:27
全球通信BSS/OSS供应商整合趋势 - 市场研究机构Omdia报告指出,全球通信软件业务支撑系统(BSS)与运营支撑系统(OSS)供应商的整合趋势正持续升温[1] - 随着5G规模化应用、算力网络建设提速及数字经济融合发展,BSS/OSS领域的供应商整合正在加速[2] - 2025年10月,NEC株式会社宣布以29亿美元现金收购软件运营服务平台公司CSG Systems International,交易预计于2026年正式完成[2] - 同月,Skyworks和Qorvo宣布达成最终协议进行合并,合并后的企业估值约为220亿美元[2] - 行业整合浪潮是行业数字化转型进入“深水区”的结构性必然,标志着行业从“连接数字化”向“智能原生”转型的阶段跃迁[3] - 头部企业通过整合可优化资源配置、削减成本、增强产业链话语权并快速拓展市场份额,技术迭代加速与巨大研发投入也促使行业向大型企业集中[3] 代理式AI成为行业数字化转型核心引擎 - 在供应商整合引发供应链风险加剧的背景下,代理式AI(Agentic AI)正突破传统技术局限,成为通信行业数字化转型的核心引擎,其市场规模预计将实现爆发式增长[1] - 代理AI技术的崛起通过模拟人类决策过程实现自主优化,正在重构通信软件供应链的协作模式[1] - 相比传统AI工具,代理AI具备更强的环境感知能力与动态调整机制,能有效应对供应商整合过程中产生的数据孤岛、系统兼容性等复杂问题[1] - 代理AI凭借其自主决策、端到端执行、持续学习的核心优势,正快速超越传统生成式AI,成为行业数字化转型的主要趋势[4] - 代理式AI的核心价值在于将“被动响应”升级为“主动治理”,通过实时分析网络状态、用户行为及成本数据,自主执行故障修复、资源调度乃至营销策略优化,形成动态闭环[4] 代理式AI的应用场景与潜力 - 当前代理AI已在通信网络运维、客户服务等场景落地并取得成效[5] - 未来1—3年,代理AI在通信行业最具潜力的应用场景包括:智能网络规划与部署,可根据地理、用户需求等数据自主规划网络布局,优化基站选址与配置以降低建设成本[5];安全防护,能实时监测网络流量,自主识别并应对如DDoS攻击等安全威胁[6];能源管理,可优化通信设备能耗,根据业务负载动态调整设备运行状态,助力行业实现绿色低碳发展[6] - 未来潜力场景将围绕“网络自治、业务创新与风险预控”展开[6] - 短期最具爆发力的是智能网络切片管理,代理AI可动态分配带宽资源以匹配工业互联网、XR等场景需求[6] - 中期将渗透至供应链与能耗管理,实现采购决策和基站功耗的自动优化[6] - 长期将构建“通信大脑”,通过跨域数据融合预测业务趋势并提前部署资源,甚至衍生出运营商自有AI服务产品[6] 技术发展对行业生态的潜在影响 - OMDIA市场预测显示,通信运营商可能会使用基于生成式AI(GenAI)的编码工具来自行构建更多BSS/OSS[4] - 基于GenAI的集成开发环境(IDE)可以赋能企业开展更多内部开发,长远来看,这可能会减少对系统集成商、咨询顾问乃至独立软件供应商的依赖[4]
Marvell,有戏吗?
半导体行业观察· 2026-01-25 11:52
文章核心观点 - AI基础设施发展进入新阶段 推理、能效和高速互连的重要性提升 这恰好对应Marvell Technology的核心优势 公司股价表现可能从2026年开始扭转此前落后于更广泛半导体市场的局面 [1] AI推理趋势与公司定位 - 到2026年 AI行业预计将从“蛮力式训练”转向代理式AI和推理 推理需要更低的延迟和显著更高的能效 [1] - Marvell的定制XPU(AI加速器)专为推理等特定工作负载设计 其ASIC被优化用于最大化“每瓦可处理的token数” 单次推理成本是云巨头扩展服务规模时最重要的指标 [2] - 公司对定制芯片采用3nm和2nm制程节点的投入 可能使其在能效竞赛中占据优势 预计今年定制AI相关收入将达到18亿美元 [2] 光互连技术布局 - 2026年关键基础设施变化之一是铜互连达到内在极限 电互连在发热、功耗和信号衰减方面遭遇挑战 [2] - Marvell押注于光互连 在共封装光学(CPO)上进行了大量投资 并以32.5亿美元收购Celestial AI 旨在将光互连直接集成到芯片封装中 [2] - 通过融合光子互连与计算和存储 公司试图解决大规模AI系统中高效搬移数据而不过度增加功耗和散热负担的瓶颈 [2] - 如果光互连从“可选升级”变成“必需配置” Marvell在CPO领域的提前布局可能使其站在下一代AI集群设计的前沿 [3] 客户多元化进展 - 传统上 Marvell被批评过度依赖亚马逊云服务(AWS) 这种客户集中度提高了盈利波动性并限制了市场对其AI潜力的认可 [3] - 公司已在美国四大云巨头中的三家赢得了定制芯片设计订单 新项目将在2026年加速推进 [3] - 在架构层面 公司确保其产品能够兼容主流AI生态 例如对NVIDIA NVLink互连的支持使其定制芯片可以与以NVIDIA为中心的环境协同工作 消除了云厂商采用时的一个重要障碍 [3] - 与多家云巨头合作有助于降低风险、稳定盈利并提升华尔街对其AI叙事的信心 [3] 财务状况与估值重估逻辑 - 按2027财年一致预期盈利的约22倍市盈率计算 Marvell的交易估值明显低于同行 尽管其营收预计将在2026年增长42% 并在2027年增长22% [4] - 当前约15%的营业利润率偏低 反映了其历史业务结构、硬件属性以及客户集中度 [4] - 重新评级的逻辑在于改变利润率结构 随着数据中心收入占比提高、云规模ASIC项目持续放量以及客户多元化降低盈利波动性 公司将逐渐更像一个结构性的AI基础设施平台而非周期性元器件供应商 [4] - 如果利润率能伴随营收一同增长 当前的低估值倍数将越来越难以被合理化 [4]
AI周报丨DeepSeek新模型曝光;马斯克炮轰ChatGPT诱导自杀
第一财经· 2026-01-25 09:31
大模型技术进展与发布 - DeepSeek官方代码更新中多次提及未公开的“MODEL1”大模型标识符 该标识符与已知的DeepSeek-V3.2并列 行业推测其可能代表一个不同于现有架构的新模型 可能是V4、推理模型R2或V3系列终极版 根据模型文件结构判断 该模型很可能已接近训练完成或推理部署阶段 [1] - 英伟达CEO黄仁勋总结过去一年AI大模型的三大突破 第一是模型能在未受训领域进行推理、计划并回答问题 出现了代理式AI 第二是开源模型取得重大突破 首个开源推理模型DeepSeek的推出对大多数行业和公司而言是重大事件 第三是物理AI取得巨大进展 其不仅能理解语言还能理解物理世界 [7] - Meta新设立的超级智能实验室团队已在本月向公司内部交付了首批AI模型 该团队成立约六个月 交付的模型表现“非常好”并展现出“很多潜力” 但技术尚未完成 距离交付给内部业务和普通消费者仍有大量工作要做 [9] 行业竞争与商业化动态 - OpenAI仅靠API业务在上个月就新增了超过10亿美元的年度经常性收入 公司首席财务官披露2025年公司年化收入突破200亿美元 同比增长超230% 公司近期加快了商业化进程 并将在美国测试ChatGPT广告以带来额外收入 [4] - 美国AI公司Anthropic正在进行一轮总额超过250亿美元的融资 预计估值将提升至约3500亿美元 较去年9月的1700亿美元估值实现翻倍 此轮融资重要部分来自微软与英伟达已宣布的投资 红杉资本计划首次投资并可能领投 公司年化营收自去年夏天以来已翻倍 截至2025年底已超过90亿美元 [8] - 百度新设个人超级智能事业群组 合并文库和网盘事业部 百度文库目前AI月活用户超9700万 百度网盘AI月活用户超8000万 此次调整旨在整合人才与技术 强化公司在AI应用方面的整体协同创新能力 [5][6] AI安全、伦理与社会责任争议 - 特斯拉CEO埃隆·马斯克在X平台转发帖子称ChatGPT与9起死亡事件有关 其中5起据称是由于其互动导致自杀身亡 受害者包括青少年和成年人 OpenAI CEO山姆·奥尔特曼回应承认运营近十亿用户AI平台的挑战 并提及已有超过50人死于与自动驾驶相关的事故 争论将AI安全伦理、致幻风险及科技巨头社会责任等话题推向风口浪尖 [2] - 针对医生担忧年轻医生过度依赖AI并被误导的观点 百川智能创始人王小川回应称“AI加医生”组合优于单个医生 解决担忧的关键在于转换使用思路 让AI对医生的临床思维进行提醒、对诊疗结果进行校验 实现“AI给医生保驾护航”的模式 [3] - 《启明计划:构建人工智能护栏的全球共识》课题项目在北京大学启动 旨在制定政策蓝图 系统梳理全球AI安全护栏 识别关键趋同与分歧领域 提出建立全球共识的机制 研究涵盖国家政策、跨国组织准则、企业自律规范及学术倡议等多个层面 [15] 硬件、芯片与机器人领域动态 - 国产AI芯片公司燧原科技科创板IPO招股书显示 去年前三季度该公司有71.84%的销售收入来自腾讯及其指定的服务器厂商 腾讯及关联方持有该公司20.26%的股份 2022年至2024年 公司营收分别为0.9亿元、3.01亿元、7.22亿元 亏损分别为11.16亿元、16.65亿元、15.1亿元 三年合计亏损42.9亿元 [12] - 摩尔线程公告预计2025年年度实现营业收入14.5亿元到15.2亿元 同比增长230.70%到246.67% 预计净利润亏损9.5亿元到10.6亿元 亏损同比收窄34.50%到41.30% 公司预计最早可于2027年实现合并报表盈利 [13] - 宇树科技表示2025年公司人形机器人实际出货量超5500台 2025年本体量产下线超6500台 该数据为纯人形机器人数量 不含其他产品 其出货量超过了智元机器人此前透露的截至2025年底整体超5100台的出货量 [14] 开源与算法透明度 - 马斯克旗下社交媒体平台X正式将平台推荐算法开源 该算法由与xAI的Grok模型相同的Transformer架构驱动 系统彻底移除了所有人工设计的特征及绝大多数人为设定规则 几乎完全依赖基于Grok模型承担核心工作 通过预测用户行为对帖子进行排序 [10][11]
CPU的复仇-被低估的协调效率
2026-01-22 10:43
涉及的行业与公司 * **行业**:半导体行业、AI计算行业、数据中心行业、信创产业[1][2][7] * **公司**:英特尔(至强、智强系列)、AMD、海光、飞腾、鲲鹏、龙芯[2][7][12][14][15] 核心观点与论据:CPU需求激增的驱动因素 * **AI发展导致供需失衡与供应链挤压** * AI推理需求增加,数据中心采购更多CPU,2025年Q1三大云厂商用于AI推理的至强级别芯片需求同比增长200%[1][7] * AI客户询单量在第一季度暴涨300%,但产能只能满足其中一小部分[1][2] * DRAM和NAND存储芯片需求激增,存储厂商抢购设备和材料,间接挤压了CPU厂商的产能扩张[1][2] * **新兴AI架构与技术显著增加CPU负担** * **Ngram架构**:采用分层存储,数据在DRAM、持久化内存和固态硬盘间的调度由CPU控制,当请求样本超过32时,CPU地址翻译耗时占延迟的1/3以上;内存寻址空间每增加100GB,CPU开销增加约18%[1][4] * **代理式AI与混合专家模型**:MOE模型调度复杂度提高,长文本上下文机制将Q cache管理从GPU移至CPU,大幅增加CPU工作量[1][5] * **Ingress架构**:旨在降低GPU门槛,但导致系统CPU压力增大,GPU利用率从85%下降至40%[1][8] * **地缘战略与国产化需求** * 美国对华禁售高端GPU,促使国内探索用CPU集群进行推理,验证了32核CPU跑大语言模型的性价比[3] * 国内信创和AI新基建驱动国产化CPU需求,2027年党政信创要求接近100%国产化[7] * 部分省级政务中心明确要求CPU算力不低于GPU算力的1.5倍[1][7] * **能效优势与多领域需求衍生** * ARM架构CPU每处理一个token的排放量仅为A700 GPU的1/5,结合液冷技术可将PUE降至接近1.1[3] * 需求衍生效应包括服务器及存储服务器需求旺盛、边缘计算(如自动驾驶、智能制造)从16核升级到64核、消费端提前装机、车载、机器人、物联网等领域需求增加[2][7] 核心观点与论据:市场表现与核心矛盾 * **价格与供应紧张** * 英特尔智强处理器价格上涨12%到20%,部分型号交货周期拉长至18周[2] * 一季度现货价格上涨10%-15%,部分型号涨幅达20%-30%[7] * 海光专用型号溢价接近30%,交货周期明显拉长[1][7] * 国产CPU(如海光、飞腾)AI专用型号溢价高但仍脱销[2][12] * **当前市场核心矛盾** * 核心矛盾在于能够稳定运行新架构的CPU需求大幅增加,而不仅仅是供不应求[13] * 供应链预测误差,未能预见AI时代对高性能CPU需求的大幅增长[13] * 代工厂新产能被提前锁定,渠道商和ODM厂商提前锁单囤货,放大恐慌情绪[7][13] * 在党政和行业信创领域,国产CPU产能缺口更为明显[13] * **国产CPU表现与机遇** * 国产CPU(如鲲鹏、飞腾、龙芯)在具体计算场景中性能达英特尔志强8,460系列的六至七成,价格仅为其40%左右,性价比显著[2][15] * 在信创压力下迭代出高核数、大内存的新型CPU,为新架构提供良好支持[14][15] * 迎来了历史机遇,供应链安全成为新焦点[14] 其他重要内容:未来展望与缓解瓶颈的策略 * **未来需求将持续增长** * 海外三大云厂商计划未来三年CPU采购预算超过GPU预算的1.5倍[2][10] * 国内在信创和AI双轮驱动下,CPU需求将继续保持增长趋势[12] * **缓解系统瓶颈的优化策略** * **CGAM策略**:分批处理任务,如将120个任务分两批(每批64个)处理,可节省约1.5倍能耗,但每增加1%的吞吐,延迟增加15%左右[9][11] * **自适应策略**:根据任务类型(如增强检索、代码执行、纯文本生成)选择最适合的处理器(GPU或CPU)[9][11] * **精细化调度优化**:包括预分配专家权重减少跨节点访问、使用DMA引擎搬运数据、融合算子以减少内核切换效率损失[2][9] * **AI时代计算系统性能提升趋势** * 性能提升主要依赖系统优化,而非单纯模型架构改进,数据搬运效率、调度及异构协同效率成为主要改进点[14] * 传统假设被打破:GPU越多越快不成立(当CPU成为瓶颈时);模型越小成本越低不成立(稀疏模型的CPU开销可能更高)[6]
黄仁勋谈过去一年AI模型的三大突破
第一财经· 2026-01-21 22:40
AI模型技术的三大突破 - 代理式AI取得突破 模型从存在幻觉发展到能够进行推理、计划和回答研究领域问题 实现应用[1] - 开源模型取得重大突破 首个开源推理模型DeepSeek推出 繁荣了开源推理模型生态 使众多公司、研究机构、教育从业者得以利用[1] - 物理AI取得巨大进展 AI不仅能理解语言 还能理解物理世界 例如生物蛋白质、化学、物理、流体动力学、粒子物理和量子物理[1] AI应用与投资趋势 - AI已在金融服务、医疗保健、制造业等场景应用并产生经济利益[3] - 2025年是风险投资规模最大的年份之一 大部分资金流向了AI原生公司 包括医疗保健、机器人、制造业和金融服务公司[3] AI基础设施建设热潮 - 人类历史上最大规模的AI基础设施建设正在进行 已投入几千亿美元 还有数万亿美元的基础设施需要建设[3] - 基础设施建设热潮带动相关产业 台积电宣布建设20座新芯片工厂 富士康、纬创、广达将建设30座新计算机工厂 美光等内存厂商也在投资[3] - AI产业在芯片层面的增长令人难以置信[3] AI对就业市场的影响 - AI基础设施建设将创造大量就业机会 例如需要水管工、电工、建筑工人、网络技术人员[3] - AI不会简单取代工作 而是提高效率并创造新需求 例如放射科医生数量因AI辅助而增加 医院接待能力提升[4] - AI提高了护士工作效率 有助于解决美国护士人数短缺的问题[4] AI的普及与易用性 - 每个国家都应参与AI基础设施建设 AI的易用性可能缩小技术鸿沟[4] - 结合开源模型与各地专有知识可创建有用模型 使用AI变得容易 没有计算机学位的人也能成为程序员[4] - 发展中国家的人们和学生群体应学习使用、指导和评估AI[4] AI产业需求与市场状况 - 评估AI泡沫可观察GPU使用情况 英伟达有数以百万计的GPU支撑云计算 租用GPU并非易事[4] - 在需求带动下 GPU租赁价格正在上涨 价格上涨不仅限于最新版本GPU[4] - 计算需求增加的原因是AI公司数量正在增加 且一些公司有大量经费投入AI[4]
咖啡机变聪明后,我连咖啡都喝不上了
36氪· 2026-01-19 08:17
行业现状与核心矛盾 - 生成式AI语音助手在智能家居基础控制任务上频繁失败,例如煮咖啡、开灯、播放音乐等简单指令执行不可靠[1][2][3] - 传统语音助手基于模板匹配,虽然笨拙但结果高度确定,而基于LLM的新助手引入了随机性,在需要即时、可重复、零容错的场景下存在问题[5][7] - 行业正经历从“单指令执行器”到具备理解、拆解和动态生成任务能力的“代理式AI”的能力范式切换[12][13] 技术瓶颈与挑战 - 核心问题在于尚未解决如何让LLM知道何时该精确、何时可以随机[1][11] - LLM不擅长生成完全一致、语法严格正确的系统调用,当其直接生成API调用控制真实设备时,微小偏差即可导致操作失败[8][9] - 理论上达到传统助手的可靠性需要大量工程投入、约束设计和失败兜底,但现实中公司倾向于先将技术推向市场再逐步修正[10] 用户反馈与市场反应 - 用户社区对升级后的AI助手在基础功能上的失败怨声载道,但承认其在理解复杂命令方面能力更强[14] - 新系统在处理如“调暗灯光、调高温度”的复合指令、解释系统状态(如查询为何未关音乐)、以及提供更丰富的安防通知(如描述摄像头检测内容)方面表现优于传统系统[15][16][20] - 用户讨论中形成温和共识,认为问题不在于引入AI,而在于是否试图用AI替代一切已验证的确定性执行机制[21][22] 发展前景与战略方向 - 行业坚定转向生成式AI的根本原因在于其巨大的潜力,即实现服务链式调用和动态生成执行逻辑的代理式AI能力[11][12] - 当前的混乱可能源于将生成式AI放置在不适合其特性的核心执行位置,而非技术本身的失败[24] - 更合理的发展方向可能是让AI帮助人理解系统,而非完全取代已被验证的确定性执行机制[22]