AI Agent
搜索文档
腾讯研究院AI速递 20251225
腾讯研究院· 2025-12-25 00:01
生成式AI开源与能力演进 - Anthropic开源Skills官方知识库,包含16个生产级技能库,涵盖文档处理、创意设计和开发技术类,并包含可创建新技能的skill-creator元技能,极大降低自定义门槛[1] - 字节跳动Seed团队推出Seed Prover 1.5,通过大规模Agentic RL训练,在16.5小时内针对IMO 2025前5题生成完整Lean证明代码,换算成绩35/42达金牌分数线,在Putnam 2025测试中9小时完成12题中的11题,在完整Putnam历史评估集解决88%问题[2] - 通义百聆开源新一代语音交互模型Fun-Audio-Chat-8B,在多项权威基准测评中斩获SOTA,采用创新双分辨率端到端设计,音频帧率降至业界最低5Hz,节省近50%GPU计算[3] AI Agent与交互范式创新 - Second Me发布1.1版本,重塑对话框使AI从“被动回复”转向“主动交付”,可根据上下文和情绪温度主动推送社交玩法,通过独创身份模型建模,可调用真实身份信息和记忆创作内容[4] - Notion已有700多个智能体与千名员工协作处理重复性工作,其联合创始人西蒙已成为效能提升30-40倍的工程师,同时指挥3-4个AI编码智能体[9] - 谷歌将2025定义为AI Agent、推理和科学发现的一年,Gemini 3 Pro在LMArena排行榜榜首,Gemini 3 Flash质量超越上一代Pro规模模型但价格仅为一小部分且延迟显著降低[7] 具身智能与硬件产品突破 - Vbot超能机器狗发布会全网直播热度超千万,上线仅52分钟订单突破1000台,创万元级具身智能产品达成纪录[5] - Vbot超能机器狗搭载128TOPS端侧AI算力(是主流竞品3倍以上)、自研N45高永磁电机(峰值扭矩24.5Nm),续航5小时,支持240W超级快充,可运行13.3km/h马拉松配速,9988元创始权益价打破高性能机器狗高价魔咒[6] - 谷歌在机器人技术方面取得重大进展,包括Gemini Robotics和Genie 3[7] AI技术发展趋势与行业影响 - Epoch AI年终报告显示,自2024年4月起AI能力增长速度明显加快比之前快近一倍,LLM推理价格下降10倍以上,顶级开源模型与顶尖AI差距不到一年,英伟达芯片算力每10个月翻倍[10] - 报告指出AI最大价值可能来自对经济体系工作的广泛自动化而非加速研发,2024-2025年能力爆发式提升可能很快放缓[11] - 图灵奖得主Bengio认为认知型工作更易被AI取代,机器人技术虽暂时落后但只是时间问题,即便“水管工”等体力工作也只是暂时安全[7] - Notion CEO将AI比作无限心智的时代材料,认为知识经济将像钢铁和蒸汽改变城市一样被AI重塑,未来组织将跨越数千智能体与人类、跨时区持续运转[9]
AMD大中华区纪朝晖:AI Agent大时代需要什么样的设备?
中国基金报· 2025-12-24 21:37
行业趋势与AI Agent发展 - AI被认为是50年来最重要的技术变革,其重要性甚至超过互联网,未来几十年人类科学进步与技术创新将主要围绕AI展开,AI将彻底改变工作、生活、生产、学习和艺术 [2] - AI Agent是AI从对话机器人转变为真正生产力工具的关键,也是AI赋能千行百业进入快车道的关键 [2] - 行业已正式进入AI Agent时代,2025年已有40%的美国企业和27%的中国企业开始使用AI Agent [3] - 到2026年,预计40%的新增就业岗位将要求与AI及AI Agent协同工作,这将改变传统职位结构与就业履历要求 [3] - 到2027年,预计全球2000强企业智能体的使用率与使用量将增长10倍,调用负载将增长1000倍 [3] AMD公司战略与市场定位 - AMD定位为高性能和AI计算的领导者,致力于解决全球面临的重大挑战,并成为AI时代的赋能者 [2] - 公司致力于制定全方位的云边端AI解决方案 [2] - 公司响应中国“人工智能+”行动号召,启动了面向高校的“春雨计划”,旨在培育新时代人工智能人才,共建开放开源的AI软件生态,共创“AI+千行百业”的应用示范案例 [6] 端侧AI与核心产品技术 - 未来3到5年内,人与AI交互的两个主要接口将是AI手机和AI PC,其中手机是学习、娱乐、生活及内容消费的主要接口,PC则是工作、学习及内容创作与生成的主要接口 [3] - 一个可用的端侧/边缘侧AI推理平台需要部署高精度基座模型、加入行业专属知识库(RAG技术)、配备多个协同工作的AI Agent以及制定严格的SOP规范,大约需要60GB到100GB内存才能运行 [4] - AMD推出了集成端侧AI大模型功能的锐龙AI Max+ 395处理器,该SoC单芯片包含CPU、GPU及NPU神经引擎,其GPU性能相当于RTX 4060到4070级别独显 [4][5] - 该处理器可本地部署千亿级参数模型(如GPT-4),推理速度达60+ tokens/s,具备内存超大、体积小巧、环境友好的特点 [5] - 通过该产品,AMD将AI设备的成本降至原来的1/10,旨在加速端侧AI在学校及千行百业的普及 [5] 产品应用与市场影响 - 端侧AI产品可作为中小企业特定领域的专家助手、家庭AI设备中枢,应用于边缘场景 [5] - 举例说明,将GPT-4等120亿参数模型与哈佛医学院知识库及本地医院数据结合,构建的医生专家助手在美国医生资格考试中可获得92分 [5] - 除了端侧产品,AMD还拥有面向工作站的Threadripper处理器、面向数据中心的EPYC处理器和针对台式机的锐龙处理器,并在影视工业成为好莱坞标准的选择 [6] - 公司运用AI技术帮助中国山西运城的永乐宫进行有800年历史的壁画文物数字化修复,通过训练AI画师重现了古代色彩 [6] 市场活动与行业论坛 - AMD大中华区市场营销副总裁纪朝晖在“2025机器人产业和AI投资论坛”上发表题为《共创人工智能+文化艺术新范式》的演讲 [1] - 该论坛是首届“香港国际AI艺术节”系列活动之一,艺术节以“预见未来:现实与无界”为主题,致力于打造亚洲首个聚焦技术与艺术深度融合的国际盛事 [1]
AMD大中华区纪朝晖:AI Agent大时代需要什么样的设备?
中国基金报· 2025-12-24 21:29
文章核心观点 - AMD公司高管在论坛上阐述,人工智能是未来几十年技术创新的核心,将彻底改变工作、生活、生产、学习及艺术等领域,而芯片是驱动AI无处不在的引擎 [1][6] - AI Agent是AI从对话工具转变为真正生产力工具的关键,正推动“AI+千行百业”进入快车道,其发展将深刻改变就业市场和企业运营模式 [5][6][7] - 端侧设备(如AI手机和AI PC)将成为人与AI交互的主要接口,运行高效的AI Agent需要强大的本地芯片支持,AMD通过集成化SoC方案大幅降低了部署门槛和成本 [7][8][9] - AMD作为高性能与AI计算领导者,提供了从云到边到端的全方位AI解决方案,并积极通过产品创新、行业应用及人才计划响应中国“人工智能+”行动,赋能各行业数字化转型 [6][9][10] AI发展趋势与产业影响 - AI被AMD CEO视为50年来最重要的技术变革,其重要性甚至超过互联网 [6] - 行业专家认为AI Agent的成熟可能需要10年时间,但它是AI转化为生产力的关键 [6] - 根据IDC数据,2025年已有40%的美国企业和27%的中国企业开始使用AI Agent [7] - 到2026年,预计40%的新增就业岗位将要求与AI及AI Agent协同工作 [7] - 到2027年,全球2000强企业对智能体的使用率与使用量将增长10倍,调用负载将增长1000倍 [7] - AI Agent的能力释放已产生市场效应,例如某AI手机通过AI升级后,价格从3499元涨至7999元仍供不应求 [7] 端侧AI的计算需求与解决方案 - 未来3到5年,AI手机和AI PC将成为人与AI交互的两个主要接口 [8] - 一个可用的端侧/边缘侧AI推理平台需要部署高精度基座模型、结合行业知识库(RAG)、配备多个协同工作的AI Agent以及制定严格的SOP规范 [8] - 此类平台需要大约60GB到100GB的内存才能运行 [8] - AMD推出了锐龙AI Max+ 395处理器,将端侧运行AI大模型的功能集成于单颗SoC中,其包含CPU、GPU和NPU [8] - 该处理器的GPU性能相当于RTX 4060到4070级别独显,可本地部署千亿级参数模型(如GPT-4),推理速度达60+ tokens/s [8] - 该方案将AI设备的成本降至原来的1/10,有助于推动AI在教育和各行业的快速普及 [9] AMD的产品布局与行业应用 - AMD产品布局丰富,在数据中心、工作站等多个领域拥有世界领先的产品 [6] - 公司产品线包括面向工作站的Threadripper处理器、面向数据中心的EPYC处理器以及针对台式机的锐龙处理器 [9] - 在影视工业领域,AMD已成为好莱坞的标准选择之一 [9] - AMD运用AI技术协助中国山西运城永乐宫进行800年历史壁画的数字化修复,通过训练AI模型重现古代色彩 [9] - 公司响应中国“人工智能+”行动号召,启动了面向高校的“春雨计划”,旨在培育AI人才、共建开源软件生态并共创行业应用示范案例 [10] 论坛背景 - 该演讲在“2025机器人产业和AI投资论坛”上发表,该论坛是首届“香港国际AI艺术节”的系列活动之一 [4] - 艺术节主题为“预见未来:现实与无界”,旨在打造亚洲首个聚焦技术与艺术深度融合的国际盛事,助力香港建设国际创新科技与文化艺术交流中心 [4]
豆包手机后思考:AGI会在中国率先跑出来吗?
36氪· 2025-12-24 17:40
文章核心观点 - AI的发展正从“思考”阶段迈向“行动”阶段,其商业价值的关键在于获得执行能力而非仅提供建议 [2][4] - 手机因其高频使用、高行动密度及掌握系统权限,成为“行动型AI”竞争的首要试验场 [8] - 中国市场凭借高密度标准化服务、完整的线上线下闭环、用户高接受度及产业快速协同能力,成为AI Agent规模化落地的最佳试验田,并可能率先跑通新模式 [3][21][23] AI价值共识:必须从“思考”迈向“行动” - “思考”型AI面临商业天花板,OpenAI 2025年第三季度支出攀升至36.5亿美元,同期收入仅20.6亿美元,每赚1美元需在算力上花费1.8美元 [4] - AI基础设施投资激增但利润未同步提升,2024至2025年间投资从150亿美元激增至1250亿美元,增长近8倍 [6] - 当前大模型收费方式以Token计价和调用次数计费为主,本质是API生意,单位价值有限且高度可替代,更像效率工具而非不可或缺的生产要素 [6] - AI的下一个价值点在于“行动”能力,Agent作为跨应用、跨服务的调度中枢,将重新定义数字经济的收费方式和价值分配逻辑 [7] 手机成为AI行动的关键载体 - 中国成年用户平均每天使用手机约6.2小时,完成超过120次数字动作,95%的高频任务发生在手机上,是用户“行动密度”最高的终端 [8] - 手机操作系统天然掌握AI行动所需的应用安装调用权限、前后台调度、身份认证、支付接口等关键基础设施 [8] - 在结构性条件下,手机终端成为各方验证AI商业价值的首要试验场和“行动型AI”竞争中最先被点燃的战场 [8] Agent竞争格局:三方势力试水“AI执行” - **基础模型服务商**(如阿里、百度、腾讯):通过“模型+自家应用生态”承载Agent能力,在单一App内形成执行闭环,优势在于模型能力强、生态协同度高,但权限止步于App之外,行动范围受限 [10] - **终端厂商**(如OPPO、小米、vivo、荣耀):将“大模型+系统级助手”确立为核心方向,让AI在操作系统层完成任务拆解与跨应用执行,优势在于天然掌握系统级权限,但需谨慎推进以维护生态稳定 [10][11] - **原生AI厂商**(如豆包):选择激进路径,通过与终端厂商在OS层深度合作,让大模型以虚拟用户方式操作手机界面,直接争夺系统层行动入口,但易遭遇应用方的权限限制和防御 [12] - 当前Agent探索大多被限制在各自生态边界内,真正决定成败的是在不打破既有秩序的前提下为AI争取到足够行动空间 [13] 产业结构重塑与深层挑战 - AI Agent的引入暴露了体系性矛盾:操作权限从绑定人类用户转向非人类智能体,导致权限边界模糊、传统授权逻辑松动 [14] - 商业模式面临挑战,当决策者变成Agent,依赖人类注意力的广告与推荐闭环被打破,价值衡量与收益分配缺乏答案 [14] - 责任机制缺位,AI出错造成损失时,责任归属在法律与制度上尚未明确 [14] - 核心挑战源于基础设施缺失,大量应用为人类操作设计,缺乏标准化动作接口和可验证结果的能力,整个生态未为AI“行动”做好准备 [14] - 冲突倒逼产业加速入场,例如智谱推出具备“Phone Use”能力的AutoGLM,能自动完成打开APP、下单、支付等复杂操作,被视为全球首个具备此类能力的开源代理模型 [15] - 一些SaaS和B端服务正弱化复杂UI,提供更清晰、可预测的指令化接口,为Agent预留入口 [16] 中国市场成为AI Agent最佳试验田 - 全球AI技术竞争白热化,模型能力进化周期从“以年计”压缩到“以月计”,2023-2024年间主流模型在推理基准上的正确率提升幅度普遍超过20个百分点 [18] - AI Agent规模化落地需要密集且标准化的服务场景、完整的线上线下闭环、用户高接受度、快速产业协同及统一的治理体系 [21] - 中国市场具备独特优势:服务高度平台化(外卖、出行、零售等),任务具备清晰接口;支付、履约体系全面数字化;用户对自动化接受度高;模型、终端、App与服务平台之间具备快速联动能力 [23] - 数据对比:中国用户月均使用App约25–30个,前5大超级App占用户总使用时长大60%;美国用户月均使用App约40–45个,前5大App使用时长占比不足35% [21] - 豆包手机所代表的Agent形态率先出现在中国是市场条件成熟后的自然显现,中国市场正在验证AI Agent规模化运行的可能,未来可能输出一整套围绕AI行动重构的新AGI操作系统 [23]
环球问策|天威诚信李延昭:量子计算倒逼证书管理升级,技术方案要兼顾合规与实用
新浪财经· 2025-12-24 14:29
文章核心观点 - 量子计算的潜在威胁正迫使数字安全行业提前应对 现行基于传统加密算法的数字身份系统面临挑战 行业正通过缩短证书有效期等短期措施和研发自动化管理系统等长期方案来应对[1][3] - 天威诚信作为数字安全领域公司 通过提供融合国际先进技术与国内自主研发的双轨解决方案来应对行业挑战 并已布局AI智能体身份认证与监控这一新兴方向[6][7][8] 量子计算对网络安全的影响与行业应对 - 量子计算虽处实验室阶段 但其发展可能遵循“摩尔定律” 谷歌Willow量子芯片相比上一代总出错率降低了20倍 错误率呈指数下降 走出实验室只是时间问题[1] - “预存攻击”成为现实威胁 攻击者无需立即解密 而是存储敏感数据等待5年、10年后量子计算机成熟再解密 这对政府、金融机构等需长期存储敏感数据的主体威胁尤为严峻[3] - 为应对量子计算威胁 SSL/TLS证书有效期从最长5年逐步缩短至3年、2年、1年 未来3年内将进一步缩短至47天 核心逻辑是减少密钥暴露时间以降低被破译风险[4][5] - 证书有效期大幅缩短至47天意味着企业每年需完成8次更新 对于拥有成百上千甚至上万台服务器的企业而言 人工操作已不现实 管理难度大幅提升[4][5] - 缩短有效期仅是权宜之计 根本解决方案是建立自动化证书管理子系统 实现证书申请、推送、覆盖的智能化与自动化 替代传统人工管理模式[5] 天威诚信的解决方案与业务布局 - 天威诚信与全球最大证书公司Digicert拥有25年深度合作历史 能提供国际先进解决方案 如SSL双证书解决方案 以应对47天有效期的挑战[6] - 公司形成双轨解决方案 一方面提供完全适配国内信创环境、安全标准和政策要求的自主研发系统 另一方面引入国际头部的DCone平台以满足企业出海、商业化互联网及外企需求[6] - 公司认为AI与证书结合是重要发展方向 核心是为每个AI智能体赋予唯一身份 使其操作可追踪审计 结果可完整保存 实现百分百监控[7] - 公司已提前布局 正与多家AI公司合作 聚焦AI智能体的身份构建、行为监控与审计领域 通过建立身份系统和审计智能体生成活动报告[8] - 公司预测相关商业模式可能普及 例如招聘网站可能从传统人才招聘转型为AI智能体出租服务 通过每日报告向企业反馈工作成效[8]
字节做了个 AI 手机,钉钉做了台 AI 主机
机器之心· 2025-12-24 11:41
文章核心观点 - 行业正从“人操作App”向“AI操作Agent”转变,AI硬件成为定义设备新角色的关键入口[4] - 钉钉发布AI主机“DingTalk Real”,旨在为企业AI Agent提供一个独立、安全、可控的物理执行环境,以解决云端Agent无法触及本地数据与本地Agent存在安全合规风险的两难问题[2][5][13][14] - 钉钉通过“AgentOS”操作系统与“DingTalk Real”硬件协同,构建了一个多Agent可被统一调度、协作和治理的企业级AI工作体系,标志着AI开始深度融入并重构企业工作流程[21][23][32][39] AI硬件新趋势:从手机到主机 - 2025年底AI硬件领域活跃,月初豆包AI手机上线引发自动化体验与平台风控的讨论[1] - 钉钉随后发布第二款AI硬件“DingTalk Real”,一款定位为“真实可见、可触”的AI Agent执行载体的AI主机,将竞争场景从消费端延伸至企业端[2][4] - 两者共同指向设备角色的重新定义:从“人来操作App”变为“AI来操作Agent”,人只需提出需求[4] DingTalk Real:为AI Agent提供独立办公空间 - 产品定位为“给硅基员工一间独立办公室”,是一台部署于企业本地的独立物理主机[6][17] - 核心功能是运行AgentOS,让员工可远程唤醒AI Agent,这些Agent在授权范围内安全访问内网、本地文件及业务系统,并能串联任务、协同工作[11] - 设计解决了当前Agent部署的两大痛点:云端Agent难以访问本地资源,而本地部署又面临权限与安全风险[13] - 通过提供独立的手机与电脑运行环境,Agent可像真人一样操作各类应用,所有任务在隔离环境中执行,不触碰员工真实设备,从源头规避安全问题[16] - 硬件7×24小时在线,确保Agent访问实时数据,且不占用员工设备,任务可后台持续运行,同时关键决策仍需人工确认[17] - 产品已完成工程化与企业级打磨,将于2026年1月进入正式可交付阶段[35] AgentOS:AI工作操作系统的架构与协同 - AgentOS是钉钉打造的企业级AI工作操作系统,作为统一的任务调度与协同中枢[21][23] - 系统架构包含多个层级:内核底层负责任务规划、调度及企业治理;钉钉ONE作为新一代桌面入口;AI搜问负责理解用户意图并调度资源;超级Agent“悟空”承担具体执行与协同工作[24][27][28][30] - “悟空”作为通用AI Agent,具备自主规划、执行和反思能力,可调用钉钉内、第三方及企业自建的各类Agent和工具[30] - DingTalk Real硬件是该体系的关键组成部分,为Agent提供所需的独立运行环境[31] - 底层由钉钉开放平台支撑,可接入各类大模型、企业自建模型及MCP组件,未来钉钉所有AI产品都将基于AgentOS构建[32] 已实现的企业级应用场景与生态构建 - 在AgentOS与DingTalk Real协同下,已跑通AI差旅、AI招聘、AI客服等多个高频企业场景[33] - 例如,在差旅场景中,DingTalk Real可自动在手机环境中操作比价App,完成全网比价排序,为企业节省成本[34] - 钉钉自身正进行深度重构,推动产品全线Agent化、MCP化,并向开发者开放以共建生态[39] - 目前已构建起全球最大的企业级MCP广场和AI助理市场,并通过算力分成、按效果付费等机制绑定业务价值[40]
以“智能+平台+生态”重新定义城市安全范式 新智聚安入选2025爱分析AI Agent权威报告
中金在线· 2025-12-24 11:00
行业政策与市场格局 - 全球科技格局正经历由生成式人工智能驱动的深刻范式革命[4] - 国务院于2025年8月印发《关于深入实施“人工智能+”行动的意见》,旨在推动人工智能与经济社会各行业各领域广泛深度融合,并将Agent提升至“新基础设施”的地位[4] - 智能体被视为构建“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”的基础性要求,已成为国家深化产业创新、促进技术普惠和成果共享的关键机制[4] - 权威研究机构爱分析发布了《2025爱分析・Agent厂商全景报告》和《2025爱分析・AI Agent实践报告》,对Agent市场进行了系统研究和重新梳理,形成了最新的市场全景地图[4] 公司入选与核心能力 - 新智聚安入选“AI Agent领域大模型代表厂商”、“AI Agent开发管理平台”及“AI Agent典型实践案例”,成为同时覆盖“产业大模型+AI Agent能力”双赛道的标杆平台厂商[1] - 公司成功构建了行业领先的“安全大模型”和“城市安全能力库”,实现Agent能力创新涌出[7] - 公司聚焦以“智能+平台+生态”模式可持续、低成本、高效地解决城市安全难题[7] - 能否将大模型的认知能力转化为可执行、可闭环的业务动作,以智能业务引擎推动组织向高效、智能与韧性演进,是衡量AI Agent核心价值的重要标准,而公司在特定业务领域具备成熟的解决方案和落地能力[4] 业务实践与案例价值 - 在《某市燃气监管部门安全监管治理实践案例》中,公司通过角色智能与多主体协同机制,系统性地重构了该市商户燃气安全治理模式[7] - 该实践有效连接政府、企业、商户与公众四方,构建起“产业为核、数智赋能、多方共益”的全新协同体系,实现了从传统被动响应的管理模式到主动预防、协同共治的根本性转变[7] - 实践变革的成功基于三大关键维度:通过Agent构建跨部门协同网络破解“治理孤岛”;实现从风险感知到处置行动的完整闭环,推动治理模式转向主动干预;培育开放生态,为城市智能的持续进化奠定长效机制[8] - 公司通过“连接、赋能、孕育”,在协同治理、风险应对与生态共建方面展现出显著价值,为城市的可持续发展提供了坚实支撑[8] 公司战略与未来展望 - 公司致力于以智能助力城市本质安全能力提升,将安全治理从成本中心转化为增强城市韧性的核心竞争力,构建了独特的产智共创、能力共建模式[7] - 公司平台成功构建安全风险预警-协同共治的生态,赋能政府伙伴、燃气企业、生产企业、中小餐饮、社区等客户的安全管理与运营[7] - 未来,公司将持续深耕城市安全治理领域,不断完善安全专业能力平台,推动大模型与Agent能力在更多关键场景中复用与拓展,为构建全域智能、主动韧性、共建共享的城市安全新格局持续赋能[8]
创业者思考:如何做 AI Agent 喜欢的基础软件?
Founder Park· 2025-12-23 19:34
文章核心观点 - 基础软件(Infra)的主要使用者正从人类开发者迅速转向AI Agent,这要求软件的设计理念、接口和商业模式进行根本性重构 [1] - 在TiDB Cloud的生产环境中,超过90%的新建数据库集群由AI Agent直接创建,标志着这一趋势已成为现实 [1] 当AI Agent成为核心用户时,软件应具备的本质特征 稳定且可扩展的心智模型 - 软件暴露给AI用户的不再是UI或API,而是其背后的心智模型,AI在训练中已内化了大量关于底层系统(如文件系统、SQL)的稳定假设和模式 [2] - 设计给Agent使用的软件应主动顺应这些已被训练进模型、存在数十年的古老心智模型(如文件系统、Bash Shell、Python、SQL),而非发明全新的接口 [4] - 好的心智模型特征是可扩展的,允许在不破坏原有模型的前提下引入新实现,例如Linux VFS或试验性文件系统agfs,它们保持了文件系统的接口约束,但底层实现了向量索引等新能力 [5] 生态与语法的重要性变化 - 对于AI Agent而言,特定语法(如MySQL与Postgres之别)或社区文化等“偏好性差异”意义不大,只要接口稳定、语义清晰、生态完备即可 [6] - 生态之所以重要,是因为流行的软件对应着经典、稳固且已被LLM广泛学习的心智模型(如SQL),在此框架下,具体选择哪种“方言”并非关键 [7] - 这意味着在范式级别进行创新将更加困难,因为AI更倾向于使用它已经理解的系统 [7] Agent友好的系统接口设计 可被自然语言描述 - 友好的接口要求软件能力本身适合用自然语言表达意图,图形界面因难以用语言精确描述而对Agent不友好 [10] - 自然语言虽有歧义,但LLM擅长结合上下文猜测意图,成功率在多数工程场景下已足够高 [11] - 当系统底层心智模型正确、接口语义稳定时,上层的少量歧义不会成为系统性问题,Agent可通过反馈和尝试来消解 [12] 可被符号逻辑固化并交付确定性结果 - 自然语言适合表达意图,但执行必须收敛到无歧义的中间表示(如SQL、脚本、代码),以实现任务的复用、组合和自动化验证 [14][15] - 系统需清晰定义“歧义被彻底消除”的时刻,从而将模糊意图冻结为确定、可存储复用的结构 [15] - 目前最好的逻辑符号描述是代码,因其能用尽可能少的Token实现最多的可能性,具有极高的认知密度,例如用一段Python脚本描述规则,即可应用于任意规模的数据 [16][17][18][19] AI Infra's Infra的必要特征 支持日抛型工作负载 - Agent产出的工作负载本质上是日抛型的,重视开箱即用、随时创建和无负担丢弃,而非长期稳定运行 [22] - Infra设计需假设实例便宜、生命周期短、数量增长快,例如Agent常并行拉起多个分支进行尝试,成功后即放弃其他分支 [23] - 代码生产能力被极大释放,大量过去因成本被忽略的长尾需求变得可行,预计基础软件的租户数量将爆炸性增长,但对服务连续性和可靠性的需求并未下降 [24] 实现极致的低成本 - 为满足大量低频访问的长尾需求,系统成本必须极低,不能为每个需求提供真实的物理实例 [26][27] - 必须引入虚拟化(如虚拟数据库实例、虚拟分支),在实现极致资源复用的同时,让Agent在交互层面感觉拥有独立的、可随意折腾的环境 [28][29] - 这种“看起来像独占,实际上是虚拟化”的设计,是构建可规模化、超低成本Agent Infra的前提条件,否则将限制Agent并行探索的优势 [30][31] 提升单位时间可撬动的算力 - 当前多数AI交互是串行对话模式,单位时间调动的算力受限于单次请求对应的单块GPU [32] - Agent天然倾向于并行探索,例如将阅读数百篇论文的任务分发给成百上千个Agent并行处理,这需要Infra能支持低成本快速创建大量“工位”,并稳定地分发任务、收敛结果 [33][34] - 这提出了对能支持大规模并行、任务分发与管理的Infra系统的需求,可能是一个K8s和Hadoop级别的机会 [34] Agent时代商业模式的演变 使过去不经济的模式变得合理 - 过去因成本过高而被搁置的定制化、长尾需求(如小超市的库存管理系统),因AI Agent极大降低了实现边际成本而变得可行 [35][36] - AI Agent将“计算”民主化,许多以前算不过账的需求,并非消失,而是实现成本终于降到足够低 [36] 从卖Token转向云服务模式 - 单纯卖Token的商业模式有结构性缺陷,随着使用量增长,边际成本不会自动下降,商业上较为脆弱 [37] - 成功的AI Agent公司应更像将目标用户群体放大100倍、1000倍的云服务公司,关键在于将持续的Token消耗沉淀为“boring”的、可复用的在线服务或系统能力,从而极大摊薄边际成本 [37] - 底层服务(如云服务、数据库)形态可能很传统,但使用这些服务的用户群体被Agent放大了几个数量级 [38] - 以Manus 1.5为例,其ARR已超过1亿美元,其商业模式代表了一种趋势:将Agent的单次关键推理成本,转化为有规模化效应的传统云计算生意 [39]
a16z“2026年AI Agent三大猜测”:输入框的消失,代理使用优先,语音代理的崛起
硬AI· 2025-12-23 17:24
文章核心观点 - AI正从被动响应的聊天工具进化为能够主动观察、诊断并执行任务的“代理”,这一根本性转变将深度重塑软件和劳动力市场 [2][3] 用户界面交互的演变 - 到2026年,作为AI应用主要用户界面的输入框将会消亡,下一代应用将通过观察用户行为主动介入并提供待审核的行动方案 [3][4] - 交互模式将从“提示”转向“执行”,AI将从“被动响应”转向“主动观察与干预” [3][13] - 理想的AI代理应像最具主动性的“S级员工”:识别问题、诊断根源、实施解决方案,最后仅需人类批准 [4][13][15][16] 市场规模的跃迁 - AI的目标市场正从全球每年3000亿至4000亿美元的软件支出,转向仅美国就存在的13万亿美元劳动力支出,市场机会扩大了约30倍 [4][13][14][15] 产品设计逻辑的重构 - 软件设计将从“以人为本”转向“代理优先”,新的优化方向不是视觉层级,而是“机器可读性” [3][8][13][18] - 为吸引人类注意力而优化的原则(如5W1H)和精美UI将面临重构,设计将转为服务智能体的消费 [8][18][19] - 品牌竞争可能从吸引人类注意力转向“生成引擎优化”,甚至出现大量针对AI抓取而生成的超个性化、高频内容 [8][13][20] 语音代理的规模化部署 - AI语音代理已从技术演示走向真实企业的大规模采购和部署,发展为一个完整的产业 [3][11][21][26] - 在医疗保健领域,语音代理被用于日程安排、术后随访甚至精神科初诊,主要驱动因素是行业高流动率和招聘困难 [11][16][22] - 在银行和金融服务领域,语音AI因能100%遵守合规规定且表现可追踪,其可靠性优于人类 [11][16][22] - 在招聘领域,语音AI可为候选人提供随时可进行的面试,优化招聘流程 [11][22][23] - 未来有望在政府公共服务(如911非紧急电话、车管所业务)及消费级健康保健领域得到更广泛应用 [16][25][26] AI代理的能力与影响 - AI代理能够处理完整业务闭环,例如未来的AI原生CRM可持续分析销售机会、挖掘沉寂线索并自动执行起草邮件、整理日历等任务 [17] - 在安全运营或事故解决等复杂、高责任场景,人类仍将长期保持在回路的最终决策角色,但在其他场景(如自主回答问题)人类已开始退出循环 [20] - AI技术不会直接取代工作,但使用AI的个人或服务商将获得竞争优势,这可能深刻变革传统呼叫中心和业务流程外包行业 [11][23]
豆包“破局” AI智能体未来什么样
中国青年报· 2025-12-23 04:29
文章核心观点 - 字节跳动发布的“豆包手机助手”作为系统级AI智能体,实现了跨应用操作,引发了与微信、淘宝、金融App等主流平台的冲突,揭示了移动互联网生态在流量入口、数据安全及商业模式方面正面临深刻变革 [1][4] - 冲突的核心在于安全防控与商业利益的博弈,AI Agent通过模拟操作或成为新流量入口,可能动摇超级App的广告和佣金收入基础,涉及潜在千亿元级市场影响 [3][4][5] - 行业共识认为AI Agent将带来人机交互方式的根本性变革,但短期内不会完全取代超级App,未来生态建设需解决技术标准、数据产权、商业模式及监管机制等关键问题 [5][6][7][9][10] 豆包手机助手的技术与市场反应 - 豆包手机助手是字节跳动与中兴合作推出的工程样机nubia M153上的技术预览版,能在操作系统层面实现跨应用操作,如点外卖、订机票、比价购物 [1] - 该助手通过模拟人类手势操作屏幕的路径实现功能,上线次日即遭遇微信、淘宝、多家银行App以“登录环境异常”、“风险环境”为由的限制,成为重点风控对象 [1][3] - 开售第一天豆包AI手机即售罄,体验显示其能执行如预订机票等任务,例如根据语音指令找到票价504元的直飞机票,但过程“还不是很丝滑” [2] 安全性质疑与平台限制动因 - 网络安全专家指出,豆包手机助手通过底层技术读取屏幕执行任务,未清晰交代如何解决用户隐私保护问题,这给了平台方合理的限制理由 [3] - 教授分析指出,其跨应用操作方式在现有安全体系下与外挂程序较难区分,因此触发了相关App既有的安全防御机制,并非专门针对该助手 [4] - 平台方强调,手机助手执行任务需用户授权,过程有明确展示并可中断,并借助硬件级隔离与加密保护用户数据,不会用敏感数据训练模型 [4] 流量入口与商业利益博弈 - 截至今年10月末,中国移动互联网用户数达16.17亿户,淘宝、美团等超级App依靠用户高频使用构建广告、佣金等多元收入体系 [4] - 专家分析,豆包手机助手若在操作系统层掌握流量分发权,将替代超级App成为新入口,直接影响其广告收入,规模可能达千亿元级 [4][5] - 对于排名不靠前的App,AI Agent可能带来效率提升、技术赋能和新变现场景的机会 [5] AI Agent引发的行业生态变革 - AI Agent并非行业首创,荣耀、京东、OPPO等此前已推出具备AI功能的手机或系统功能,但豆包助手因实现路径不同引发广泛限制 [3] - 专家认为,AI Agent与超级App并非二元对立,其核心是带来交互方式的根本性变革,通过自然语言交互压缩任务步骤,降低用户认知负担 [5][6] - 短期内超级App不会彻底消失,如快手、B站、小红书等提供的沉浸式体验难以被纯语音交互替代,AI Agent更多是改变交互方式而非终结App [7] 主要企业的战略布局 - 腾讯总裁在2025年三季度财报会上透露,微信最终会推出自己的AI Agent [8] - 阿里巴巴近日成立了千问C端事业群,首要目标是将千问打造成AI时代用户的第一入口 [8] - 字节跳动表示没有自研手机计划,正与多家手机厂商洽谈豆包手机助手合作,并与联想集团开展合作,为其设备预装AIGC插件 [11] - 北京智谱华章科技股份有限公司于12月9日开源了具备“PhoneUse”能力的AI Agent模型AutoGLM,供硬件厂商和开发者使用 [11] AI Agent未来发展的关键挑战与方向 - 需建立行业通用的智能体协议标准,以解决AI Agent与App互联互通的技术基础问题,避免野蛮生长造成的浪费 [9] - 商业模式可能从基于个人画像的精准广告,转向基于高价值转化的分销佣金模式 [9] - 数据产权界定是关键挑战,用户授权AI Agent获取平台数据仍需平台同意,可能形成高壁垒,需建立数据合理使用制度及安全港措施 [10] - 监管可采取“分级分类”思路,根据用户依赖程度和权限(如支付、隐私)进行分类,制定不同层次的监管机制 [10] - 社会对高质量数据集的安全共享有迫切需求,需构建底层基础设施推动数据共享,进而推动AI Agent互联 [10]