Workflow
智能体
icon
搜索文档
不依赖云端!vivo把“AI大脑”直接装进你的手机
21世纪经济报道· 2025-10-11 18:44
模型技术突破 - 公司构建了全球首个专为端侧Agent(智能体)构建的30亿参数模型,具备多模态、推理、长文本、面向UI Agent等五大能力优势 [1] - 该30亿端侧多模态推理大模型在10B以内大模型中能力断层领先,在权威榜单OpenCompass、SuperCLUE手机端侧大模型测试中表现出众 [2] - 该模型在行业内率先实现用2G运行内存支持128K长上下文能力,并能理解手机界面、执行跨应用操作,成为全球首个为端侧Agent构建的3B模型 [4] 用户体验提升 - 端侧模型小型化使AI具备“即时响应”和“离线工作”能力,可在无网络环境下处理长达128K的本地文件,实现无时无刻的可靠陪伴 [5] - AI从“对话者”进化成“执行者”,具备“看懂世界”和“动手操作”的能力,能理解图片并自动完成跨应用操作 [6] - 行业首个“端侧模型训练引擎”赋予手机本地学习进化能力,用户习惯和偏好可塑造专属于个人的“数字生命体” [6] 生态开放战略 - 公司搭建“蓝心个人智能框架”,从感知、记忆、规划、执行四个维度建设,旨在用户与智能体服务间搭建桥梁 [8] - 面向开发者的“蓝心智能开放平台”将个人化能力开放,意图框架2.0全面兼容MCP协议,推出适配智能体协议A2A,积极推进端侧模型能力开放 [10] - 已有超过50家生态伙伴接入开放平台,引入200多项服务,通过建立行业标准、开放技术能力推动产业从“技术竞赛”走向“生态共赢” [10][12]
专访汤道生:元宝重兵投入这半年
搜狐财经· 2025-10-10 18:42
公司AI战略与组织调整 - 国内大模型市场趋于集中,开源成为重要战略,DeepSeek的横空出世是重要变量 [3] - 公司AI产品服务从原来只基于混元大模型,转变为开放整合多家大模型 [3] - 2024年12月,云与智慧产业事业群(CSIG)与技术工程事业群(TEG)再度搭配,CSIG承担前端产品责任,TEG专注底层混元大模型,类似云服务合作模式 [3][7] - 将原技术团队孵化的元宝产品调整至业务部门,由拥有To C产品经验的负责人带领,任命原腾讯会议负责人Lori Wu负责元宝 [4][7] - 公司将浏览器、搜狗与输入法等工具类产品转到CSIG,以强化AI场景联动 [9] 元宝产品发展关键决策 - 元宝在国内同类产品中第一个全面拥抱第三方模型,优先接入DeepSeek R1,决策过程仅两三天,基于用户强烈需求 [3][18][20] - 决策核心是“以用户需求为本”,只要对产品价值大于包袱成本就应执行,大部分用户不关心模型是谁做的 [24] - 微信对元宝的支持力度前所未有,包括广告位、新闻插件、视频号与公众号可被@元宝点评,微信内可转发文件给元宝进行总结分析 [25][27] - 元宝团队重建需要大量招聘懂大模型的产品经理、搜索专家及模型后训练研究人员,每周持续面试 [28][29] - 元宝的目标是成为C端搜索信息的新入口,公司视其为继移动互联网后的关键战役,希望拿到AI时代的船票 [9][81] AI产品与技术洞察 - 新一代搜索服务更倾向由大模型理解意图,再针对性查找最新、最权威内容,是智能体驱动(Agent-driven)的方式 [11] - 2025年被认为是Agent元年,模型逻辑推理能力只是AI产品体系的一部分,还需搭配搜索、语音、专业数据、服务生态等能力 [11] - 大模型与搜索联动有两种路径:先搜再交模型解读,或模型先理解意图再去搜,需大模型判断,两者都有 [30] - AI Chatbot产品形态过去两年变化不大,对话仍是核心,但未来会涌现不同产品形态,不同玩家有不同侧重 [63] - AI可视为“生活上的操作系统”,是获取服务或资源的媒介,但比传统操作系统更智能、强大,能自主分解任务并协调资源完成 [64][65] To B市场与商业化 - AI在To B是激烈战场,国内头部云厂商基本都是大模型头部玩家,大模型服务可带动配套云服务收入增长 [84] - AI算力需求带动云厂商收入增长提速,GPU算力充足的云厂商获得更多市场份额,同时推动存储与通用计算消耗增长 [84] - 企业更关注模型应用落地以实现降本增效,国内开源大模型成为许多企业搭建智能体的首选,工具选择多,竞争激烈导致亏损与补贴 [84] - 腾讯云智能体开发平台(ADP)升级至3.0,支持超过140个MCP插件服务,扩展智能体工具能力,支持多智能体并行协作 [91] - To B领域公司聚焦平台产品,将服务交给生态伙伴,伙伴中年收入过10亿的案例很多 [98] 行业趋势与竞争格局 - AI产品范式变化主要体现在用更高效率满足已有场景需求,但尚未创造像移动互联网时代的新连接方式 [66][67] - AI时代可能出现Agent与Agent、模型与服务之间的新连接,未来互联网内容可能更多是为Agent生成而非用户直接消费 [68] - 大模型竞争是人才竞争,公司加大招聘力度,总办亲自吸引顶尖AI人才,推动扁平化管理,给年轻人更大发挥空间 [72] - 行业探索产品与模型的解耦合作方式,混元按自身节奏迭代模型,元宝基于稳定版本做产品工作,定期升级 [74][75] - 创业公司很难避开巨头竞争,在大厂生态找机会或专注海外市场是更好选择,海外用户付费意愿更高 [97][99]
智能体的崛起:其对网络安全领域的优势与风险
搜狐网· 2025-10-10 13:05
随着智能体被逐渐应用于各行各业,它们对业务运营、人机协作和国家安全的影响正在不断扩大,确保 智能体安全、可解释且可靠的责任也随之加重。美国政策研究智库R街研究所(R Street Institute)发表 了"The Rise of AI Agents: Anticipating CyberSecurityOpportunities, Risks, and the Next Frontier"的报告,概 述了智能体系统的架构,探讨了智能体在网络安全用例中的部署方式,并识别了它们在网络安全领域的 优势及在四个不同的基础功能层面(感知、推理、行动和记忆)产生的新风险。启元洞见编译该报告, 为智能体相关研究提供参考。 一、引言 2023年被称为"生成式人工智能"元年,2024年则稳步迈向"人工智能实用化",而2025年则被誉为"智能 体"元年。智能体的核心是"由人工智能驱动的自主智能系统,旨在独立执行特定任务,无需人工干 预。"尽管目前对智能体尚未有明确的定义,但都强调了其包括学习、记忆、计划、推理、决策和适应 在内的一系列自主追求和完成目标的能力。与非智能体系统不同,它能在较少的人工干预下执行多步骤 任务,潜力巨 ...
智能体崛起
虎嗅· 2025-10-10 09:01
OpenAI战略转型 - OpenAI推出四个新产品:Apps SDK(自然语言创建应用)、AgentKit(多智能体系统框架)、Codex(自动编写修复测试代码)、Sora 2(一句话生成视频模型和应用)[2] - 公司从模型公司转型为"用自然语言驱动生产力"的智能体平台[3] - 新平台使个人开发者能以极低成本(月费10美元)完成复杂开发任务,过去需三人两个月完成的工作现可独立快速完成[3] 生产力革命 - AI释放的生产力属性让每个人成为"自开发""自公司""自团队",影响是自媒体的千倍万倍[4] - 个人可写出代码、产出软件、落地产品,在任意行业完成生产闭环[4] - 未来创业不再需要大团队,只需调研机器人、开发机器人、营销机器人、财务机器人等Agent集群[13] 商业组织重构 - 执行层面按部就班的中层管理者角色将被"中层机器人"取代[12] - 公司作为分工协作组织的本质将被智能体重构,智能体能自动分工、自动执行、自动评估[16] - 资本投向将从投"公司"转向投"Agent集群",投资本质仍是投"人",但人变为机器人群落的调度者[14] 内容产业变革 - Sora 2可能成为AI时代的"抖音",让用户用几句话生成视频[19] - 相比传统视频平台,Sora 2具有原生结构优势:内容从语言生成,语义密度高,生成过程可直接向量化内容实现精准分发[19] - 未来内容平台、商业平台、社交平台、资本平台都可能围绕AI重建[20] 行业竞争格局 - AI时代科技主导者可能从七家缩减到两三家[22] - 英伟达投资英特尔、OpenAI入股AMD等动作被视为"怕被甩出前七"的博弈[26] - 国产芯片、国产算力、国产机器人有望在局部空间形成阶段性竞争优势,在资本市场创造阶段性牛股[28] 技术发展速度 - OpenAI用自家Codex仅花六周就开发出复杂智能体工具,展示前所未有的开发效率[30] - 技术变革按幂次加速,未来量子计算等高阶算力平台可能使"想法"到"实现"无限逼近瞬时和边际零成本[31] - 当实现不再稀缺时,唯一真正的竞争力将是创意与思想本身[32]
智能体崛起!
搜狐财经· 2025-10-10 01:53
OpenAI的战略转型与新产品 - OpenAI从模型公司转型为“用自然语言驱动生产力”的智能体平台 [2] - 推出四个核心新物种:Apps SDK(自然语言创建应用)、AgentKit(多智能体系统框架)、Codex(自动编写修复测试代码)、Sora 2(一句话生成视频模型和应用)[2] AI驱动的生产力革命与个体能力跃迁 - AI释放的生产力属性让每个人有机会成为“自开发”、“自公司”、“自团队”,其影响是自媒体时代的千倍万倍 [5] - 个体将能独立完成写出代码、产出软件、落地产品的完整生产闭环,催生由无数个体开发的“自产品”世界 [5] - 技术进步最伟大的发明是赋予个体“能力平权”的思想和能力 [6] AI时代工具的本质与超级个体组织 - AI工具将把真正脑力劳动者的能力放大到超人级别,实现“一个人+多个Agent”的超级个体组织 [9] - 执行层面按部就班的中层管理角色将被“中层机器人”取代,个体可独立完成定义产品、搭建团队、制定流程、生成广告、管理用户的完整商业链路 [9] - 未来创业只需调研机器人、开发机器人、营销机器人等Agent集群,资本将投向“Agent集群”及其调度者 [10] 公司组织形态的重构与平台格局演变 - 公司的本质是分工协作的制度化,当智能体能自动分工执行评估,组织本身需要Agent重构 [11] - 个人需要新的“组织力”来管理时间、协调多个Agent配合以及用机器人管理其他机器人 [12] - AI时代科技主导者可能从七家巨头缩减到两三家,平台将围绕AI重建内容、商业、社交和资本生态 [17] AI原生平台的结构优势与内容产业变革 - Sora 2作为AI时代的“抖音”,其最大优势在于“原生结构”更优:内容由语言生成,语义密度高,生成过程可直接向量化内容以实现精准分发 [14][16] - 传统视频平台第一关卡在内容理解,而AI原生平台在语义空间中进行推荐更准确高效 [16] 技术红利分配与差异化竞争策略 - 技术红利下放但最终胜出者仍是极少数,例如人人都能拍视频但能破千播放量的仅占前3%,能赚到1万元的又是这3%里的3% [18] - “规模法则”适用于技术、商业和社会,最强者一骑绝尘,多数人面临增长瓶颈和全球性“内卷” [19] - 差异化竞争策略是不与顶尖0.01%正面竞争,而是在自有坐标中做到差异化的0.01% [19] 未来技术演进与核心竞争力 - 量子计算等高阶算力平台将使“想法”到“实现”的时间差无限逼近“瞬时”和“边际零成本” [21] - 当“实现”不再稀缺,唯一的真正竞争力将回归创意与思想本身 [22]
3.8亿大模型大单,讯飞拿下,华为宇树都赚了
36氪· 2025-10-09 19:44
项目中标概况 - 讯飞智元信息科技有限公司中标金华市婺城区“婺城数智未来”新型基础设施建设项目,成交金额约为3.8亿元(380百万)[1] - 项目预算为38,891.1万元,最高限价为38,891万元 [3] - 项目竞标方包括讯飞智元、联通(浙江)产业互联网、国泰新点等五家供应商,讯飞智元以总分88.66分的最高分中标 [6][7] 项目结构与费用构成 - 项目建设内容包括1个数智底座、10个AI场景、3个数据要素服务场景、2个中心,覆盖软件、硬件、云资源、数据服务等多个部分 [2] - 软件费用占比最高,达41%(1.56亿元),其次是硬件费用占38%(1.44亿元),云资源占11%(0.42亿元) [4] - 数智底座是项目基础,包含大模型训练平台、智能体平台等多个自研平台,其中智能体平台报价250万元 [8][9] AI大模型与智能体落地应用 - 项目报价文件中“大模型”出现79次,“智能体”出现96次,显示其为核心技术 [2][10] - 10个AI场景深度融入大模型技术,涵盖教育、公安、人社、医疗、水务等十大领域 [10] - AI+教育场景引入大模型AI教师备授课助手,报价80万元;AI+人社场景引入创业辅助智能体,报价90万元 [10][11][12] - 项目中存在大量数十万元级别的子项目,显示大模型落地迅猛 [12] 国产AI产业链参与 - 人工智能信创创新中心采用2台华为大模型推理一体机(Atlas 800T A2),合计报价约281万元 [14][15] - 该中心同时采用4台讯飞星火塔式工作站,合计报价约120万元 [15] - 人工智能研学中心采购宇树科技人形机器人Unitree G1(单价9.9万元)和G1edu-U1(单价16.9万元)各3台 [17] - 项目还涉及海康威视、大华股份、鲁尔物联等国产智能硬件厂商的产品 [18][19] 行业意义与公司动态 - 该项目是AI大模型规模化落地的一个标志性案例,显示AI技术正从概念验证走向深度融合的产业落地 [2][20] - 科大讯飞近期在AI领域表现活跃,9月至少拿下5个大单,包括中广核259万元项目、广东佛山1800万元项目等 [20] - 项目整合了从科大讯飞平台、华为芯片到宇树机器人的国产AI产业链,展示了中国AI技术集成与应用能力 [20]
平台化、智能体、与算力模型矩阵:OpenAIDevDay2025:从“应用”到“平台”的三大战略
海通国际证券· 2025-10-08 20:55
报告行业投资评级 - 报告未明确提及对特定行业的投资评级 [1] 报告的核心观点 - OpenAI 在 DevDay 2025 上明确了三大战略重点,标志着其从单一“应用”向“应用平台”的战略升级 [1][2] - 核心战略包括推动 ChatGPT 平台化、构建生产级智能体体系以及升级模型与算力基础设施 [1] - 通过“平台化入口 + 智能体生态 + 多模态内容生成 + 工程工具链 + 规模化算力”的协同推进,OpenAI 已勾勒出其下一阶段的完整战略路径与商业化蓝图 [5] 平台化战略 - 正式推出“ChatGPT内置应用”功能,用户可在对话界面直接调用第三方应用服务 [2] - 开发者可利用基于 MCP 开放标准的 Apps SDK 进行应用构建与分发 [1][2] - 包括 Bookingcom、Canva、Coursera、Figma、Expedia、Spotify 及 Zillow 在内的首批合作伙伴已率先接入 [2] - 该功能为开发者提供了一个全新的应用分发通道,可直接触达超过 8 亿的周活跃用户 [2][5] 智能体生产体系 - 正式发布 AgentKit,这是一套涵盖智能体编排与落地的全流程工具集 [1][3] - AgentKit 集成了可视化的 Agent Builder、统一治理的数据连接器注册中心、便于产品嵌入的 ChatKit 以及系统化的评估体系 [3] - 强化式微调技术已向 o4-mini 开放,并对 GPT-5 处于私人测试阶段,该技术支持定制工具调用与评分准则 [3] - 目标是构建具备“可控、可评、可运维”特性的生产级智能体体系 [3] 模型与能力矩阵升级 - GPT-5 Pro 已正式纳入 API,面向高精度任务场景 [1][4] - 视频生成模型 Sora 2 进入 API 生态,扩展多模态能力 [1][4] - 推出具备显著成本优势的 gpt-realtime-mini 和 gpt-image-1-mini,价格较同类大模型分别降低约 70% 和约 80% [4] - Codex 已全面可用,新增 Slack 集成、Codex SDK 及企业级管控功能 [4] - 共同构建起覆盖“实时多模态交互—代码生产—媒体生成”的完整能力链条,并实现更精细化的价格分层 [4] 算力与生态基础设施 - 宣布与 AMD 达成长期战略合作,计划构建总规模达 6GW 的 GPU 算力集群 [1][5] - 首批 1GW 算力将基于 AMD Instinct MI450 芯片,预计自 2026 年下半年起逐步交付 [5] - 合作条款中包含与实现关键技术里程碑挂钩的期权安排 [5] - 当前平台生态繁荣,拥有 400 万开发者、超过 8 亿的周活跃用户,以及 API 每分钟处理约 60 亿 token 的吞吐能力 [1][5] - 算力布局旨在支撑需求侧应用生态的持续扩展 [5]
假期被玩坏了的奥特曼,正在玩弄全世界的算力
虎嗅· 2025-10-08 07:25
OpenAI业务数据与趋势 - OpenAI整体每月tokens消耗量合计约为1040万亿,其中API部分每月约260万亿,ChatGPT订阅部分每月约780万亿 [5] - 谷歌AI工厂的月均token消耗量已从5月的480万亿骤增至6月的980万亿,并肯定突破千万亿量级 [5] - OpenAI的ChatGPT拥有约8亿周活用户,每周消耗约180万亿tokens,人均每周使用约22.5万tokens [6] ChatGPT用户行为分析 - 平均每位ChatGPT用户每周大约执行20次典型推理任务,相当于每个工作日提出约四个重要问题 [6] - 用户token消耗存在结构性差异,少数中重度用户贡献了绝大部分消耗量 [7] 开发者生态与API增长 - 平台开发者人数相对2023年增长了2倍,而API消耗的token数量增加了20倍 [9] - 平均每位开发者消耗的token数量在两年间增长了10倍 [9] - OpenAI平台现有400万开发者,API调用量为每分钟60亿token [11] 新产品发布与技术演进 - GPT-5 Pro将开放API,适用于金融、法律、医疗保健等需要高准确性和深度推理的领域 [12] - GPT-5 Codex正式发布,其日使用量从8月以来增长了10倍以上 [12] - 智能体处理任务复杂度的摩尔定律预言其每7个月翻倍,多智能体协作将推理消耗放大至简单对话的15倍以上 [13] 算力基础设施与需求 - 公司在绑定英伟达10GW数据中心后,又与AMD约定了总计高达6GW的数据中心 [14] - 目标是将数据中心规模提升至2033年的250GW,并已开始营销强大10倍的GPT-6 [14] - 公司目标是今年底达到百万张GPU卡 [23] Sora 2视频模型算力需求 - Sora 2的峰值算力需求估算高达约72万张GB200 GPU [21] - 模型规模、采样步数、硬件效率及在AI社交短视频领域的野心是决定其算力需求的关键变量 [20] - AI视频生成的应用将从社交分享扩展到影视制作等专业领域,算力竞争将推向新量级 [22]
刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API
机器之心· 2025-10-07 08:14
机器之心报道 编辑:Panda OpenAI 今年的开发者大会(OpenAI DevDay 2025)正在进行中。 Keynote 一开场,山姆・奥特曼便分享了 OpenAI 这两年取得的成绩: 4 0 0 万 开发者、 8 亿 周活 ChatGPT 用户、API 每 分 钟 60 亿 token 消耗量。 更重要的是,OpenAI 在今年的开发者大会上可真是发布了不少东西,简单总结起来包括:AgentKit、Codex 正式版、ChatGPT 内置应用与 Apps SDK、gpt-realtime- mini、gpt-image-1-mini、Sora 2 API、GPT-5 pro API。 下面具体来看看这些新模型和新工具。 OpenAI 为 AgentKit 设计了一些全新的模块化组件,可助力用户更快地开发智能体,包括 Agent Builder、Connector Registry 和 ChatKit。 Agent Builder AgentKit 首先,最引人瞩目的便是: AgentKit 。 AgentKit 是一套面向开发者和企业的完整工具集,可用于构建、部署和优化智能体(agent)。 这让 ...
从「知题」到「知人」:UserRL让智能体学会「以人为本」
机器之心· 2025-10-05 14:42
"知人者智,自知者明。"——《道德经》 古人早已洞见:真正的人类智慧,不仅仅在于公式推演、掌握技艺,更是能理解他人、洞察人心。今天的大语言模型已能在代码、数学与工具使用上 出色 地完 成 任务 ,然而距离成为真正的 用户伙伴 ,它们依旧缺少那份 "知人" 的能力。这主要源于现实交互远比解题更加复杂: 这正是智能体面临的下一个时代课题: 从 "会解题" 迈向 "懂用户" 。而要真正回答这一课题,我们需要全新的动态评测框架与训练机制:不仅能测量模型在交互 中的表现,还能驱动其学会在用户不确定与多目标的世界里,问之有道,断之有衡,答之有据。为此,来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方 案: 二者相辅相成,把 "以用户为中心" 从理念落地为 可复现的流程、接口与评测指标 。 UserBench 论文链接:https://arxiv.org/pdf/2507.22034 UserBench 代码仓库:https://github.com/SalesforceAIResearch/UserBench 现实交互中, 用户目标常常未在最初完全成形 (underspecification)、而是 ...