Workflow
智能体
icon
搜索文档
智谱继续重押智能体
证券日报网· 2025-08-20 16:45
产品发布与定位 - 智谱于8月20日发布全球首个手机通用智能体AutoGLM2.0 由纯国产基座模型驱动 [1] - 该产品通过单一App实现手机智能化转型 具备云端自主执行和跨端协作能力 [2] - 产品形态体现公司对AGI早期形态的理解 基于3A原则(全时/自运转/全域连接)设计 [4][5] 技术能力与执行表现 - 智能体可在云端完成生活服务指令 如美团下单20杯奶茶并使用8元优惠券 仅支付环节需人工确认 [2] - 支持复杂办公任务全流程自动化 包括信息检索/内容生成/多模态创作及社媒发布 [2] - 实现跨App长链路操作 例如差旅场景中连续完成票务预订和酒店住宿安排 [3] 基座模型与AGI路径 - 采用专为智能体打造的GLM-4.5与GLM-4.5V基座模型 覆盖推理/非推理/编码/研究等多类任务 [4] - 模型致力于统一多样化能力 解决现有模型在专项任务表现突出但通用性不足的问题 [4] - 公司认为智能体需实现从对话型助手到任务型助手的转变 直接执行指令而非仅提供建议 [3] 行业意义与发展方向 - 具备多模态和思维能力的模型被视为通向AGI的重要里程碑 [1] - 智能体技术突破浏览器对话框限制 实现与手机/电脑/手表/家电等多设备连接 [5] - 该产品推动普通人机协作新范式 通过AI智能体并行任务提升综合执行水平 [1]
AI市场格局日渐明朗:投资人详解6大“终局”领域与下一波机会
36氪· 2025-08-20 15:09
人工智能市场格局演变 - 人工智能市场在过去四年发生显著演变 从GPT-3问世到尺度定律公开讨论 发展轨迹预示革命性变化 [2] - 2022年期间代码与人工智能驱动软件工程领域重要性显现 但当时赢家尚未明确 [3] - 当前第一波人工智能市场已稳固 核心赢家浮现 新市场仍在形成过程中 [3] 基础模型领域竞争格局 - 大语言模型(LLMs)发展由规模驱动 需要数十亿美元资本投入 [4] - 核心参与者包括Anthropic、谷歌、Meta(Llama)、微软、Mistral、OpenAI及X.AI 其中3-4家公司在基准测试和采用率方面领先 [5] - 中国公司推出深度求索、阿里巴巴Qwen和Kimi等开源项目 在基准测试表现良好 [10] - 由于资本壁垒 未来新LLM公司出现概率较低 除非出现未普及的新突破 [11] - 其他基础模型领域(语音/图像/视频等)仍缺乏明确赢家 [12] 编码应用市场发展 - 编码成为生成式AI最早的大规模应用之一 GitHub Copilot2021年推出后广泛采用 [13] - 头部公司产品收入在两年内从0增长至5000万-5亿美元 [13] - 核心竞争者包括Anthropic Claude Code、Cognition/Windsurf、Cursor、谷歌/Windsurf、微软/GitHub、OpenAI及Magic/Poolside等初创公司 [13] - 智能体工作流与IDE工作流之争及基础模型公司功能整合将决定最终赢家 [14] 专业服务领域应用 - 法律市场由Harvey和CaseText主导 其他初创公司在细分领域崭露头角 [15] - 医疗服务文档领域主要玩家包括Abridge、Ambience、Commure/Athelas与微软Nuance [17] - 客户服务市场整合至Decagon和Sierra等初创公司 老牌企业通过增加AI功能竞争 [19] 商业模式变革趋势 - 出现从"卖座席"向"卖认知单元"或"等效人力"的商业模式转变 [20][32] - 推理模型进步与智能体基础设施加速这一转变 [21] - 搜索与信息检索市场由谷歌、OpenAI、Perplexity和Meta主导 Perplexity是主要初创公司 [22] 新兴市场机会领域 - 会计领域同时进行软件开发和行业整合 [24] - 合规领域(如制药合规)出现Blue Note Health等早期玩家 [24] - 金融工具、销售工具与代理、安全等领域存在大量机会 [24] - 安全领域将出现专门针对AI端点、智能体或基础模型使用安全的新公司 [24] 市场发展关键驱动因素 - 模型性能提升开启新市场 GPT-3.5到GPT-4改进推动法律工作流发展 Claude 3.5发布提升编程工具效果 [26] - 市场进入策略错误或既有企业锁定可能阻碍采用 [29] - 买家采用速度较慢但逐步跟进 [30] - 合适团队缺失或创始人需要时间学习迭代 [38] - 产品开发需要时间 市场格局需6-12个月才显现 [38] 智能体技术发展 - 从AI聊天工具向智能体工作流转变 智能体能代用户执行操作 [31] - B2B领域最早采用智能体工作流 如Devin编程工具和Decagon/Sierra客户服务工具 [31] - ChatGPT、Gemini和Perplexity等增加智能体功能进行深度研究 [31] - 新基础设施支持智能体部署和工作流 [31] 行业整合趋势 - 生成式AI驱动行业整合并购 通过收购实现更快采纳速度和经济效益 [33] - AI采纳是组织流程与人的问题 需要实际拥有公司才能重塑流程 [33] - 市场整合导致并购、合作、渠道锁定等战略举措 [34] - 通过合并初创领导者或既有企业/初创组合可能赢得市场 [34]
一句话就能点外卖、订机票!智谱发布全球首个手机智能体
证券时报网· 2025-08-20 14:28
核心观点 - AI智能体Manus在3个月后迅速撤出中国市场 国内厂商如智谱随后发布大量智能体产品 包括AutoGLM 2.0 [1] - AutoGLM 2.0由纯国产模型GLM-4.5与GLM-4.5V驱动 具备推理 代码和多模态处理能力 定位为执行型助手 能够自主完成云端操作 [1][2] - 该产品突破传统AI仅对话的局限 实现从"说"到"做"的跨越 支持跨40多个高频应用执行生活与办公任务 [1][2] 产品功能 - 生活场景中支持一句话操作抖音 小红书 美团 京东等40多个应用 可点外卖 订机票 查房源 预约健康服务 [2] - 办公场景中支持跨应用全流程工作 包括信息检索 内容撰写 生成1分钟短视频 PPT或播客 并直接完成小红书发布 [2] - 配备专属云手机和云电脑 Agent在云端自主完成任务 不占用本地设备 用户可同时使用其他APP 实现异步代理办公 [2] 技术特点 - 采用端到端强化学习 模型通过结果反馈自主探索解决问题 支持动态适应应用迭代和环境变化 [3] - 基于自主研发模型 单次任务成本约0.2美元 仅为传统API方式的1/10至1/20 且可规模化降低 [3] - 全端适配支持手机 电脑 AI眼镜等多设备 通过云技术解决不同系统适配问题 [3] 模型基础 - 由GLM-4.5驱动 该模型为智能体应用打造 首次在单个模型中实现推理 编码和智能体能力原生融合 [3] - GLM-4.5V为开源视觉推理模型 总参数106B 激活参数12B 实现从理解到执行的原生GUI任务闭环 [3] 市场定位 - 产品偏向C端应用 面向普通个人用户 融合技术模型能力与产品形态 解决日常及工作任务 [2] - 注重用户体验 能突破用户自身能力边界 例如用户不懂的事情可通过AI完成 [2]
机器人ETF易方达(159530)最新规模突破50亿元,宇树将发布新款人形机器人
每日经济新闻· 2025-08-20 12:51
机器人ETF市场表现 - 机器人ETF易方达(159530)盘中成交额突破1亿元,净申购达500万份 [1] - 8月以来该产品累计净流入达14亿元,最新规模突破50亿元创历史新高 [1] - 产品在国证机器人产业指数相关ETF中规模居首,指数人形机器人相关个股占比近八成 [1] 人形机器人技术进展 - 宇树科技新款人形机器人身高1.8米,配备31个自由度 [1] - 7月25日发布的R1型号售价3.99万元起,关节数量达26个,整机重量约25kg [1] - 公司已推出G1、H1、R1三款人形机器人产品线 [1] 行业发展趋势 - 华泰证券认为智能体发展将遵循"先2B再2C,最后终端"的产业轨迹 [1] - 中国在机器人等终端领域具备显著比较优势 [1] - 国证机器人产业指数聚焦机器人本体和核心零部件,为最纯粹的人形机器人指数 [1]
AI价值兑现长跑 联想SSG全栈AI驱动连续17个季度双位数增长
证券时报网· 2025-08-19 18:57
财务表现 - SSG营收同比增长20% 连续17个季度保持双位数增长 [1] - 高附加值"即服务"业务占比达总营收58% [1] - SSG运营利润率22.2% 远超行业平均水平 [2] 增长驱动因素 - 全栈AI能力成为SSG高速增长核心动力源 [1] - 构建从基础设施、平台工具到行业场景的完整AI价值链 [1] - 采用"内生外化"策略将自身转型经验转化为客户价值 [1] 技术解决方案 - "乐享"超级智能体系统基于大模型架构 能精准识别用户意图并自动完成跨系统任务 [1] - 在门店场景实现智能导购和多屏协同 在展会现场通过机器人与大屏联动完成品牌推广 [1] - iChain智能体平台串联计划、采购、制造等环节 联动供应商与客户 [2] 应用成效 - 客户周活跃用户增长270% 电商业务订单转化率提升30% [1] - 供应链风险识别准确率达90% 响应周期缩短至原先四分之一 [2] - 在全球数十个行业场景实现AI规模化落地 [4] 差异化优势 - 以硬件为基座 在180多个国家复杂业务场景中验证解决方案 [2] - 输出"软硬服"一体化能力 每个联想设备都是数据入口 [2] - 区别于纯软件厂商的核心优势 [2] 技术策略 - 通过任务分级机制处理大模型幻觉问题 关键决策由人类把关 低风险任务交由智能体处理 [2] - 提出"模型路由器"概念 根据场景需求动态调度最合适的大模型 [2] - 智能体架构正从L2向更自主的L4演进 [3] 市场策略 - 海外市场偏好SaaS模式融入AI 中国企业更关注混合部署 [2] - 简化解决方案组合 避免部署复杂化 [2] - 聚焦能创造可量化业务价值的场景 [4]
周鸿祎20周年庆典揭秘:纳米AI引领智能体时代,开启AI新篇章
搜狐财经· 2025-08-19 02:11
360集团AI战略转型 - 公司在20周年庆典上展示最新纳米AI技术"一句话生成视频"能力 通过虚拟周鸿祎表演揭示技术突破 [1] - 宣布战略方向重大调整为"All in Agent" 全力投入智能体技术发展 [1] - 纳米AI具备L4级别能力 是目前该级别唯一智能体 采用"多智能体蜂群"概念实现群体协同 [3] 纳米AI技术特性 - 技术可实现从单张照片和简单描述生成完整视频 包含剧情设计 配音配乐 运镜剪辑等专业制作元素 [1] - 支持多智能体灵活组队 多层嵌套协作 覆盖视频制作 行业研究 电商运营等全场景应用 [3] - 用户可通过自然语言交互清晰描述需求 系统能感知环境并自主决策执行任务 [3] 市场表现与行业地位 - 产品在AI榜单中以显著优势位列智能体类月度访问量第一 [4] - 技术突破标志AI从简单对话进入自主创作和解决实际问题的新阶段 [1] - 公司凭借20年技术积累和差异化战略 在人才 数据 技术层面具备发展智能体的基础优势 [3] 战略布局意义 - "All in Agent"既是技术趋势判断 也是对网络安全核心业务的延伸拓展 [4] - 智能体技术将增强网络安全防护能力 同时为企业个人提供多元化解决方案 [4] - 技术发展契合AI实际应用期需求 通过群体智能实现复杂任务处理 [3]
百度文库网盘推出全端通用智能体GenFlow2.0
北京商报· 2025-08-18 19:29
产品发布 - 百度文库与百度网盘联合发布全端通用智能体"GenFlow2 0" 支持超100个专家智能体同时工作 [1] - 产品3分钟并行完成超5项复杂任务 生成速度超主流同类型产品10倍 [1] - GenFlow2 0已在百度文库Web端和App端正式上线 所有用户可直接使用无需排队或邀请码 [1] 技术升级 - GenFlow2 0基于4月推出的内容操作系统"沧舟OS"开发 是GenFlow1 0的升级版本 [1] - 重点解决通用智能体描述难 等待久 交付差 不可编辑等难题 [1] - 可自主理解用户意图并规划执行 自动切换简单对话与复杂任务等不同协作模式 [1] 功能特性 - 支持用户在任务过程中随时干预 包括暂停 追问 修改思考内容 上传文件参考等操作 [1]
英伟达新研究:小模型才是智能体的未来
量子位· 2025-08-18 17:16
大模型与小模型对比 - 大语言模型在Agent任务中处理重复、专业化子任务时消耗大量计算资源,成本高、效率低、灵活性差 [1] - 小语言模型在性能够用的前提下,使Agent任务执行更经济灵活 [2] - 实测显示6.7B参数的Toolformer调用API后性能超越175B的GPT-3 [3] - 7B参数的DeepSeek-R1-Distill推理表现优于Claude3.5和GPT-4o [4] 小模型优势 - 体积小巧,可在GPU上高效共享资源,并行运行多个工作负载并保持性能隔离 [8] - 更低显存占用,支持超分配机制,提升并发能力 [9] - GPU资源可灵活划分,实现异构负载弹性调度和整体资源优化 [10] - 优先调度小模型的低延迟请求,预留资源应对大模型调用,优化整体吞吐与成本控制 [11] 任务优化与部署 - Agent任务多为重复性、可预测、范围明确的操作(如文档总结、信息提取、模板编写、工具调用) [14][16] - 为每个子任务选择专业微调的小模型,避免大模型资源浪费 [15][16] - 运行70亿参数小模型比700-1750亿参数大模型便宜10-30倍 [20] - 小模型计算资源占用低,适合本地或边缘部署,大模型依赖中心化云计算 [20] 争议与挑战 - 反对观点认为大模型通用理解能力更强,在专业任务中表现更佳 [22] - 小模型可通过微调达到可靠性,且复杂问题可分解为简单子任务,降低对大模型通用能力的需求 [23][24] - 质疑小模型经济性:大规模部署时大模型的规模经济可能更优 [26] - 行业惯性使创新仍集中在大模型,小模型面临基础设施适配、市场认知度低、评估标准缺失等挑战 [28][29] 转型方法 - 采集大模型运行数据,脱敏后保留使用模式 [32] - 聚类工作负载识别常见子任务 [33] - 选择小模型并匹配GPU分配策略,定制数据微调后部署 [34] - 构建持续反馈闭环优化性能和资源利用率 [35] 行业讨论 - 简单任务(如Amazon产品退款)使用小模型更具成本效益 [36] - 小模型在偏离预设流程时可能不够鲁棒,需预先考虑更多变数 [37] - 小模型遵循"一个程序只做好一件事"的设计哲学,但功能多样性可能增加操作复杂度 [37][38][39]
一周六连发!昆仑万维将多模态AI卷到了新高度
量子位· 2025-08-17 17:00
技术发布概览 - 一周内连续发布六款多模态AI模型,覆盖视频生成、世界模型、统一多模态、智能体及AI音乐创作等核心场景 [2][3] - 绝大部分模型已开源,包括音频驱动视频生成模型SkyReels-A3、交互世界模型Matrix-Game 2.0、3D场景生成模型Matrix-3D等 [3][19][25] - 技术周前公司入选"中国AI开源16强",与腾讯、阿里等并列 [5] 核心模型与技术突破 视频生成领域 - **SkyReels-A3**:支持音频驱动人像视频生成,预设8种运镜参数,可生成60秒单分镜视频,唇形同步指标Sync-C达8.66,超越OmniHuman(8.15)和Hydra(7.70) [8][10][12][14] - 技术原理:基于DiT视频扩散模型+插帧延展+强化学习动作优化,支持文本提示词输入画面变化及商品交互 [14][15] 世界模型领域 - **Matrix-Game 2.0**:国内首个对标谷歌Genie 3的开源模型,支持25 FPS实时生成分钟级交互视频,数据管线基于Unreal Engine和GTA 5构建1350小时高质量交互视频 [19][20][22][24] - **Matrix-3D**:单图像生成全景视频并还原三维空间,对标李飞飞World Labs,适用于游戏引擎、元宇宙等领域 [25][27] 统一多模态领域 - **Skywork UniPic 2.0**:2B参数模型在图像生成/编辑任务中超越7B的BAGEL和12B的Flux-Kontext,联合训练后模型UniPic2-Metaquery刷新多项SOTA [29][31][33] - 训练策略:采用渐进式双任务强化策略优化SD3.5-Medium架构,降低硬件门槛 [30][31] 智能体领域 - **Skywork Deep Research Agent v2**:多模态深度调研智能体整合图片检索与生成,自动插入图文混合文档;浏览器智能体支持社媒多模态分析(如小红书、Instagram) [37][38][44] - 技术手段:端到端强化学习(GRPO算法)、并行推理机制、多智能体协同框架 [48][49][50][51] AI音乐与语音 - **Mureka V7.5**:中文音乐生成模型在音色、情感表现上超越Suno v4.5,优化ASR技术提升人声真实度 [53][54][57] - **MoE-TTS**:基于MoE的语音合成框架,通过自然语言描述精准控制声音特征,域外描述贴合度领先闭源产品 [60][61] 战略与行业布局 - **战略定力**:2023年确立"All in AGI与AIGC"战略,2024年研发费用15.4亿元(同比+59.5%),研发团队占比73.41% [66][67][73] - **垂直领域聚焦**:CEO方汉强调垂直Agent与高频应用场景的价值,如数字人直播(国内市场规模近十万亿)、游戏引擎、具身智能等 [70][76] - **开源生态**:通过开源建立技术话语权,推动"技术-社区-应用"正向循环,强化行业地位 [78]
360集团官宣“All in Agent”战略;Accio邀请码在海外爆火,阿里国际站回应:正在扩容丨AIGC日报
创业邦· 2025-08-16 09:10
360集团AI战略转型 - 360集团宣布"All in Agent"战略 要求全公司以智能体化率衡量业务流程和岗位职能进化水平 并计划通过智能体重塑所有产品 [2] - 公司启动内部创新活动 包括"360智能体创新大赛"和"AI视频大赛" 以强化全员AI信仰 [2] 阿里国际站Accio Agent市场反响 - Accio Agent面向海外买家推出后迅速爆火 可自动化完成跨境电商核心环节如市场调研、供应商沟通等 [2] - 产品采用邀请制后邀请码被十多国用户抢空 公司正在扩容以满足全球中小企业需求 [2] 腾讯云AI开发工具升级 - 腾讯云推出CloudBase AI CLI工具 深度集成云开发平台 支持自然语言调度多种AI CLI工具 [3] - 该工具可减少80%编码量 实现从代码生成到部署运维的全流程优化 [3] 七牛智能交互解决方案创新 - 七牛智能发布"灵矽AI"开放交互平台 旨在解决具身智能落地中的自然交互瓶颈 [4] - 平台采用"交钥匙"模式 帮助硬件厂商绕过算法和算力壁垒 专注应用场景创新 [4] 行业数据服务资源 - 提供涵盖2万+LP数据、10万+基金数据和1万+专精特新企业的行业数据库 [8] - 包含独角兽企业榜单和产业图谱等深度分析工具 [8]