通用人工智能(AGI)
搜索文档
今年是商用拐点!这家具身智能机器人公司,最新研判→
证券时报· 2025-08-21 17:10
行业前景与趋势 - 全球正处于具身智能大爆发的前夜 人工智能正加速朝着AGI迈进 2025年具身智能机器人将迎来商用发展拐点 最终成为继手机和汽车之后的下一代海量智能终端 [1] - 人形机器人目前每年以好几倍甚至10倍以上的速度增长 [3] - 行业目标三年内实现十万台级通用机器人规模部署 支持百种任务自主泛化能力 构建开放可进化自生长的通用机器人生态系统 [3] 技术发展现状 - 具身智能技术刚进入落地初期 目前能替代0.6-0.7个人的工作量 还不能完全替代人类 [1] - 去年人形机器人走路还不稳 经常摔倒 今年机器人能力快速提升 [2] - 机器人需具备完全自主移动能力 需解决不同光线变化环境下传感器稳定性问题 [1] - 硬件存在明显瓶颈 如缺乏全身触觉 软件算法也面临重大挑战 需硬件软件算法协同发展 [3] 商业化应用进展 - 近百台远征A2-W进驻富临精工工厂 成为国内首个工业领域具身机器人规模化商业应用案例 标志着全球智能制造场景首次大规模落地 [1] - 今年1月1000台人形机器人量产下线 部分自用部分给客户 今年预计有数千台下线 [3] - 发布灵犀X2-W轮式双臂机器人原型 专为作业智能打造 有望成为下一代具身智能作业机器人标杆 [3] 特殊场景应用潜力 - 严苛环境下作业是市场化方向之一 在37度气温61度地面温度下持续工作无需休息 只需换电 [2] - 特殊场景应用潜力巨大 包括外太空(无需生命维持系统 太阳能无限供应)以及煤炭矿井等高危环境 [2] - 极端环境适应能力已超过人类 最期待进入家庭照顾老人 养老院作为准家庭场景是优先实践方向 [2] 生态建设举措 - 启动智元A计划 专注具身智能产业链创业加速 目标孵化50+高潜力早期项目 三年内打造千亿级产业生态 [3] - 为合作伙伴提供技术支持 融资赋能 场景开放 创业孵化等权益 首期创业营于2025年8月21日全球启动招募 [3]
智元CEO邓泰华:2025年具身机器人将迎来商用拐点
新浪科技· 2025-08-21 16:37
行业趋势与前景 - 全球正处于具身智能大爆发前夜 人工智能加速朝AGI迈进 2025年具身智能机器人将迎来商用发展拐点 成为继手机和汽车之后下一代海量智能终端 [2] - 具身智能产业规模化核心驱动力是生态共建 [2] 公司核心战略 - 以通用量产人形机器人为牵引目标 打造强智能易协作软硬件全栈平台 [2] - 梯次推进工业 商业和家居商用场景落地 最终构建通用智能机器平台应用生态 [2] - 通过开源 被集成 资本赋能三大路径汇聚全球创新力量 [2] 技术开源举措 - 开源机器人中间件AimRT和百万真机数据集 [2] - 推出首个具身智能操作系统灵渠OS 推动行业迈入标准化 规模化 生态化发展新征程 [2] 商业生态构建 - 推行被集成战略 整合行业头部伙伴研发 市场 交付等垂直能力 [3] - 打造行业具身智能体覆盖讲解接待 文娱商演 工业智造 物流分拣等八个场景 [3] - 构建分层分销体系 通过明确责权利关系和设立激励机制降低合作门槛 [3]
从“内部世界”到虚拟造物:世界模型的前世今生
经济观察报· 2025-08-21 16:25
谷歌DeepMind Genie 3模型 - 谷歌DeepMind发布Genie 3模型 能够根据文本或图像提示实时生成可交互的3D虚拟环境 例如输入"月球上的火山边"可生成相应场景并允许用户探索 [2] - Genie 3在实时交互能力上显著提升 支持记忆连贯性 如用户涂鸦后离开再返回 涂鸦仍保留 并引入"可提示的世界事件"功能 允许通过新指令动态改变环境 [2] - 该模型被视为通向通用人工智能(AGI)的"世界模型"路径 刷新AI生成内容边界 引发行业对"世界模型"技术路线的广泛讨论 [2][21] 世界模型技术发展史 - 世界模型灵感源自人脑构建"内部世界"的能力 早期AI研究如维纳的反馈控制理论和符号主义知识图谱已尝试模仿该机制 [6] - 1989年理查德·萨顿提出Dyna架构 结合强化学习与内部世界模拟 1990年施密德胡伯首次用RNN实现"世界模型"概念 但受限于当时技术条件未受重视 [6][7] - 2018年施密德胡伯团队发表《世界模型》论文 借助深度学习革命浪潮 该概念重新引发关注 谷歌DeepMind随后推出PlaNet(2019)和Dreamer(2020)等迭代产品 [7][8][9] 世界模型技术实现路径 - 核心技术包括表征学习(如VAE压缩多模态数据)、动态建模(嵌入物理规律避免模拟偏差)、控制规划(蒙特卡洛树搜索或强化学习)及结果输出(潜在空间渲染) [11][12][13][14] - 动态建模需解决因果关系学习难题 通过嵌入物理定律或多样化数据训练确保模拟准确性 例如抛掷物体需涵盖羽毛与铅球不同场景 [12] - 输出环节采用潜在空间生成再解码为像素 效率高于直接像素生成 多模态输出需结合声音、触觉等渲染技术 [14] 世界模型行业应用前景 - 具身智能领域:为机器人提供安全虚拟训练场 通过"做梦"式模拟降低试错成本 避免现实环境中的事故风险 [15][16] - 数字孪生领域:从被动模型升级为主动预测系统 实现设备故障预警、流程优化等"感知-预测-决策"闭环 [16] - 游戏娱乐领域:实时生成动态虚拟世界 提升NPC交互智能 未来或成为"虚拟社会"基础设施 支持大规模数字生活 [17] 行业技术路线争议 - Meta杨立坤认为世界模型是AGI必经之路 因其模拟人类"离线思考"能力 而大语言模型缺乏物理一致性推理 [21] - DeepMind哈萨比斯等学者持反对意见 指出AlphaGoZero等无模型方法已超越人类 显式物理建模可能受误差累积限制 [22] - 中间路线派主张隐式建模 如大语言模型通过参数隐含世界知识 虽可解释性差但能完成逻辑推演 技术路径应依任务需求选择 [23][24]
智元机器人董事长兼CEO邓泰华:全球正处于“具身智能大爆发的前夜”
新浪财经· 2025-08-21 15:25
行业趋势 - 全球正处于"具身智能大爆发的前夜" [1] - 人工智能正加速朝着AGI(通用人工智能)迈进 [1] - 2025年具身智能机器人将迎来商用发展的拐点 [1] 市场定位 - 具身智能机器人最终将成为继手机和汽车之后的"下一代海量智能终端" [1] 公司观点 - 智元机器人董事长兼CEO邓泰华在首届合作伙伴大会主论坛上发表上述观点 [1]
OpenAI计划上市!微软合作谈判现曙光,搜索市场份额达12%
搜狐财经· 2025-08-21 11:15
上市计划 - 公司考虑在未来某个时间点上市 [1] - 公司首席财务官曾暗示重组有助于未来上市计划 但澄清上市仅为可能性 [3] 合作伙伴关系 - 微软在未来数年仍将是公司重要合作伙伴 [3] - 公司与微软正展开深入谈判以持续获取关键技术 [3] - 原有协议规定达到通用人工智能水平后微软将失去部分技术权利 [3] 行业观点 - 人工智能是至今最重大的发展 发展势头未放缓且基础设施建设可证明 [3] - 当前人工智能热潮更接近铁路或电网式的基础性建设阶段而非短暂泡沫 [5] - 人工智能对GPU和算力需求巨大 公司持续处于算力供应紧张状态 [5] 竞争策略 - 公司构建护城河的三要素包括解决真实问题 涉及复杂业务流程和获取独特数据 [3] - 世界上90%以上的数据处于紧闭大门之后 访问这些数据是构建壁垒的关键 [3] - 客户认为数据所有权归属客户自身而非平台 [4] 业务进展 - 公司构建强大数据连接器使企业级业务表现出色 [4] - 搜索市场份额在6个月内从约6%升至12% [4] - 用户与ChatGPT进行多次轮询解决一个问题仅计为一次搜索 [4] 财务数据 - 每周约有7亿人使用ChatGPT [5] - 预计今年营收增加两倍以上达127亿美元 明年增长一倍以上达294亿美元 [5] - 公司完成由软银领投的400亿美元融资 估值达约3000亿美元 [5] - 正就员工股票二次出售事宜谈判 估值有望达约5000亿美元 [5] 技术发展 - 算力短缺导致公司有更好模型却无法提供 [5] - GPT-5发布后因缺乏温暖感引发反响 随后将ChatGPT 4o作为可选项重新上线 [5] - 公司寻求提高数据中心效率 探索新型能源方案 并与微软等合作推进星际之门等基础设施扩张 [5]
智谱继续重押智能体
证券日报网· 2025-08-20 16:45
产品发布与定位 - 智谱于8月20日发布全球首个手机通用智能体AutoGLM2.0 由纯国产基座模型驱动 [1] - 该产品通过单一App实现手机智能化转型 具备云端自主执行和跨端协作能力 [2] - 产品形态体现公司对AGI早期形态的理解 基于3A原则(全时/自运转/全域连接)设计 [4][5] 技术能力与执行表现 - 智能体可在云端完成生活服务指令 如美团下单20杯奶茶并使用8元优惠券 仅支付环节需人工确认 [2] - 支持复杂办公任务全流程自动化 包括信息检索/内容生成/多模态创作及社媒发布 [2] - 实现跨App长链路操作 例如差旅场景中连续完成票务预订和酒店住宿安排 [3] 基座模型与AGI路径 - 采用专为智能体打造的GLM-4.5与GLM-4.5V基座模型 覆盖推理/非推理/编码/研究等多类任务 [4] - 模型致力于统一多样化能力 解决现有模型在专项任务表现突出但通用性不足的问题 [4] - 公司认为智能体需实现从对话型助手到任务型助手的转变 直接执行指令而非仅提供建议 [3] 行业意义与发展方向 - 具备多模态和思维能力的模型被视为通向AGI的重要里程碑 [1] - 智能体技术突破浏览器对话框限制 实现与手机/电脑/手表/家电等多设备连接 [5] - 该产品推动普通人机协作新范式 通过AI智能体并行任务提升综合执行水平 [1]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
36氪· 2025-08-20 15:34
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 可免费使用 [2] - AutoGLM通过云端执行任务 不占用本地资源且不影响设备正常使用 [4][23] - 支持生活助手和办公助手两类任务 例如点外卖、比价、生成调研报告等 [5][14][16] 技术实现与行业突破 - 基于云端智能手机和云电脑执行任务 预装应用并支持跨APP操作 [13][22] - 依托GLM-4.5和GLM-4.5V模型 整合推理、编码、研究等多项能力 [32] - 解决行业痛点:本地设备算力有限且任务执行干扰用户体验 [24] 应用场景与生态扩展 - 支持手机、PC、智能音箱、车载系统及物联网设备集成 [26] - 推出移动端API和开发者生态共建计划 开放能力赋能第三方产品 [26] - 办公场景中可自动生成基于近100份参考源的数千字调研报告 [17] 战略定位与行业影响 - AutoGLM是智谱AGI路线图中实现L3"自主学习智能体"的关键步骤 [29] - 行业玩家积极布局云端Agent 如阿里云推出无影AgentBay [25] - 提出3A原则:全时待命、零干扰运行、全域设备连接 [35][36][37] 用户体验与效率提升 - 复杂任务如跨平台比价可自主执行 用户仅需发起指令 [14] - 原需一天完成的调研报告生成任务 现仅需几分钟 [17][21] - 云端备用机机制释放本地存储空间 提升设备运行流畅度 [23]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
量子位· 2025-08-20 12:33
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 实现云端执行任务 支持跨APP操作如点外卖、比价等[1][5][9] - 产品免费向公众开放 兼容安卓和iOS系统 并可操控云电脑执行复杂任务[6][9][23] - 提供生活助手和办公助手两类任务 用户通过"接管手机"进入云端界面操作[11][15][17] 技术实现与架构 - 采用云端执行模式 不占用本地设备资源 任务流畅且与用户本地操作互不干扰[9][33][37] - 依托智谱开源模型GLM-4.5和GLM-4.5V 整合推理、编码、多模态等能力于单一模型[50][52] - 为每位用户配备云手机和云电脑 预装应用生态 支持数据持久化存储[31][32] 应用场景与案例 - 生活场景:自主完成外卖订购、跨平台比价(如淘宝、京东、拼多多对比200元保温杯)[19][20][21] - 办公场景:自动生成调研报告(参考近100份源文件、输出数千字)及制作PPT[25][26][29] - 支持多设备集成 包括智能音箱、车载系统等 并通过开放API赋能开发者生态[42] 行业意义与趋势 - 解决Agent落地痛点:云端执行规避本地算力限制和高并发任务宕机问题[36][37][53] - 行业竞相布局云端Agent 如阿里云推出无影AgentBay、PPIO推出Agent沙箱产品[38][39][40] - 推动Agent从"信息辅助"向"直接操作"升级 成为处理复杂场景的全能型工具[31][54][55] 公司战略与AGI路径 - AutoGLM是智谱AGI路线图中L3"自主学习智能体"的关键一步 通过真实应用反馈推动模型自我进化[48][49] - 提出3A原则:全时待命(Around-the-clock)、零干扰(Autonomy)、全域连接(Affinity)[56][57] - 目标是通过技术与应用的正向飞轮 夯实公司在Agent领域的领先地位[48][49]
研判2025!中国通用人工智能(AGI)行业发展历程、相关政策及市场规模分析:中国AGI行业驶入高速发展快车道,技术突破与场景落地双轮驱动[图]
产业信息网· 2025-08-20 09:33
行业概述 - 通用人工智能(AGI)定义为具备自主感知、认知、决策、学习、执行和社会协作能力的通用人工智能体,涉及计算机科学、认知科学、心理学和神经科学等多学科领域[2] - 行业市场结构分为基础设施层(算力、数据)、模型层(语言及多模态模型)、中间层(微调、Prompt、RAG、Agent)和应用层(应用程序、插件、硬件)四层[2] - 应用层典型厂商包括出门问问、商汤科技、作业帮、秘塔科技、美图、聆心智能、钉钉和WPS等[4] - 中间层典型厂商包括阿里巴巴、腾讯、京东、网易有道和海贝等[4] - 模型层典型厂商包括百度、阿里巴巴、科大讯飞、智谱AI、百川智能、零一万物和MiniMax等[4] - 基础设施层典型厂商包括中国电信、中国移动、华为和浪潮等[4] 行业发展历程 - 人工智能行业经历初期探索与技术积累阶段后,逐步迈入技术突破与商业化探索的关键时期[5] - 随着技术成熟与应用场景持续拓展,市场迎来快速发展爆发期,并逐渐步入以人工通用智能(AGI)为主导的新时代[5] 行业产业链 - 产业链上游包括芯片与算力、数据资源与服务、算法与框架等基础设施与技术支撑[7] - 产业链中游为通用人工智能(AGI)开发集成环节[7] - 产业链下游主要应用于金融(智能风控、量化交易、客服自动化等)、医疗(辅助诊断、医疗问答、药物研发等)、制造(智能调度、缺陷检测等)和智慧城市(交通优化、应急管理、政务AI平台等)等行业[7] 相关政策 - 国务院2025年3月《政府工作报告》提出持续推进"人工智能+"行动,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备[10] - 国家网信办等七部门2023年8月《生成式人工智能服务管理暂行办法》采取有效措施鼓励生成式人工智能创新发展,实行包容审慎和分类分级监管[12] - 工信部等四部门2024年6月《人工智能产业综合标准化体系建设指南(2024版)》提出到2026年制定国家标准和行业标准50项以上,开展标准宣贯和实施推广的企业超过1000家,参与制定国际标准20项以上[12] - 全国网络安全标准化技术委员会2024年9月《人工智能安全治理框架》强调构建各方共同参与、技管结合、分工协作的治理机制,打造全过程全要素治理链条[12] 市场规模 - 2024年中国通用人工智能(AGI)行业市场规模为204.93亿元,同比增长44.97%[13] - 金融领域智能投顾、风险控制等应用预计2030年市场规模超800亿元[13] - 零售营销领域AGI驱动的商品推荐、营销文案生成等场景实现效率提升300%以上[13] - 工业领域中控TPT大模型在氯碱生产、煤化工绿电调度等场景中实现能耗降低5%、年减碳41.94万吨[13] 技术发展 - 多模态大模型成为核心方向,2024年9月腾讯Hunyuan-Turbo-Preview模型在SUPERCLUE评测中得分78.64分位列第二,接近OpenAI ChatGPT-4o水平(79.67分)[13] - DeepSeek-R1等开源模型性能对标国际领先产品,推动技术普惠[13] - 2025年多模态与量子计算重构AGI能力边界,DeepSeek-R1模型通过"快思考-慢思考"双通道机制将数学推理准确率从68%提升至82%[20] - MiniMax 01系列模型首次大规模应用线性注意力机制,突破传统Transformer架构效率瓶颈[20] - 量子计算与AGI融合成为关键突破口,中科院计划2025年发布50量子比特商用平台,算力成本预计降至传统架构的1/5[20] - 量子退火算法优化的知识图谱以每秒10^15次连接重组速度动态更新,在医疗诊断中实现72小时内整合最新研究论文与病例数据[20] - 具身智能实体化进程加速,特斯拉Optimus机器人量产在即,工业富联人形机器人代工订单激增[20] 重点企业经营情况 - 行业形成科技巨头主导基础设施、初创企业深耕垂直应用、政策与资本协同驱动的立体化竞争格局[15] - 科技巨头凭借算力、数据与资金优势主导AGI基础设施与通用技术研发,初创企业聚焦垂直场景打造差异化产品[15] - 腾讯在AGI领域布局广泛,混元大模型T1已接入微信、游戏、广告等场景,豆包大模型部分指标居国产第一[16] - 腾讯2025年一季度总营收为1800亿元,同比增长12.87%;毛利为1005亿元,同比增长19.82%[18] - 云知声以全栈式AGI技术为核心,山海大模型在医疗领域表现全球领先,门诊病历生成系统单份病历采纳率达98%[16] - 昆仑万维专注AGI与AICC全产业链布局,2024年营业收入为56.62亿元,同比增长15.20%;研发投入金额为15.98亿元,同比增长59.78%[16] - 深度求索专注于AGI基础技术研发,R1模型支持多模态任务处理,参数达6850亿,训练成本仅为同类模型的1/10[16] - 阿里巴巴以"AGI端到端布局"为核心,通过平头哥芯片自研、算力中心基建和通义千问基础大模型打造AI底座[16] 行业发展趋势 - 医疗领域云知声山海大模型通过动态推理与跨模态数据处理将门诊病历生成系统采纳率提升至98%,手术病历撰写助手使医生效率提升40%[22] - 联影医疗AI影像解决方案渗透率突破15%,误诊率下降18%[22] - 金融领域智能投顾与反欺诈系统成为标配[22] - 工业与制造领域中控TPT大模型在氯碱生产中实现能耗降低5%、年减碳41.94万吨[22] - 教育与零售场景AI辅导与个性化营销内容生成效率提升300%以上,虚拟试衣间、数字人导购等创新应用加速落地[22] - 政策层面构建"技术突破-场景落地-伦理治理"闭环体系,国家发改委《人工智能+行动实施方案》设立"揭榜挂帅"制度攻关算力芯片、量子计算等12项卡脖子技术[23] - 伦理与安全框架逐步完善,《人工智能安全治理框架》1.0版强调"包容审慎、风险导向",要求算法透明度与可解释性[23] - 欧盟2025年7月10日公布《通用人工智能行为准则》为通用人工智能模型提供透明度、版权及安全与保障三方面的自律指导[23]
阿里通义千问再放大招 多模态大模型迭代 加速改写AGI时间表
21世纪经济报道· 2025-08-20 08:08
阿里通义千问多模态模型更新 - 阿里推出Qwen-Image-Edit,基于20B参数的Qwen-Image,支持双语文本修改、风格迁移及物体旋转,拓展生成式AI在专业内容创作中的应用 [1] - 阿里半年内连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型,Qwen2.5-VL 72B版本在13项权威评测中视觉理解能力超越GPT-4o与Claude3.5 [3] - Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL和VAE Encoder,兼具语义与外观双重编辑能力,在中文图像编辑领域树立新标杆 [3] 多模态AI行业发展趋势 - 大模型发展从单一语言模型迈向多模态融合新阶段,被认为是通向AGI的必经之路 [1] - 谷歌研究报告显示,预计2025年全球多模态AI市场规模将飙升至24亿美元,2037年底预计达989亿美元 [1] - 2025年被业内人士普遍视为"AI应用商业化元年",多模态技术是核心驱动力,已在数字人直播、医疗诊断、金融分析等场景应用 [6] 国内厂商多模态布局 - 阿里、智谱、阶跃星辰等大模型厂商密集布局多模态,从视觉理解到全模态交互,2025年迭代加速 [1] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,多模态模型占基座模型矩阵7成 [4] - 商汤发布日日新V6.5大模型,从6.0开始全部为多模态模型,多模态推理与交互性能大幅提升 [4] - 智谱推出开源视觉推理模型GLM-4.5V,昆仑万维一周内发布六款多模态模型,覆盖数字人生成、世界模拟等核心场景 [5] 多模态技术发展现状与挑战 - 多模态领域仍处于发展初期,基础性问题尚未解决,复杂性远超自然语言处理 [7] - 视觉数据表征空间达百万维度连续空间,与文本数万维度低维问题存在本质差异 [7] - 当前多模态模型主要依赖逻辑推理,缺乏空间感知能力,面对简单空间问题表现不佳 [9] - 技术瓶颈需要类似ChatGPT、强化学习范式的大技术变迁才能解决 [8]