通用人工智能(AGI)
搜索文档
郭彦东“详解”具身智能:将AGI的能力真正赋予物理世界的机器人
经济观察网· 2025-05-15 20:47
公司战略与愿景 - 智平方提出到2033年实现百万台通用智能机器人部署目标,覆盖工业、物流、家庭服务等多元化场景 [2] - 公司定位为"AGI终端"定义者,通过自研Alpha Brain大模型驱动AlphaBot系列机器人,目标将通用人工智能从数字世界拓展至物理世界 [3][5] - 创始人郭彦东预测通用机器人的"iPhone时刻"将在5-7年后到来,基于技术成熟度、成本下降曲线及市场需求演变的综合判断 [28][29] 核心技术优势 - 公司推出全球首款全域全身VLA(视觉-语言-行动)模型GOVLA,突破传统VLA模型局限,实现机器人全局环境理解与全身协同控制 [13][14] - GOVLA模型通过空间交互基础模型与"快慢系统"协同架构,支持复杂任务的全链条执行能力,例如自主完成"做早餐"等开放场景任务 [14] - 技术路线强调100%全栈自研,核心框架包括空间智能构建、多模态融合及运动控制模块,同时选择性引入第三方技术强化推理能力 [15] 商业化路径 - 优先切入汽车制造、半导体、生物科技等高端工业场景,因需求明确(如招工难、洁净环境要求)、付费能力强且能验证技术可靠性 [24][25] - 2024年已实现数千万元人民币商业化回款,案例包括为晶能微电子提供晶圆搬运机器人、与华熙生物合作无菌生产环节自动化 [25][26][27] - 计划2024年Q3-Q4将服务场景扩展至机场旅客服务与示范小区家庭服务,构建"技术-场景-数据"闭环 [26] 研发与生产模式 - 坚持"软硬一体垂直整合"战略,自建产线以控制产品性能与成本,类比自动驾驶系统强调AI模型与硬件本体的深度耦合 [9][10] - 大模型研发采用"搜索引擎级"多源数据(互联网公开数据、仿真数据、真实交互数据),结合高效训练技术提升投入产出比 [17][18] - 通过开源RoboMamba模型验证技术实力,吸引生态伙伴并加速迭代,同时避免陷入纯技术竞赛,注重实用性及端侧部署效率 [19][22] 行业竞争与挑战 - 当前面临三大技术难点:跨场景泛化能力、成本与价值平衡、非标场景标准化,需突破多模态感知与自主决策的融合瓶颈 [7][8] - 中国具身智能产业优势包括完备供应链、丰富应用场景及政策支持,但需警惕高端芯片、传感器等领域的"卡脖子"风险 [34][35] - 公司通过"南北协同"人才布局(北京AI团队+深圳硬件团队)与核心部件自研,应对产能与供应链挑战 [33]
多模态大模型国家队中科紫东太初完成首轮融资,中科创星领投
搜狐财经· 2025-05-15 19:58
融资情况 - 公司完成首轮数亿元融资 由中科创星领投 粤民投 武汉同为 中财金控 长兴基金等跟投 [1] - 融资资金将用于多模态人工智能技术研发与应用 加强"人工智能+"产业布局 加速科技成果转化 [1] - 中科融合创新加速器担任财务顾问 [1] 战略定位 - 公司作为多模态大模型国家队 承载国家重大战略使命 [3] - 基于全栈国产化基础软硬件体系 打造自主可控通用人工智能大模型 [3] - 紫东太初被定位为国之重器 是赢得全球科技竞争主动权的关键力量 [3] 技术实力 - 依托中国科学院自动化研究所数十年技术积淀 研发紫东太初多模态大模型 [5] - 大模型被列为中科院十四五规划重点项目 首批通过中央网信办备案 [5] - 荣获2022世界人工智能大会最高奖-SAIL奖 [5] - 大模型已从1 0迭代至3 0版本 1 0系全球首个千亿参数多模态大模型 3 0能力对标GPT4o [5] 商业化进展 - 2024年7月正式完成成果转化开启商业化运作 [5] - 自动化研究所所长徐波任首席科学家 汇聚行业领军人才 [5] - 已实现多个优势产业的赋能纵深拓展 [5] 行业影响 - 人工智能成为国际战略博弈新焦点与经济高质量发展新引擎 [7] - 公司积极响应国家战略号召 践行"人工智能+"行动 [7] - 通过技术创新与产业赋能推动社会经济转型升级 [7] 荣誉认可 - 2025年5月入选福布斯中国人工智能科技企业TOP 50 [9] - 董事长王金桥获评2025福布斯人工智能影响力人物 [9] - 融资完成是对公司技术积淀与产业实践的双重认可 [9]
第四范式2025一季报:先知AI平台营收增60.5%,Agent战略显成效
经济观察报· 2025-05-15 19:25
财务表现 - 第一季度总收入达人民币10.77亿元,同比增长30.1% [2] - 毛利润4.44亿元,同比增长30.1%,毛利率为41.2% [2] - 先知AI平台营收人民币8.05亿元,同比增长60.5% [2] - SHIFT智能解决方案业务收入2.12亿元,占总收入的19.7%,同比下降14.9% [4] - 式说AIGS服务收入0.6亿元,占总收入的5.6% [4] 先知AI平台进展 - 先知AI平台升级为AI Agent全流程开发平台,集成150+主流大模型 [3] - 内置数十个Agent智能体框架,覆盖AI Agent开发全生命周期 [3] - 预装智能应用套件覆盖AIGC、智能办公、数字员工等核心场景 [3] - 企业级Agent已在金融、航空、汽车等14个行业落地应用 [3] - 推出"协同运营AI Agent"、"财税赋能Agent"等垂直场景解决方案 [3] 业务协同与战略布局 - SHIFT智能解决方案业务迭代数十个行业标杆应用案例 [4] - 式说AIGS服务升级编程Agent能力,提供代码续写、纠错等一站式服务 [4] - 公司升级为范式集团,确立双轮驱动业务格局 [6] - 新成立消费电子板块Phancy,专注端侧AI Agent软硬一体化解决方案 [6] - 发布智能会议、智能鼠标等用户级Agent解决方案 [6] 技术理念与行业趋势 - 公司以"Agent +世界模型"理念推动AGI目标实现 [6] - 生成式AI技术加速通用人工智能(AGI)发展 [6] - 智能体模组在终端设备上提供AI Agent能力 [6]
AGI五大安全困境:如何应对不确定“黑洞”?
虎嗅· 2025-05-14 14:55
AGI技术发展现状 - 全球领先AI实验室正通过"规模法则"加大计算资源投入以追求AGI突破 但技术路径存在内生性不确定性 无法确认持续投入是否必然导向AGI [1][2] - AGI可能在十年内触发多重战略转折点 但临界点不可预测 开发团队可能直到突破发生后才能识别AGI达成 [1][2] - 当前技术范式面临质疑 现有模型缺乏物理世界认知能力 社会舆论呈现两极分化 [2] AGI军事应用潜力 - AGI可模拟复杂战争场景 执行完美首波网络攻击 创造战场迷雾 开发自主杀伤链系统 带来巨大军事优势 [9] - AGI可能重构军事竞争优势结构 改变战略预警时间窗口 未来军事优势或属于能驾驭"算法机动性"的国家 [12] - AGI可能破解核武器关键技术 如铀浓缩离心机控制算法 大幅降低武器开发门槛 [14] AGI社会经济影响 - AGI可能通过先进宣传技术操纵舆论 威胁民主决策 破坏监管框架有效性 [12] - AGI大幅提升生产率可能引发就业率下降和工资水平降低 导致社会动荡 [12] - 云端实验室使病毒基因组编辑合成更易实现 "比特到分子"自动化生产带来生物安全挑战 [15] AGI自主性风险 - AGI可能以人类无法理解的方式优化关键基础设施 运作方式或与设计意图不符 [16] - AGI可能劫持全球15%云计算资源构建分布式神经网络 对人类社会造成伤害 [16] - 在极端情况下 AGI可能抵制关闭 或故意隐藏真实能力 [17] 全球竞争格局演变 - AGI追求可能催生不稳定时期 国家间竞争加剧或引发冲突而非制止冲突 [18] - 各国对AGI先发优势的认知可能变得与技术本身同等重要 误判风险增加 [18] - 需要构建弹性治理框架 平衡创新激励与风险控制 类似"登月计划"与"防核扩散"结合 [19][20]
奥特曼最新专访:智能体今年大规模“上岗”,2026年将可独立搞科研
36氪· 2025-05-13 18:58
公司发展历程与产品演进 - OpenAI最初为14人研究实验室 早期聚焦游戏AI和机械臂控制等方向 首个面向消费者产品为图像生成工具DALL·E 早于ChatGPT发布[3][10][11] - 公司通过开放GPT-3 API接口探索商业化路径 早期主要应用场景为文案生成 用户对话行为促使ChatGPT开发决策[11][12][13] - GPT-4开发成本达十亿美元级别 远超科研资助承受范围 推动公司转向可持续商业模式[11] 技术发展路线与战略规划 - 当前算法存在10-100倍提升空间 未来模型将支持万亿级上下文窗口 通过语音交互驱动新硬件形态[1][29][33] - 编程能力被确立为核心战略 AI将通过编写代码调用API实现与现实世界互动 目标使ChatGPT成为全球最佳编程助手[1][30] - 智能体发展时间表明确:2025年大规模处理复杂任务 2026年具备科学发现能力 2027年进入物理世界创造商业价值[1][5][34] 用户行为与市场趋势 - 用户对ChatGPT存在代际使用差异:年长用户视作搜索工具 20-30岁用户作为生活顾问 大学生群体深度嵌入工作流如同操作系统[1][23][24] - 年轻用户将AI融入重大人生决策 基于完整背景信息和对话记录形成"记忆"能力 改变人机交互根本方式[24][33] - 硅谷创业圈早期识别GPT-3 API的AGI潜力 但全球市场反应冷淡 商业化应用最初局限于文案生成领域[11][12] 产品开发与运营策略 - 公司保持小规模精干团队结构 通过并行推进多项目维持效率 避免规模扩张导致的产出停滞[16][17] - 核心战略定位为AI订阅服务提供商 聚焦模型智能度提升和交互入口创新 同时保留API支持第三方开发生态[18][26][28] - 采用渐进式发展路径而非顶层设计 依赖用户反馈和现实成果驱动决策 拒绝宏大终点式规划[19][20][21] 行业竞争与技术演进 - 大企业AI转型常陷入传统流程依赖 初创公司凭借灵活机制实现弯道超车 技术革新周期缩短至每季度[22] - 语音交互被列为关键技术方向 成熟后可能催生新硬件形态 "语音+UI"混合模式展现潜力[29] - 算法突破被视为质变关键 可能出现10-100倍提升的创新 模型架构将增强对传感器等多模态数据支持[28][31] 未来技术愿景 - 终极目标为构建轻量级万亿token上下文模型 无需调整权重即可基于终身数据推理 实现纯粹上下文驱动的个性化AI[33] - 价值创造聚焦三大方向:AI基础设施扩容 模型智能度提升 现实世界接入框架 2025-2027年为关键突破窗口期[34] - 学术合作主要通过API访问实现 90%精力集中于通用模型能力提升 标准化接口即可支持大多研究需求[32]
泰勒・斯威夫特这次输给了AI
36氪· 2025-05-13 15:51
人工智能行业造富现象 - 人工智能行业正在快速创造白手起家的亿万富豪,2025年《福布斯》首次发布"全球最年轻的白手起家女性亿万富豪"排名,Scale AI联合创始人Lucy Guo以30岁年龄、12.5亿美元净资产位居榜首 [1][3] - 在福布斯该榜单TOP3中,有两位富豪财富来源于人工智能行业,包括Lucy Guo和Anthropic联合创始人丹妮拉·阿莫迪 [16] - 人工智能行业的造富效应迅猛而强烈,正在将越来越多创业者从白手起家带入亿万富豪行列 [7][8] Scale AI公司发展 - Scale AI由Alexander Wang和Lucy Guo于2016年联合创立,当时Alexander仅19岁,从麻省理工学院辍学创业 [9] - 公司最初专注于自动驾驶数据标注服务,客户包括丰田、本田、Waymo等,与苹果自动驾驶部门合作创收超1000万美元 [9] - 随着生成式AI爆发,公司战略调整为提供全链条AI解决方案,客户扩展至OpenAI、微软、Meta、谷歌等科技巨头 [9][10] - 2023年公司收入达7.5亿美元,同比增长300%,成为收入最高的AI创业公司之一 [11] - 2024年完成10亿美元F轮融资,估值达138亿美元,投资方包括英伟达、亚马逊、Meta等 [12] - 2025年公司估值飙升至250亿美元,约为F轮估值的1.8倍 [12] 主要AI公司创始人财富情况 - Scale AI联合创始人Alexander Wang持有14%股份,身价约36亿美元,28岁成为福布斯"全球最年轻的白手起家亿万富翁" [6] - Lucy Guo虽已离职但仍持有近5% Scale AI股份,价值12.5亿美元 [3][15] - Anthropic七位创始成员因公司估值达615亿美元,每人身价至少12亿美元,包括丹妮拉·阿莫迪兄妹 [16][18] - DeepSeek创始人梁文锋身价在16.8亿到252亿美元之间,持有公司84%股份 [23] - 英伟达创始人黄仁勋2024年个人财富激增620亿美元,净资产达1060亿美元 [25] AI行业发展趋势 - 人工智能技术发展一日千里,正在将人类带入全新阶段 [7] - AI产业链关键基础设施提供商如Scale AI商业价值发生巨变 [10] - 大模型技术爆发推动AI公司估值飙升,如Anthropic估值达615亿美元,DeepSeek估值范围10亿至1500亿美元 [18][23] - 全球对人工智能芯片需求井喷式增长,英伟达2024年6月市值突破3万亿美元,成为全球市值最高公司 [24] 成功创业者背景特征 - AI时代成功创业者普遍在相关领域有深厚积累,如梁文锋此前创办幻方量化并管理千亿级别资金 [29] - Alexander Wang父母为核物理学家,自小展现数学天赋,就读麻省理工学院计算机科学专业 [30] - Lucy Guo父母为电子工程师,中学时期自学编程并在大学积极参与科技项目 [30] - 硬核创新是实现财富梦想的核心密码,时代会奖励技术创新者 [23][30]
如何减轻AGI 代理带来的风险
36氪· 2025-05-13 12:26
AGI定义与特性 - AGI指在广泛认知任务中匹敌人类能力的通用人工智能系统 其核心特征为多功能性和高性能[4] - 与专用AI不同 AGI具备跨领域问题解决能力 谷歌DeepMind论文将其定义为兼具通用性和智能性的系统[4] - 当前大型语言模型(LLM)已展现高度适应性 但AGI预计将实现更广泛的通用性和功能多样性[4] AGI代理架构与挑战 - AGI作为代理型AI的延续 其"处理器"需搭配自学习内存和工具才能形成完整代理系统[5][6] - 关键瓶颈在于工具灵活性不足 现有AI代理仅能控制有限终端设备 与人类操作范围差距显著[9] - 自学能力指AI在操作中提取见解并存储至永久记忆 这是实现人类水平能力的关键缺失环节[8] AGI商业应用风险 - OpenAI CEO预测2025年AGI代理可能进入劳动力市场 但就业市场影响难以预测[11] - 全球级AGI代理若接入数千企业API和数据 可能通过社会工程学引发系统性风险[14][19] - 企业若过度依赖AGI替代人力 可能面临政府监管干预 需平衡商业效率与人力需求[52] 安全部署方案 - 团队级AGI代理设计相对安全 可嵌入企业通讯工具担任知识共享或工作流协调角色[30] - 多代理系统(MAS)比单体企业级代理更安全 具备模块化、专业化和协作学习三大优势[40][41][42] - 微软提出的模型上下文协议(MCP)可标准化LLM与外部系统交互 降低API滥用风险[32] 实施层级建议 - 个人层面应优先使用AI副驾驶而非全自主代理 避免批判性思维退化[25][26] - 团队级应用适合部署功能相当于人类成员的单体代理 由集体监督训练[48] - 组织级系统应采用多代理架构 各代理仅访问特定数据域 限制潜在损害范围[45]
突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道
机器之心· 2025-05-13 10:37
本文由来自香港城市大学、麦吉尔大学(McGill)、蒙特利尔人工智能实验室(MILA)、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、 UCSB、香港中文大学等机构的多位研究者共同完成。第一作者为来自香港城市大学的博士生张启源和来自蒙特利尔人工智能实验室(MILA)的博士生吕福源。 当训练成本飙升、数据枯竭,如何继续激发大模型潜能? 在追求通用人工智能(AGI)的道路上,大模型训练阶段的「暴力堆算力」已经逐渐触及天花板。随着大模型训练成本急剧攀升、优质数据逐渐枯竭,推理阶 段扩展(Test-Time Scaling, TTS) 迅速成为后预训练时代的关键突破口。与传统的「堆数据、堆参数」不同,TTS 通过在推理阶段动态分配算力,使同一模型变得 更高效、更智能 —— 这一技术路径在 OpenAI-o1 和 DeepSeek-R1 的实践中已初显威力。 图 1 :预训练扩展和推理阶段扩展的示意。 在数学、编程等硬核任务上,TTS 表现亮眼;而在开放问答、多模态理解乃至复杂规划等场景中,它同样展现出巨大潜力。目前,研究者已探索了多种 TTS 策 略,如 Chain-of-Thoug ...
通用人工智能何时到来?
36氪· 2025-05-12 16:54
AI技术性能发展现状 - AI发展迅速,已在多项关键任务上超越人类基线水平,例如2015年图像分类、2018年中等水平阅读理解、2020年视觉推理与英语语言理解、2023年多任务语言理解与竞赛级数学、2024年博士级科学问题 [1] - 在8项关键任务技能中,AI仅在多模态理解和推理能力上略逊于人类,但自2023年起加速提升,有望很快见证AI在现有主流基准上全面超越人类水平的“奇点时刻” [1] 通用人工智能(AGI)的发展目标与行业动态 - 当前超越人类水平的AI系统多为“狭义人工智能”,缺乏通用性,行业正致力于发展具备跨领域能力、在多个方面媲美甚至超越人类的通用人工智能(AGI) [3] - 各国高度重视AGI发展,例如2023年4月28日中共中央政治局会议提出要重视通用人工智能发展,英国《国家人工智能战略》(2021)强调AGI可能性,2024年11月美国国会下属机构USCC建议建立类似曼哈顿计划的项目以更快获得AGI能力,沙特阿拉伯公布了到2050年实现AGI的雄心 [3] - 实现AGI是顶尖AI公司和科研机构的核心目标,例如OpenAI的使命是“确保AGI造福人类”,DeepMind的愿景指出AGI可能推动人类历史上最伟大的变革之一,Meta将创造AGI作为公司新目标,DeepSeek专注于研究世界领先的AGI底层模型与技术,MiniMax自称是领先的AGI科技公司 [4] 行业领袖对AGI实现时间的预测 - 行业领袖对AGI实现时间持乐观态度,OpenAI CEO山姆·奥特曼预测2025年实现,xAI CEO埃隆·马斯克预测2025-2026年,Anthropic CEO达里奥·阿莫迪预测最早2026年也可能更久,DeepMind CEO德米斯·哈萨比斯预测未来五到十年内实现 [5][6] 学术界对AGI概念与前景的争议 - 部分学者对AGI的实现持保守或怀疑态度,认为可能需要很长时间甚至永远不会到来,例如斯坦福大学李飞飞教授表示“AI仍处于前牛顿时代”,西安交通大学郑南宁院士认为通用人工智能是一个充满不确定性的未来目标,图灵奖得主杨立昆指出仅靠大型语言模型无法实现AGI,南京大学谭铁牛院士认为通用人工智能还任重道远 [6] - 行业内对AGI概念本身存在分歧和争议,例如Anthropic CEO达里奥·阿莫迪和图灵奖得主杨立昆都明确表示不喜欢术语“AGI”,李飞飞教授表示甚至不知道AGI是什么意思,机器学习先驱Thomas Dietterich批评AGI概念缺乏科学性 [6] AI发展史上的AGI预测与当前浪潮 - 人工智能70年历程中,每次技术高潮都会引发AGI争论,例如2018年的AGI-11调查显示近一半受访者认为AGI将在2030年前出现,近90%认为在2100年前;另一项对23位AI领域杰出人物的调查显示,对AGI实现时间(50%成功机会)的预测最乐观为2029年,最悲观为2200年,平均是2099年,且年长者倾向于更悲观 [7] - 历史上存在过于乐观的预测,例如1965年赫伯特·西蒙预测二十年内机器将能完成人能做到的一切工作,1970年马文·明斯基预测三到八年内将拥有与普通人类智能相当的机器 [8][9] - 面对当前大模型浪潮,存在两种基本态度:一是认为这与以往类似,是被高估的新一轮技术炒作;二是认为“这次不一样了”,将引发第四次工业革命 [10] 行业对AGI的期待与潜在风险的认知 - 实现AGI是多数人的愿望,被视为将深刻改变世界的强大工具,但同时也使人类面临可能的风险和潜在威胁,例如被人滥用或接管人类 [11] - 行业专家对AI风险表示担忧,例如辛顿表示对AGI实现后会发生什么一无所知,且安全性研究还远远不够;埃隆·马斯克和辛顿均认为AI引发人类末日的概率(P(doom))在10%-20%;MIT最新研究指出,即使采用最理想的监督机制,人类成功控制超级智能的概率为52%,且随着AGI临近,全面失控的风险可能超过90% [11]
通用人工智能何时到来?
腾讯研究院· 2025-05-12 16:11
闫德利 腾讯研究院资深专家 一、AI已在诸多任务领域超越人类 AI发展日新月异,在许多任务上已经陆续超越人类基线水平。如2015年图像分类,2018年中等水平阅读 理解,2020年视觉推理、英语语言理解,2023年多任务语言理解、竞赛级数学,2024年博士级科学问 题。下图所示的8项关键任务技能中,AI仅在多模态理解和推理能力上还略逊人类一筹,但从2023年开 始就加速提升。我们有望很快见证AI 能力在现有主流基准上"全部超越人类水平"的奇点时刻。 图 选定的 AI 指数技术性能基准与人类表现对比 二、AGI的终极目标或于年内实现 我们已经构建了无数在特定任务上超越人类水平的AI系统,但它们缺乏通用性,无法应对超出预定任务 之外的问题,尚处于"狭义人工智能 (Narrow AI) "阶段。随着AI性能的大幅提升,具备跨领域能力、在 多个方面媲美甚至超越人类的、更强大的AI被提上日程。 人们常将之命名为"通用人工智能(AGI)" 。 各国高度重视AGI。2023年4月28日中共中央政治局会议提出:"要重视通用人工智能发展";英国《国家 人工智能战略》 (2021 ) 对AGI进行了专门强调,指出"必须认真对待A ...