Workflow
通用人工智能(AGI)
icon
搜索文档
当我们再说具身大小脑的时候究竟在说什么?
具身智能之心· 2025-09-11 13:53
在通往通用人工智能(AGI)的探索中,具身智能逐渐成为关键方向之一。相比于传统的预设动作序列不 同,具身智能强调智能体与物理环境的交互与适应,聚焦于如何让智能体具备在物理世界中感知环境、理 解任务、执行动作并反馈学习的能力。 而具身智能领域最重要的两个部分:大脑和小脑构成了具身机器人最重要的模块,如果类比于人,大脑负 责思考感知(主导语义理解和任务规划),小脑负责执行(高精度的运动执行)。 国内外相关领域产业分析 国外方面,Tesla/Figure AI在工业与物流机器人应用上持续推进,而美国投资机构也积极支持 Wayve、 Apptronik 等公司落地自动驾驶与仓储机器人。总体而言,国内企业以产业链投资与综合平台驱动具身智能 落地,国外科技巨头则侧重基础模型、模拟环境与类人机器人原型研发,双方在该领域正加速进入关键竞 赛阶段。 具身智能的技术演进 具身智能技术的发展经历了从低层感知到高层任务理解与泛化的持续演进,其核心目标是不断提升机器人 在真实世界中自主感知、理解和行动的能力。 第一阶段: 技术研究主要聚焦于抓取位姿检测(Grasp Pose Detection),通过点云或图像预测合适的末端 执行器姿 ...
奥特曼和硅谷投资大佬对话:2030年代,世界500强公司会加速消亡
36氪· 2025-09-11 08:05
奥特曼认为,AI可成为切实放大人类追求的强大倍增器,能使"单个人可完成的事务"达到当前需要庞大 团队才能实现的规模。他援引建造戴森球、部署纳米机器人等科幻概念为例,指出这些看似遥不可及的 文明级别项目,可能借助AI的扩展潜力变得具备可行性。这一观点颠覆了人们对生产力的传统认知: AI并非仅仅是实现自动化的工具,更是放大人类能力的重要载体。 奥特曼把这种变化与传统企业结构的消亡联系在一起。当科斯拉提出"21世纪30年代《财富》500强企业 将以更快速度消亡"的观点时,奥特曼表示虽然无法推测到精准的时间,但直觉认为速度会更快。 他特别指出,软件公司在这一趋势下尤其脆弱,并预测未来用户将通过"向聊天机器人输入指令" 的方 式,即时生成符合自身需求的定制软件,从而绕开当前的SaaS(软件即服务)巨头。这种"即时生成软 件"的模式,有可能对当前价值数十亿美元的软件企业帝国形成冲击。"过去我以为理解软件公司的运行 规律,但在一个任何软件都能'即时生成'的世界里,这些规律将被颠覆,"奥特曼说。他认为,OpenAI 自身的成长就是"新公司快速取代旧公司的加速效应"的典型案例。 9月10日消息,近日在硅谷的一场对话把人们的目光 ...
Altman描绘AI十年路线图:"智能即电力",任何软件秒生,10人公司也能年入10亿
美股IPO· 2025-09-11 00:06
Altman预计,十年后AI的成本会趋同于电力成本,算力与能源将成为价值核心;虽然AI将能胜任"几乎所有的智力工作",但那些需要深度情感连接和同 理心的职业——如教师、护士、长者照护——将变得更加珍贵,"生物程序设计是非常难以克服的。" 他建议投资者,不要花时间寻找下一个AI研究实验 室,要"把100%的时间用来投资于因AGI而成为可能的新物种"。 在与OpenAI早期投资人Vinod Khosla的最新对话中,OpenAI CEO Sam Altman勾勒了一幅未来十年人工智能(AI)发展的图景:到2035年,软件将 实现即时生成,10人公司年收入可达10亿美元,而AI的成本将趋同于电力成本。 这场与硅谷传奇风险投资人Vinod Khosla的深度对话揭示了AI技术将如何重塑商业格局,同时保持人类核心体验的不变性。 Altman预测,技术变革速度将"难以用现有框架去理解",但人类的生物性需求——社交、情感连接和家庭关怀——将保持恒定。这种矛盾将定义未来十 年的发展轨迹。 对话中最引人注目的观点是对传统软件行业的颠覆预测。Altman表示,"我们正走向一个世界,在那里你想要的任何软件都可以即时生成",这将彻底 ...
通用人工智能就在身边,为何我们感知却不明显?
虎嗅· 2025-09-08 09:51
AGI发展现状 - AGI并非3~5年后的技术 而是已经存在于当前环境中 其发展是一个递归过程 深度和范围将持续扩大[1] - AI已在特定角色(如编程)实现全功能覆盖 这本质上是AGI的体现 因为每个角色都需要综合判断能力[2] - 当前AGI感知不明显的原因类似于坦克初发明时被误认为不如狗拉爬犁 属于应用场景错配[3] 智能原生概念 - 智能原生并非单纯技术 而是技术与组织模式匹配的思维模式 旨在改造产品和服务生产过程[8] - 智能原生企业被列入国务院"人工智能+"行动意见 成为政策重点方向[5] - 智能原生是以AI为主体、智能优先的价值创造体系 AI成为价值创造主体 AI-AI协作取代传统组织流程[29][30] 技术应用案例 - 编程领域出现范式变革:传统需要产品经理、架构师、前后端工程师、测试工程师协同的流程 现在可通过自然语言与编码助手(如Claude Code)交互完成 效率提升显著[24][25] - 实际案例显示:算法工程师一天完成过去一个团队需数周的工作量 且一行代码未写[26] - 运维领域实现突破:借助AI编程 一周内完成k8s/日志ELK/监控Prometheus/数据库等全套服务部署 效率较传统方式提升数十倍[33][34] 组织变革趋势 - 业务组织呈现可折叠特性 随着智能水平提升而递归演进:从编程团队扩展到运维 再延伸到多个职能 最终覆盖整个公司[31] - OpenAI五级模型体现内置逻辑:Agent与Organization本质相同 仅面对范围和复杂度存在差异[36] - 最终演进方向是"无人公司"或AI Level5状态 实现完全智能原生运营[13] 行业影响分析 - AI进化速度超越人类进化速度 2022年至今的应用形态已发生根本性变化[17][18] - 传统工具开发面临生存危机:业务周期和商业化周期可能长于技术更迭周期 导致时间窗口大幅缩短[41][42] - 价值创造范式发生迁移:关键不再是AI技术使用 而是如何用AI封装业务 需要找到由数据和工具构成的AI现实边界[44][46][47] 竞争格局演变 - 纯粹经济世界将形成"智能高者胜"的基本竞争原则[59] - 若智能水平持平 反身性将导致待计算世界持续变化 大规模计算难以获得相应回报 体系可能进入热寂状态[60][61] - 技术推动商业形式走向既有形态终点 并开启新文明状态[63] 发展路径选择 - 自下而上路径:从各种细碎工具起步 但必须持续演进 否则将被大模型折叠力量淘汰[49] - 自上而下路径:直接瞄准无人公司 以智能原生方式处理最终业务 锁定销售额和现金流 但需补全AI在数据、知识、工具方面的不足[50]
马斯克值不值万亿美元薪酬 | 财经峰评 | 巴伦精选
搜狐财经· 2025-09-08 09:10
当A股最大公司还停留在3000亿美元市值规模时,美股已出现了有望冲击万亿美元薪酬的CEO。 9月5日,特斯拉董事会为CEO埃隆·马斯克提出了一份新的薪酬方案。若马斯克能在未来十年内实现一系列极具挑战性的业绩目标,他将获得价值约1万亿美 元的股票奖励。 获得1000万个FSD(Full Self-Driving)订阅。 如此天价薪酬,纵然是公认的商业奇才马斯克,也不禁让人探讨他是否值得。 要回答马斯克值不值万亿美元薪酬,需审视两个核心:特斯拉能否冲击8.5万亿美元的市值目标;马斯克拿走1万亿美元回报是否合理。 该薪酬方案计划授予马斯克约4.23亿股特斯拉股票,分12个批次解锁。每一批次的解锁都需同时达成市值和运营两类里程碑目标。 市值目标要求特斯拉市值从当前的约1.1万亿美元增长至最终的8.5万亿美元,接近10万亿美元这个量级。 我在此前的文章《》中提到过,"下一个物理AI时代,可见的大赛道智能驾驶,倒是有着更大的市场想象空间,10万亿美元巨头更有可能出自于此,硬件龙 头目前来看特斯拉最有希望。"看来特斯拉董事会所见略同。 运营目标则包括: 交付2000万辆特斯拉汽车。目前存续量800万辆;2024年交付量不足 ...
通用人工智能(AGI)已经来了
36氪· 2025-09-08 08:21
AGI发展现状 - AGI并非3~5年后的未来概念 而是已经存在于当前技术环境中 其发展是一个递归过程 深度和范围将持续扩展[1] - AI已在特定角色(如编程)实现全功能覆盖 这本质上是AGI的一种表现 因为任何角色均需综合判断能力[1] - 当前AGI感知不明显的原因类似于坦克初发明时被误判为不如狗拉爬犁 属于应用场景认知滞后[1] 智能原生概念与特征 - 智能原生是技术与组织模式匹配的思维模式 其核心是改造产品和服务生产过程[5] - 智能原生企业被置于政策显著位置 国务院文件明确提及该概念[3] - 智能原生体系以AI为价值创造主体 遵循智能优先原则 AI-AI协作取代传统复杂组织流程[16][17] - 智能原生模式下生产流程高度简化 例如软件开发从多角色协作的"交响乐"变为AI辅助的"独奏"[13] 技术演进与产业影响 - AI进化速度呈现指数级提升 2024年AI与2022年AI已本质不同[9] - AI推动"一切皆可重建" 传统价值模式被快速解构与重构[11] - 技术更迭周期缩短至低于业务商业化周期 导致产品存续时间窗口大幅收缩[25][26] - 编程领域效率提升显著 案例显示AI可在1天内完成传统团队需数周的工作量[13] - 运维领域实现突破 借助AI编程可在1周内完成k8s/日志监控/数据库等全套服务部署[20] 组织形态变革 - 无人公司是智能原生发展的终极形态 对应AI Level5水平[8] - 组织内化为智能体间关系 业务职能按智能水平提升递归折叠[18] - 可折叠组织随智能水平提升而演进 从编程团队递归至运维职能直至整个公司[18] 价值创造范式转变 - 核心竞争力从技术驾驭转变为价值创造模式驾驭[27] - 关键成功因素是如何用AI封装业务 而非单纯使用AI技术[29] - AI发展导致执行能力贬值 范式发生本质迁移[29] - 需持续打破AI应用障碍 为其力量发挥铺平道路[31] 实施路径与挑战 - 双向理解困难成为落地关键障碍 技术理解与组织运作存在认知鸿沟[8] - 实施路径存在两种方式:从细碎工具逐步扩展 或直接从无人公司智能原生模式切入[32] - 核心挑战在于构建人类知识与局部AGI的无缝衔接体系[8] 思维模式变革 - AI思维表现为数字和智能空间优先的思维模式[36] - 智能优先对应虚拟先行 规模化试错 算力对冲不确定性等具体思维[34] - 角色边界重新定义 AI辅助人与人类辅助AI存在本质差异[35] 行业生态影响 - 反身性可能导致智能持平状态下计算回报跟不上成本 体系进入热寂状态[37] - 技术推动商业形式趋向既有形态终点并开启新文明状态[37] - 依赖倒置世界逐渐形成 虚拟世界开始牵引物理世界运行[36]
从AI上下半场切换看后续产业投资机会
2025-09-08 00:19
从 AI 上下半场切换看后续产业投资机会 20250907 摘要 AI 技术正从深度学习转向大语言模型,核心在于智能涌现,包括理解、 生成、记忆和逻辑四大能力,推动从感知智能向认知智能转化,重塑用 户体验和生产效率。 AI 产业发展依赖算力、算法和数据三大要素,形成飞轮效应。上半场探 索模型智力极限,算力为王;下半场完善系统能力,应用为王,核心在 于 AI 系统构建与产品能力。 Transformer 框架的大规模应用引发质变,理解和逻辑推理能力涌现, 推动通往 AGI 的路径,并在文本、图像视频等领域产生新范式,模型治 理与工具水平提高。 短期内,大模型升级逐渐触及天花板,应用效果成为重点。发展路径包 括效率提升(数学及编程)、推理提升以及全模态模型,这些是后续重 点发展方向。 海外科技巨头如 Meta 持续加大资本开支,预计 2025 年同比 2024 年 有显著增长,积极投入以支持算力需求,推动技术与场景融合,加速 AI 发展。 Q&A AI 产业经历了哪些主要发展阶段? AI 产业经历了三次主要浪潮。第一次浪潮发生在 20 世纪 50 年代到 70 年代, 是人工智能的起步阶段,首次提出 AI 概念, ...
OpenAI,开始对马斯克“猎巫”
搜狐财经· 2025-09-07 21:25
本文来自微信公众号:,作者:余测,编辑:胡润,原文标题:《马斯克的官司还没打完,OpenAI已经开始"动刀"了》,题图来自:AI生成 马斯克起诉OpenAI已一年多,这场关于AI未来归属权的世纪争端还在法庭上打得难解难分。 但在台下,OpenAI已经提前出手,悄悄开始对"反对阵营"动刀。 他们发出一连串律师函,传唤那些在公共场合支持马斯克立场的非营利组织,翻查邮件、通话记录、社交网络,甚至质疑他们的资金来源。 只因为他们曾经质疑OpenAI从非营利转型为商业公司。 像极了一场猎巫行动。 故事从一个奇怪的电话开始 这事的起点,要从几张看似不起眼的传票说起。 就在上月的一天晚上,Nathan Calvin正在他妈妈家做晚饭。 这位年纪轻轻就成了AI伦理组织Encode总顾问的律师,还没来得及做完饭,就接到了一个陌生人的电话。对方说,自己要给他送法律文件,站在他公寓门 口。 但问题是,他根本不在公寓。他在城的另一头。 那一刻他懵了。一个非营利组织的律师,怎么会突然被找上门要送传票? 结果这个神秘人并没有出现。直到两天后,一个真正的警长带着厚厚一沓文件上门,才揭开了谜底——是OpenAI。 不为别的,只因为他所在的组 ...
23岁“神童”被OpenAI扫地出门后,募集15亿美元专投AI,半年收益率47%
新浪财经· 2025-09-07 17:23
今年上半年,美国标普500指数上涨约6%(包含发放的股息在内),PivotalPath公司数据显示,同期美 国主要科技对冲基金平均收益率约为7%。也就是说,一个23岁小伙单独操盘的基金收益率,接近华尔 街"老手"们的7倍。 据报道,近日,23岁的德国小伙利奥波德·阿申布伦纳在美国旧金山创立的Situational Awareness基金取 得了惊人的收益率。据一名内部知情人士透露,该基金目前掌管着超过15亿美元的资金,今年前两个季 度的资产收益率高达47%。 阿申布伦纳个人官网照片 ▲ 阿申布伦纳被誉为"神童"。他2002年出生于德国,曾就读于柏林当地的约翰·肯尼迪学校,这是一所用 德英双语进行教学的精英学校。2021年,他以第一名的成绩作为毕业生优秀代表从美国哥伦比亚大学毕 业,当时只有19岁。由于学业优异,他曾被邀请为牛津大学的全球优先事项倡议进行研究,并与牛津大 学的菲利普·特拉梅尔合作撰写工作论文。 阿申布伦纳于2023年加入OpenAI,参与名为"超级对齐"的项目,该项目主要研究未来潜在的超级智能 如何与人类价值观保持一致。当时的OpenAI首席科学家苏茨克维尔正是该项目的领头人,阿申布伦纳 与苏茨 ...
李飞飞的答案:大模型之后,Agent向何处去?
虎嗅APP· 2025-09-07 10:51
Agent AI核心框架 - 提出由环境与感知、认知、行动、学习、记忆五大模块构成的智能体认知闭环架构 这代表对未来通用人工智能发展路径的前瞻性思考[10][12][17] - 感知模块具备多模态信息接收能力和任务规划与技能观察功能 使智能体能主动从物理或虚拟世界获取信息[12] - 认知模块作为处理中枢 由大语言模型和视觉语言模型提供世界知识、逻辑推理和上下文理解能力[14] - 行动模块通过控制器生成物理世界交互指令或虚拟世界API调用[15] - 学习模块支持预训练、零样本/少样本学习、强化学习和模仿学习等机制 实现持续自我进化[16] - 记忆模块采用持久化结构化系统存储知识、逻辑和推理结果 支持长期经验积累[17] 大模型驱动机制 - 大型基础模型特别是LLM和VLM的成熟是Agent AI框架的根本驱动力 为智能体提供零样本规划能力[20] - 大模型存在的"幻觉"问题可通过环境交互机制解决 环境反馈能迫使模型内部知识与外部现实对齐[21] - 基础模型存在社会偏见风险 需通过多元化数据训练和偏见检测机制确保包容性[22] - 个人数据隐私保护需建立明确法规框架 通过提示工程和人类监督层确保安全可控[22] 游戏领域应用 - 彻底改变传统NPC由固定脚本驱动的模式 实现基于记忆、目标和情感的动态行为调整[25] - 支持玩家用自然语言与游戏世界互动 为开放世界游戏带来前所未有的沉浸感和自由度[25] - 可作为创作者副驾驶 根据指令自动生成游戏关卡、道具和完整3D场景 大幅提升开发效率[25] 机器人领域应用 - 用户可用日常语言下达指令 机器人自主规划执行复杂物理操作 如GPT-4V可将人类演示视频转化为可执行任务序列[27] - 通过领域随机化技术在模拟训练中引入变化 增强对真实世界差异的鲁棒性[27] - 融合视觉、语言、触觉等多模态信息理解环境 实现更精准的物理交互[27] 医疗健康应用 - 作为医疗聊天机器人进行初步问诊和病史收集 基于医学知识库提供诊断建议 提升初级诊疗覆盖率[29] - 连接实时更新的医学数据库 在生成诊断时同步进行事实核查和来源引用 抑制模型幻觉[29] - 处理分流患者信息并监控慢性病患者生命体征 实现高效个性化健康管理[31] 发展挑战与方向 - 需解决视觉、语言、听觉、动作等多模态深度融合问题 而非浅层拼接[32] - 需训练能跨游戏、机器人和医疗等不同领域工作的通用智能体 而非定制化模型[32] - 建立科学评测体系至关重要 研究团队已提出CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准[32]