AGI

搜索文档
The Second Half:一位 OpenAI 科学家的 AI 下半场启示录
海外独角兽· 2025-04-17 14:26
AI发展阶段的划分 - AI发展已进入下半场,从单纯解决问题转向定义问题和评估模型效果 [6][7] - 上半场核心在于训练方法创新,如Transformer、AlexNet、GPT-3等模型突破 [9] - 上半场训练方法论文引用量远超benchmark论文,如Transformer引用16万次vs WMT'14的1300次 [9][11] 强化学习(RL)的突破 - RL获得泛化能力,能同时处理软件工程、创意写作、数学问题等多样化任务 [8] - RL三大要素中,先验知识(priors)重要性超过算法和环境 [13][14][15] - 语言模型pre-training为RL提供了关键先验知识,但直接应用于控制领域效果不佳 [20][21] AI有效配方 - 核心配方包含:大规模语言预训练、算力数据扩展、推理与行动理念 [12] - 语言通过agent reasoning实现泛化,如ReAct框架结合推理与行动 [25][26] - 环境设计重要性凸显,OpenAI曾开发Gym、World of Bits等标准化RL环境 [18][19] 评估方法的转变 - 传统i.i.d评估假设与现实不符,需开发考虑长期记忆和连续任务的评估方式 [30] - 自动评估假设被质疑,真实人机交互评估如Chatbot Arena更具现实意义 [28][30] - 效用问题成为关键,AI需从攻克benchmark转向创造实际经济价值 [28][30] 行业影响与趋势 - 通用配方使渐进式改进价值降低,5%专项优化可能不如30%的通用模型提升 [26][28] - 下半场将催生万亿级公司,通过智能产品化实现商业价值 [30] - 行业需重新思考问题定义,产品经理类技能将更受重视 [7][28]
科技龙珠雷达系列 - 上海篇-系统梳理中国科技龙珠
2025-04-15 22:30
纪要涉及的行业和公司 - **AI大模型及语调服务行业**:库拉斯 - **机器人行业**:智源机器人、达塔科技、飞西科技 - **国产GPU行业**:沐锡、碧人科技、四元科技 纪要提到的核心观点和论据 库拉斯 - **核心观点**:在AI领域有重要地位,发展态势良好 [3] - **论据**:2024年3月成立,背靠国资,为大模型企业提供语调服务;语调服务规模达260T,合作伙伴超100家,签署几十家战略协议;正在建设大模型语调超级工厂,预计2025年底语调库总容量提升到2PB,每天语调加速加工速度达1000P [2][3] 智源机器人 - **核心观点**:具备AI加本体的全站技术,产品和技术有创新突破 [4][6] - **论据**:有远征精灵、灵犀等三大机器人系列家族,已量产下线超一千台通用巨神机器人;灵犀X2全身有28个自由度,能做高难度动作;3月10日发布智源起源大模型,提出VLM + MOE混合架构;3月11日推出新一代人形机器人零星XR,在四个痛点方面有改进,实现三大技术创新 [4][5][6][7] 达塔科技 - **核心观点**:创新性提出云端机器人架构并实现商业化 [8] - **论据**:通过人工智能、多模态融合AI、数字软生论等先进技术,实现机器人自我学习、进化和成长 [8] 飞西科技 - **核心观点**:专注工业化机械臂生产,产品应用场景广泛 [9] - **论据**:核心创业团队来自斯坦福大学机器人和人工智能实验室;飞西玄辉系列凭借多自由度力矩传感器,可在工业、医疗、科研教育、农业等领域应用 [9][10] 沐锡 - **核心观点**:在高性能通用GPU研发有成果和突破 [11] - **论据**:核心团队有近20年高性能GPU产品开发经验;有N、C、G三个系列GPU产品;联合联想发布首个国产Digifig一体机解决方案;实现中国首个四种以上异构芯片混训技术落地;2022年8月发布的BR100芯片创造全球算力纪录,16位浮点算力达1000T以上,8位定点算力达2000T以上 [11][12] 碧人科技 - **核心观点**:针对Queen32B推理模型有部署成果 [13] - **论据**:推出全面支持Queen32B大模型推理的TM106全系列一体机,该大模型接近DeepSea R1的推理能力水平 [13] 四元科技 - **核心观点**:在人工智能云端算力产品有优势 [14] - **论据**:计算集群布局领先,能为企业提供开箱即用的快速部署效果;依托智能加速卡和计算集群,为大型计算中心提供加速产品,降低客户成本;有预算和建算两个软件开发平台,还有内容生成服务产品;2025年率先完成对deepseq全量模型高效适配,一体机已在多地智能计算中心完成1万张卡部署 [14][15] 其他重要但是可能被忽略的内容 - 科技龙珠企业不仅在各自领域领先,在国际上有影响力,能突破国际巨头垄断,引领中国技术发展潮流,有望引发国家对科技企业的关注热潮 [16] - 建议加大对计算机等科技类资产配置,为未上市但有突破的科技企业提供资金支持 [16]
大厂AI应用三国杀,BAT新共识瞄准平台生态
新财富· 2025-04-14 15:10
中美AI产业的叙事分歧 - 美国AI科技公司坚持"One For All"单一大模型愿景,认为通用大模型将覆盖垂类场景,如GPT-4o的图像生成能力是里程碑事件[3] - 中国AI产业主流叙事转向字节、阿里、腾讯的"三国演义",大厂主导AI应用及开发生态之争[3] - 中美分野体现"技术理想主义vs商业现实主义"的对抗,两条路线无明确优劣之分[4] 早期中美AI技术差距与中国初创公司选择 - 中国"AI六小虎"(智谱、月之暗面等)专注自研基座大模型,但与美国OpenAI技术差距显著[6] - 商业化压力迫使"六小虎"转向应用层突围,仅Kimi凭借长文本差异化成功获得C端流量[8] - 2024年美国AI风险投资额808亿美元,是中国的十倍,中国一级市场融资困难[9] 从"六小虎"到"三国杀"的巨头竞争 - 字节跳动all in AGI,成立Seed AI部门并投入800亿Capex,豆包成为2024年下载量1.8亿、MAU断层领先的C端应用[12][13][14] - 阿里、腾讯调整组织架构:阿里拆分通义团队,腾讯分拆元宝与混元模型[15] - DeepSeek开源模型R1拉平技术差距,腾讯全产品线接入获得流量增长,阿里加强自研Qwen模型并提升夸克战略地位[16][17] 技术突破对行业格局的冲击 - DeepSeek超低成本开源模型超越豆包登顶下载榜,Monica团队Agent产品思路受认可,OpenAI GPT-4o文生图功能颠覆市场[22] - 技术变革加速:DeepSeek R2、GPT-5整合o3、MCP协议等可能重塑行业[23] - 大厂难以复制移动互联网推广路径,需警惕技术突破摧毁产品围城[23] 巨头战略调整与技术生态共生 - 字节将"追求智能上限"定为首要目标,阿里腾讯加速自研:阿里冲刺AGI,腾讯发力Mamba架构混元T1模型[25] - 阿里云推出全周期MCP服务,50余款服务可拖拽式集成,200多款大模型实现5分钟应用搭建[29] - 腾讯云支持DeepSeek与混元双引擎,字节扣子平台提供60余种插件,大厂推动开发生态繁荣[30]
“机器人领域,谁敢赚黑心钱?” | 科创100人
新浪科技· 2025-04-10 09:17
行业趋势 - 2025年全球人形机器人产业迎来爆发临界点,宇树科技和特斯拉擎天柱机器人推高行业热度 [2] - 行业存在"过热"质疑,但需在机器人未完全实现AGI时植入商业场景以实现早期商业闭环 [2][5] - 中国在人形机器人技术领域全球领先,海外团队效率低于国内,人才密度和投入时间不足 [6] 公司动态 - 数字华夏研发国内首款面部29个主动自由度的仿人机器人"夏澜",男性版"夏起"和女性版"夏澜"于2024年3月18日亮相 [2][4] - 公司由前华为天才少年彭志辉创立的智元机器人注资,供应链依赖智元,聚焦运动控制、灵巧手等核心技术 [4] - 团队来自华为、富士康、大疆,兼具to B和to C经验,成立一年已获头部银行、运营商、电网等客户 [4][5] 商业化路径 - 优先解决客户场景闭环问题,专注展厅讲解、导览导购、文旅互动、康养陪护等交互场景 [4] - 现阶段机器人未达真正智能,客户购买目的均为业务增值而非纯消费,例如零售行业效率提升案例 [5] - 商业模式由技术和市场双轮驱动,未来侧重本体关键部件和软硬件整体应用能力 [7][8] 行业挑战与标准化 - 当前行业亟需统一数据标准和机器人本体标准(如1.7米成人型/1.3米小型),以提升数据通用性和减少资源浪费 [6] - 供应链成本结构相近,厂商价格差异源于商业策略而非核心技术,行业不存在暴利现象 [6] - 三年后机器人硬件将无门槛,产业链可能出现ODM/OEM分工,应用层公司将百花齐放 [7] 竞争格局 - 大公司具备资金和场景优势,但小公司在单点技术突破和组织效率上更具竞争力 [7] - 全球12亿家庭需求场景无限,市场足以容纳多参与者,竞争者增多验证方向正确性 [7]
对话智元首席科学家:把具身智能过度类比大模型,是对它最大的误读
36氪· 2025-04-05 19:41
文章核心观点 - 具身智能赛道存在泡沫但也有发展前景,软硬件一体的全栈路线是未来趋势,当下是入局和突破的最佳时间点 [10][23][44] 行业现状 - 具身智能赛道一边有投资人逃离泡沫,一边被高额融资激活,腾讯首次押注具身智能领域的智元机器人,该公司成立仅1月完成3亿天使轮融资,几个月内估值达10亿美金,成为全球最快跻身独角兽的具身智能公司 [5] - 行业还未收敛到确定性技术方案,未出现引领型明星公司 [30] - 全球有500万台机器人被部署在真实世界,但都是盲的,靠绝对定位操作,做重复性编程和工作 [42] 泡沫看法 - 泡沫意味着关注度和资源,是提前下注,技术范式转移都会经历泡沫阶段,具身智能更复杂,需要更长时间技术积淀 [10] 大模型与具身智能关系 - 不能简单将具身智能与大模型范式划等号,大模型准确率在机器人身上不适用,用大模型周期类比具身智能低估了作业智能和行动智能的独特挑战 [12][13] 软硬件重要性及卡点 - 软件和硬件同等重要,目前软件和硬件都未收敛到点,行业对两者集成也无共识 [14] - 软件方面,大模型缺乏长时间memory,跨任务尝试、分层控制和实时反馈是难题,仿真、数据使用及RL应用都存在挑战 [15] - 硬件方面,高性能硬件平台成本高,传感器反馈不够精细,可靠性有提升空间,未来可能根据不同行业有相对标准化本体和方案 [16][17] 数据问题 - 数据问题像蛋生鸡、鸡生蛋难题,可先从封闭、半封闭空间部署机器人获取数据来改进系统 [18][20] - 自动驾驶早期也有数据匮乏争论,现在数据过多,具身智能公司掌握产品和生态、有能力部署机器人将有先发优势 [21] 全栈路线必要性 - 自动驾驶和无人机行业发展表明,软硬件一起迭代的全栈路线会笑到最后 [22][23] 智元公司情况 - 智元是中国头部具身智能公司中最高举高打的一家,发布首个通用具身基座大模型,与Pi达成合作,首席科学家是罗剑岚 [6] - 公司内部是扁平、高度协作团队,稚晖君、姚卯青和罗剑岚是平行互补关系,分别负责系统工程、战略方向和算法路线推动及外部技术生态融合 [25][26] - 选择与Pi合作是因理念契合,Pi是国际上做具身智能最好的公司之一 [27][28] - 公司采用生态打法,强调开放协同,帮助外部公司迭代并引入其能力到自身生态体系 [29] 自主决策与任务定义 - 机器人自主决策关键在于对不确定性的分析和建模,换成可执行动作链,其感知、预测、生成机制的泛化能力是关键技术 [31] - 长周期任务关注任务先后复杂依赖关系和泛化能力,复杂任务在manipulation上有未解决问题,如机器手接触外界的物理现象和多模态视觉输入下完成灵巧任务 [32] 机器人AGI相关 - 实现manipulation就是AGI,是比LLM更高级的智能 [34] - 最感兴趣的是让系统有更强自主学习和泛化能力,智元新成立的具身智能研究中心希望打通从基础科学到技术落地的链路 [36] 强化学习与入局优势 - 受大模型影响,强化学习在具身智能领域成潮流,不同背景的人入局视角不同 [37][38] - 大厂和消费电子公司入局是积极信号,它们在用户体验、产品化等方面有积累,创业公司优势在于对行业底层逻辑理解更垂直、精致,擅长智能,最终两个方向会聚合 [39][40] 行业周期与入局时机 - 具身智能已走过约十年探索期,现在进入机器人应用窗口期,特定场景有使用价值且有持续学习能力的机器人会提前到来,是入局和突破的最佳时间点 [41][42][44]
速递|前OpenAI团队操刀,Nova Act浏览器AI助手,测试得分超竞品OpenAI
Z Potentials· 2025-04-01 11:49
亚马逊Nova Act AI Agent发布 - 亚马逊发布通用AI Agent技术Nova Act 旨在与OpenAI Operator和Anthropic Computer Use竞争 通过控制网页浏览器执行简单操作提升AI聊天机器人实用性 [1] - Nova Act由亚马逊AGI实验室开发 将集成至Alexa+升级版本 目前提供研究预览版 开发者可通过nova.amazon.com访问SDK工具包构建原型 [2] - 功能覆盖自动订餐、网页浏览、表单填写等基础操作 亚马逊称其内部测试表现优于OpenAI CUA(88%)和Anthropic Claude 3.7 Sonnet(90%) 在ScreenSpot Web Text测试中得分94% [3][4] 技术细节与团队背景 - Nova Act未采用WebVoyager等常见AI Agent评估标准 但通过SDK允许开发者定义工作流中的人类干预节点 以提高应用可靠性 [5][6] - 开发团队由前OpenAI研究员David Luan和Pieter Abbeel领导 二人曾创立Adept与Covariant 被亚马逊挖角后主导AI Agent项目 目标为实现"计算机上人类可完成的任何任务" [6] 市场竞争与行业意义 - 亚马逊凭借Alexa+的广泛用户基础 可能实现AI Agent技术最大覆盖范围 但需解决早期竞品(如OpenAI/谷歌/Anthropic)存在的响应延迟、操作失误等问题 [7] - Nova Act作为AGI实验室首款公开产品 被视为亚马逊AI战略关键 其表现将影响长期延迟的Alexa+市场反响 [7] (注:文档id 8-13为无关招聘信息 已跳过)
字节 AI 再创业:独立组织、全链条的饱和出击
晚点LatePost· 2025-03-31 19:58
字节跳动AI战略布局 - 公司面对AI机遇采取饱和式投入策略,至少5个团队同时开发不同智能体产品,包括对内工具[3] - 2023年年中决定自主开发AI后,公司在算力芯片层、云计算层、模型研发层、应用层实现全链条布局[3] - 产品矩阵覆盖聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等主流方向,主力产品豆包在2024年底成为中国日活最多AI应用[4] - 2025年设定三大目标:探索智能上限、探索新UI交互形式、加强规模效应,由Flow/Seed/Stone三大板块近2500人团队支撑[17] 技术研发进展 - 模型迭代速度显著提升,2023年8月至2025年5月共发布12个版本,涵盖对话/视频生成/音乐/视觉理解等多领域[10] - 2025年1月发布豆包大模型1.5 Pro版本,多模态与推理能力全面提升[10] - 组建独立模型研发团队Seed,整合原有AI Lab资源,40%研究人员为近两年新增[15] - 引入Google Fellow吴永辉等顶尖人才,设立Seed Edge前沿研究计划瞄准AGI探索[21] 市场竞争态势 - 主力产品豆包被腾讯接入DeepSeek的元宝快速追赶,后者用十分之一时间达到豆包20%用户规模[5] - 错过中国ChatGPT时刻,因内部对复现OpenAI o1模型存在时间误判[10] - 面临DeepSeek开源模型冲击,该团队不足200人却实现技术突破[4][13] - 豆包2025年DAU目标超5000万,季度增长目标从30%调高至150%[22] 组织架构创新 - 建立独立AI组织Flow/Seed,与抖音/TikTok等业务平级,直接向创始人汇报[15] - 打破原有薪酬考核体系,为AI团队提供百万年薪及5年长周期评估机制[15] - 创始人张一鸣深度参与技术研究,每月召集核心团队复盘进展[16] - 采用"能力中台"模式,将模型能力模块化供产品团队调用[21] 资源投入规模 - 2023年GPU储备超10万张,上半年英伟达订单超10亿美元[22] - 2025年AI算力采购预算达900亿元人民币,优先保障大模型研发[22] - 通过收购补充技术能力,包括Oladance耳机品牌及存算一体硬件公司[15] - 调动全集团资源支持,曾阶段性限制非AI产品在抖音体系的广告投放[22]
智谱发布AutoGLM沉思版,背后推理模型媲美DeepSeek-R1:推动AI Agent进入「边想边干」阶段
IPO早知道· 2025-03-31 12:07
核心观点 - 智谱正式发布全球首个集深度研究与实际操作能力于一体的AI Agent AutoGLM沉思,推动AI进入"边想边干"阶段 [3][5][6] - AutoGLM沉思融合深度思考、感知世界和工具使用三大能力,突破传统AI局限,实现长程推理和任务执行 [7][8][9] - 智谱在AI Agent领域持续创新,从Function Call到智能体编排再到设备操控智能体,保持技术领先 [6] - 公司自主研发全栈大模型技术,包括基座模型、推理模型和沉思模型,将于4月14日开源 [13][14][28] 技术演进 - 技术路径:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [3] - 新版基座模型GLM-4-Air-0414:320亿参数,优化智能体任务能力,32B参数量比肩更大模型 [15] - 新版推理模型GLM-Z1-Air:深度优化通用能力,推理速度提升8倍,成本降低至1/30,可在消费级显卡运行 [17][19][21] - 沉思模型GLM-Z1-Rumination:通过强化学习提升长程推理能力,结合实时搜索、工具调用和深度分析 [24][26] 性能表现 - AutoGLM系列在AgentBench评测中取得SOTA成绩,Phone Use任务成功率提升超20%,Browser Use超越GPT-4o和Claude-3.5-Sonnet [10] - 自研模型GLM-PC(CogAgent)仅9B参数即超越GPT-4o + UGround等更大规模模型 [12] - GLM-Z1-Air在AIME 24/25、LiveCodeBench等基准测试展现强大数理推理能力 [17] 生态布局 - 战略聚焦Agentic GLM研发,推动智能体技术发展,搭建Agentic LLM平台助力生态合作伙伴 [31] - 已携手金融、教育、医疗、政务等领域合作伙伴推进Agentic LLM落地应用 [33][34] - 与多个城市达成合作,推动当地大模型应用生态建设 [34] - 推动中国AI解决方案出海,帮助"一带一路"国家构建自主大模型,发起"自主大模型国际共建联盟" [35]
世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮 | 42章经
42章经· 2025-03-30 22:25
东升西落叙事 - 美国市场从24年开始因AI领先和美元强势吸引全球投资,但Trump上台后政策调整引发宏观不确定性,导致股市剧烈震荡[2][3] - 中国市场24年股价开始回升,今年因DeepSeek发布彻底引爆,反映此前对科技行业预期过低的价值回归[5][6] - 中美AI发展路径差异显著:美国专注scaling law和AGI,中国聚焦应用落地和成本优化[8][9] 中美AI发展差异 - 美国AI发展路径依赖高成本投入(算力/数据),但模型能力提升不及预期[9] - DeepSeek通过工程优化大幅降低成本,实现更好性能输出,打破高成本叙事[9] - 中国AI应用注重覆盖更广泛用户群体,如Manus团队专注让未接触AI人群使用产品[10][11] 标志性产品分析 - DeepSeek开源模型使腾讯等公司跳过模型军备竞赛阶段,直接进入应用开发[26] - Manus采用脉冲式增长策略,通过Prosumer群体快速传播,但被误读为OpenAI对标对象[12][15] - Cursor等产品以极低市场成本实现高ARR收入,展示中国AI商业化路径优势[12] 二级市场表现 - 美国市场因前期AGI预期过高,当前面临预期调整;中国市场预期正从0开始填平[19][20] - 阿里云宣布增加AI Capex后股价上涨,反映市场对国内AI预期转向乐观[23] - 国内互联网公司从价值股重新获得成长股属性,AI推动估值逻辑变化[24] 产业趋势分析 - 推理芯片领域国内呈现"百卡齐放"局面,寒武纪等公司股价表现亮眼[28] - 专精特新企业通过技术突破和出海确立行业领先地位,如宁德时代[34] - AI推动产业趋势明确,但对中国资产重要性仍低于美国,需关注消费等宏观指标[35] 市场波动特征 - 板块轮动速度加快,信息传播和处理效率提升导致市场共识形成更快[37] - 高波动环境下企业经营策略可能转向蹭热点和讲故事[38] - 从业者对产业判断更精准,如云厂商CXO提前布局光模块投资[44] 投资机会展望 - 模型产业链价值、原生应用发展和垂直行业应用构成三大关注方向[43] - 生物医药、航空航天等非AI领域同样存在结构性机会[43] - 二级市场投资技巧可学习,但全职炒股可能导致认知密度下降[46]
具身智能并不万能,人类的护城河在哪里 | 周末读书
虎嗅APP· 2025-03-29 17:59
具身智能行业现状与趋势 - 金沙江创投朱啸虎近期批量退出人形机器人公司投资 与当前该领域投融资火爆现象形成逆向操作 引发市场对具身智能赛道前景的争议 [1] - 短期视角下具身智能面临商业化落地难题 需等待范式革命突破 长期视角则被普遍看好 可能引发社会全方位变革 [1] - 具身智能被认为是实现AGI(通用人工智能)的关键路径 其潜在影响力远超当前生成式AI 可能彻底重塑人类社会的生产模式和价值体系 [1][5] 技术发展路径与瓶颈 - 人工智能发展存在"离身智能"与"具身智能"两大范式 前者如ChatGPT缺乏物理身体 后者通过身体与环境互动实现进化 [4][5] - 具身智能的核心优势在于通过物理身体获取环境反馈 形成类似人类的感知与常识 当前AI系统因缺乏身体导致泛化能力不足 例如需海量数据训练特定任务 [5][6] - 技术瓶颈体现在意识形成机制 现有AI在情感 直觉和协调性方面甚至不及人类儿童 商业化应用仍面临巨大挑战 [8][9] 行业应用前景 - 制造业 医疗诊断 法律咨询和金融交易等领域将优先实现机器人替代 但情感伦理 创新探索等领域仍将保持人类优势 [9] - 美国农业机械化历史表明 技术替代可能创造新职业形态 而非单纯消灭工作岗位 未来劳动分配方案可能向按需分配演进 [8][9] - 当前人形机器人行业面临客户需求不明确的商业化困境 投资人开始重新评估短期回报预期 [8] 技术发展历史 - 人工智能思想源头可追溯至1950年图灵提出的"机器思考"命题 具身智能概念由其首次系统阐述 [4] - 从离身智能到具身智能的范式演进是AI发展主线 身体介入成为突破现有AI局限性的关键变量 [4][5] - 人类通过数百万年进化形成的身体互动机制 是当前AI难以快速复制的核心壁垒 [6]