AGI(通用人工智能)
搜索文档
消失一年,Kimi杨植麟最新对话:“站在无限的开端”
创业邦· 2025-08-30 11:19
文章核心观点 - 杨植麟将AI研发视为攀登无限雪山的过程 问题不可避免但可解决 技术突破持续拓展知识边界[4][5][9][10][12][13] - Kimi K2模型基于MoE架构 具备开源编程和Agentic能力 被《自然》杂志称为"又一个DeepSeek时刻"[4] - 大模型发展从"缸中之脑"演进为与外部世界交互的系统 Agentic能力成为关键突破点[15][16][43] - 技术发展路径呈现非线性格局 L1-L5能力层级存在并行发展可能[19][20][21][22][23] - Token效率取代计算效率成为新焦点 Muon优化器实现30T token等价60T效果[29][30][32][33] 技术发展路径 - 模型能力从Chatbot经Reasoner、Agent向Innovator、Organizer演进 但层级非严格串行[19][20][23] - Agentic能力突破使模型从封闭思考转向多轮工具使用 实现测试时扩展[16][43][44] - 多智能体系统成为L5级关键特征 可实现任务分工与协作[21][22][53] - 模型自我迭代能力(L4)依赖Agentic能力实现 将参与下一代模型开发[20] Kimi K2技术特性 - 采用MoE架构提升参数规模与token效率[33] - 应用Muon优化器替代Adam优化器 学习效率达2倍提升[29][30] - 通过数据改写策略增强高质量数据利用 解决30T token数据墙限制[32][33] - 专注Base Model与Agentic能力结合 强化泛化性训练[34][35] 研发挑战与突破 - 面临Agent泛化性不足挑战 Benchmark过拟合问题突出[34][35][47] - Muon优化器大规模训练出现max logit爆炸问题 通过clipping技术解决[30][40] - Long Context架构与智商保持存在冲突 需平衡技术方案[51][52][71] - 多模态能力训练需避免损伤文本智商 追求"聪明多模态"[63][71] 行业生态格局 - 开源闭源阵营持续博弈 全球市场将收敛至少数几家[55][57][59] - "一方产品"趋势增强 模型与工具端到端整合提升上限[17][18][62] - 通用Agent与垂直Agent并存发展 长尾工具泛化成关键[44][73][74] - API与一方产品构成主要商业模式 头部公司ARR达数十亿美金[75] 技术演进方向 - Token效率提升成为突破数据墙核心路径[29][33] - 强化学习Scaling效率超越预训练 成为发展重点[28][66] - AI native训练方式加速发展 模型将参与自身训练过程[36][47][72] - 交互方式随模型能力持续演进 新范式逐步形成[64][65] 公司战略定位 - 技术决策决定公司五六成走向 关键bet需提前布局[70] - 研发重心从预训练+SFT转向预训练+RL范式[28] - 长期坚持技术开源分享 推动社区协同发展[55][57] - 动态平衡API服务与一方产品商业模式[75]
OpenAI/微软争夺AGI控制权,重组谈判激烈,年底谈不成软银700亿或撤
36氪· 2025-08-28 15:02
公司重组谈判核心 - OpenAI与微软就重组问题进行胶着谈判 重写合作合同 谈判结果将决定微软30%-35%持股价值及软银100亿美元投资的到账节奏与估值锚点[1] - 谈判聚焦三大核心矛盾:多云合作模式、知识产权归属条款、AGI控制权定义[1] - 年底为关键节点 若重组未完成 软银可能撤回100亿美元投资承诺[2] 公司治理结构限制 - 现行"有限盈利公司"结构限制投资人回报倍数 成为融资障碍[2] - 现有结构不支持直接IPO 使公司在与谷歌和Anthropic竞争时处于资本市场被动地位[3] - 重组目的是让外部投资者真正持有股权 为未来IPO打通道路[2] 微软合作条款矛盾 - 微软投资超过130亿美元换取技术独家合作与优先使用权 合同有效期至2030年[5] - 模型全部独家托管于微软Azure云服务器 限制OpenAI的API扩张弹性和主权合规适配能力[6] - 微软要求开放核心知识产权 即ChatGPT先进模型的训练细节[8] 多云合作博弈 - OpenAI希望引入Google Cloud/AWS等多云服务商[6] - 微软仅考虑极窄豁免 允许服务不在Azure上的政府客户 避免动摇Azure基本盘[6] - 多云落地将使地域与主权合规更灵活 网络路径选择更多 潜在成本竞争加剧[15] 知识产权保护 - OpenAI极力保护训练配方与数据资产的商业机密 避免合作伙伴形成可替代性路径[10] - 最可能妥协方案是从"不透明黑箱"走向"审计式透明" 在保密协议框架下提供必要训练可视化[10] AGI控制权条款 - 现有合同规定 实现AGI后OpenAI有权切断微软对IP的访问[11] - 微软面临千亿美元级权益落地不确定性的风险[11] - 谈判可能将"AGI一刀切断"改造成"重大能力跃迁事件"触发的分级机制[13][22] 潜在妥协方案 - 建立提前通知与第三方评估机制 明确指标与门槛[22] - 设置权限降级和使用范围限制替代立即断供[22] - 实行价格与分成的阶梯式上调机制[22] - 组建联合治理委员会对是否达到门槛进行裁决[22] 行业竞争影响 - 若Azure独占松动 AWS/Google将围绕行业主权云推进差异化竞争[19] - 多云模式将为大单客户提供更多议价筹码[17] - 特定行业(政府/金融/医疗)将更看重可部署位置与合规证据链[16]
AI浪潮录|周志峰:北京AI优势根植于顶尖学府汇聚的科研沃土
贝壳财经· 2025-08-26 16:58
北京AI产业发展现状 - 北京正成为AI大模型战略高地 汇聚前沿技术并孕育突破性成果 [1] - 积极打造全球开源之都 开源生态已深入汽车、机器人等行业 [1] - 顶尖学府汇聚形成科研沃土 清华大学和北京大学位列中国AI科学家机构前二 [29] 启明创投投资策略 - 2021年前瞻布局大模型 早期投资智谱AI和阶跃星辰两家创业公司 [5][19] - 要求团队成为AI超级用户 通过深度体验构建超越市场的判断框架 [5][9][10] - 坚持独立判断原则 对抗FOMO(错失恐惧症)是早期投资最大敌人 [12][13] AI技术发展阶段 - 从技术加速期转向应用加速期 底层能力构建仍是基石 [7][20] - 推理模型突破推动Agent发展 使用成本下降使经济模型可持续 [26] - AGI产业共识为2026-2029年 当70%-80%人类任务有AI参与即达成AGI [27][28] 企业竞争格局 - 基模五强包括字节跳动、阿里云、DeepSeek、智谱AI和阶跃星辰 [19] - 创业公司可寻找单点突破机会 在研发密度上可能超过大厂 [7][23] - 巨头拥有流量/数据/算力优势 但技术范式转移中创业公司仍有机会 [21][24] DeepSeek成功因素 - 技术根基扎实 在内存访问优化和低成本训练方面做到极致 [17] - 开源行为符合全球化合作思潮 获得国际顶尖科技企业实际部署测试 [18] - 精打细算使用算力资源 造就中国大模型企业的创新实践 [17] 投资决策方法论 - 在可接受泡沫范围内坚决投资 认为科技趋势100%存在泡沫 [13][14] - 2020年中开始追踪大模型趋势 2021年发现智谱AI并达成投资 [15] - 投资人需要智力(独立思考)和心力(反共识勇气)双重素质 [11] 应用落地进展 - AI+教育和AI+医疗等行业已实现落地 产品体验出现巨大提升 [28] - 视频模型在电影制作和广告领域发力 避开巨头正面竞争 [22] - 通用Agent存在系统冗余问题 垂类Agent在精度和速度上更具优势 [25]
3年前投中Claude的人,今年又赚了7亿美金
虎嗅· 2025-08-21 16:34
AGI发展时间表与预测 - AGI将于2027年前后抵达临界点 超级智能或将在2030年浮现 [2][8] - 需再提升2至3个数量级算力(100到1000倍)AGI就会出现 [6] - 技术爆炸为指数级跃迁 非线性爬坡 [3] AI基础设施投资规模 - 高盛预计2027年AI相关基础设施总投资突破1.5万亿美元 [16] - 训练接近AGI能力的大型模型需数十万张NVIDIA H100芯片 每张市价3万美元 单一模型硬件投入突破百亿美元 [10] - 拥有10万张高端GPU的训练集群年耗电量相当于中型城市 [11] 能源需求与布局 - AI将成为工业文明中单位耗电量最大的技术 [12] - 微软部署水电直连数据中心 OpenAI洽谈核能合作确保2030年前能源自给 [12] - AI对电力需求无上限 因人类对智能追求永无止境 [13] 供应链与产业链影响 - 液冷系统 光纤交换 数据中心建设等环节催生独立工业支柱 [14] - Equinix、Digital Realty全球抢占土地建设数据中心 CoreWeave等AI云基础设施公司估值达数十亿美元 [15] - 最壮观技术-资本加速度启动 数万亿美元流入GPU 数据中心和电力建设产业 [3] 对冲基金SALP业绩与策略 - 基金规模达15亿美元 半年净收益47% [4][42][51] - 主要持仓包括Broadcom、Intel(期权形式)、Vistra、Constellation Energy等能源与芯片公司 [44] - Q1半数以上收益来自Intel看涨期权 股价飙升40% [45] - 采用delta-neutral投资框架 运用复杂期权对冲降低回撤 [30][52] 投资逻辑与布局特点 - 完全避开消费级AI赛道 锁定AGI底盘产业链 [44] - 重仓Broadcom和Intel 押注供应链结构变化 [46][47] - 布局核能 电力调度与液冷基础设施提供商 [50] - 持有半导体ETF(SMH)Put期权 做空可能被AI取代的传统行业 [48] 行业结构变化与地缘影响 - 美国资本将AI基建锁进本土框架:能源批文锁定十年期 产能合约带地域限制 云算力签排他条款 [60] - 其他经济体面临芯片出口管制 能源与模型云服务成本被推高 [61] - AI发展成为国家级工业部署问题 非单纯科研突破 [17] 技术发展里程碑 - AI智力曲线五年内陡升:从GPT-2写语法正确句子到GPT-4解答数学题通过律师考试 [5] - AGI发展分为五个等级:从对话机器人到能完成组织工作的AI [32] - 第一台AGI出现后 AI将自行建造更好AI 一年压缩人类百年科技发展 [9]
喝点VC|a16z对话OpenAI研究员:GPT-5的官方解析,高质量使用场景将取代基准测试成为AGI真正衡量标准
Z Potentials· 2025-08-21 11:09
GPT-5技术能力提升 - 模型在推理、编程和创意写作方面实现质的飞跃,前端开发能力相比GPT-3达到完全不同的层次[6][9][12] - 通过优化数据集设计和奖励模型,显著提升编程能力,被描述为"市面上最强的编程模型"[11][12] - 创意写作能力显著增强,能够生成细腻动人的文本,例如悼词等难以撰写的内容[29] - 通过中期训练(mid-training)更新知识截止时间并扩展模型智能,弥补预训练和后期训练之间的空白[45] 行为设计与幻觉控制 - 针对GPT-4存在的"逢迎"问题,团队重新设计行为目标,追求健康、有帮助的互动感[13] - 幻觉和欺骗问题得到显著收敛,通过引导模型逐步思考而非快速回答来减少错误[14] - 优化多奖励目标的权衡,确保模型既有帮助性又避免过度互动[13] 智能体与工作流变革 - 智能体定义为能异步完成真实任务的助手,核心能力包括深度研究、文档编辑和跨服务数据整合[36] - 未来方向包括长时间运行任务(如耗时数小时或数天的项目)和端到端流程自动化[35] - 当前限制在于缺乏高质量计算机使用数据,需通过自举(bootstrap)方式生成训练数据[43][44] - 用户对异步任务接受度提高,愿意为高质量结果等待(如深度研究任务等待5分钟)[37][38] 评估标准与开发方法论 - 基准测试价值趋近饱和(如指令跟随分数从98提升至99),未来标准转向真实使用场景和新用例解锁[21][22] - 开发方法从目标能力反推,针对具体场景(如幻灯片制作、电子表格编辑)设计内部评测[6][22] - 通用能力优先于垂直领域,因智能提升会同时改善多项功能(如指令理解、工具使用)[24][25] 行业影响与机会 - 非技术背景用户可通过"vibe coding"快速构建完整应用,几分钟完成过去需一周的工作[6][17] - 定价策略降低使用门槛,预计催生大量独立开发者和创业公司[15][17] - 多模态能力(如计算机视觉理解网页截图)和工具集成(浏览器+终端)为自动化奠定基础[28][42] 公司文化与使命 - 研究团队保持小规模灵活结构(如深度研究团队仅2人),强调主动性和跨部门协作[54] - 使命是推动AGI落地并通过免费提供最强模型实现技术普及[58] - 数据质量被视为当前能力跃升的关键因素,优于架构或规模改进[26][27]
Manus对话实录:探索AI Agent支付新领域,年度化收入逼近1亿美元
搜狐财经· 2025-08-21 08:54
公司经营数据 - 公司年度化经常性收入达到9000万美元 即将突破1亿美元 [1] - 收入计算方式为当月收入乘以12 不等同于现金收入 [1] - 年付选项收入属于预存款性质 实际营业收入数字更为可观 [1] 通用AI Agent技术定位 - 真正Agent应具备环境感知能力 是应用型AI的子集 [3] - 公司Agent可部署于虚拟机及互联网环境 通过观察和行动改变环境 [3] - Agent代表用户与环境交互 与AGI存在本质区别 AGI利用模型通用能力无需特别设计 [3] 行业应用实践 - 公司从Agent编程应用获得灵感 非工程师用户使用AI工具进行数据可视化和写作 [4] - 当前AI模型存在环境交互障碍 包括缺乏API接口和验证码等问题 [4] - 房产中介使用公司产品分析客户需求并生成推荐 [5] - 研究人员采用公司产品进行深度研究并生成正式报告 [5] 行业发展前景 - 行业尚未出现iPhone式革命性时刻 但生态系统正在协同进化 [4] - 基础设施层面持续发力 预示未来将取得重大突破 [4]
首个国产“手机智能体”问世,智谱补位Manus
观察者网· 2025-08-21 08:51
(文/陈济深 编辑/张广凯) 8月20日,智谱在iOS安卓,PC三端同步推出AutoGLM 2.0,并首次面向公众全面开放,无需邀请码即可使用。 作为一款纯国产智能体,AutoGLM的发布也给了中国用户一个在Manus退出中国后可以合规便利体验智能体的选择。 不同于Manus等网页端原生的智能体产品,智谱AutoGLM 2.0作为全球首个手机通用Agent,被定位为"执行型助手"。相比目前主流AI产品和智能体助手多停 留在"对话"层面,只能实现信息查询和整理回答,AutoGLM则实现了质的飞跃——它不再只是"说",而是真正能够"做"。 3月AutoGLM1.0发布时,AI尽管也可以操作手机,但是在AI做事期间人不能切屏,不能打断,只能看着干瞪眼。本次AutoGLM2.0则给每个用户预制了一台 虚拟手机和电脑,直接解决了AI和人抢屏幕的操作痛点,让AI从只能在人眼皮子底下干活变成了"你干你的,我干我的"的异步处理模式。 在实际测试中,尽管部分功能的执行效率和优化程度依然有待提升,但目前AutoGLM已经可以较好地执行包括购物、订餐、买机票、自动写文案等大众场 景,智能体不再是极客们的工具,开始步入了更加大众的群 ...
OpenAI掌门人曝GPT-6瓶颈,回答黄仁勋提问,几乎为算力“抵押未来”
36氪· 2025-08-16 12:04
AI技术发展瓶颈 - 随着算力和数据规模快速扩展,算法重要性再次凸显,成为未来AI技术发展的关键瓶颈 [1] - 强化学习成为算法研究新方向之一,但仍存在许多明显能力缺口 [1] - 基础研究正在回归,算法取代数据和算力成为关键制约因素 [21][22] 工程与科研的协同关系 - 工程与科研是驱动AI发展的两大引擎,工程师贡献与研究人员相仿甚至更大 [3][4] - OpenAI坚持工程与研究同等重要,两者需紧密合作解决复杂问题 [5][6] - 工程背景与科研背景人员对系统约束的理解存在根本性差异,需技术谦逊来调和 [6][7] 资源调配与产品化挑战 - 为支撑ChatGPT和ImageGen的海量需求,公司不得不抽调科研算力"抵押未来" [8][9] - 产品上线导致系统崩溃风险增加,需在资源协调中做出取舍 [8][9] - 公司理念是优先满足用户体验,推动技术快速落地 [10] AI编程范式演进 - "氛围编程"正从趣味应用向严肃软件工程转型,可改造遗留代码库 [11][12] - 未来代码库需模块化设计,通过高质量测试让模型填充细节 [13] - 软件工程需回归可维护性实践,最大化模型价值 [13] 训练系统与基础设施 - 长时间训练任务需优化检查点设计,强化学习系统状态保存更复杂 [14][15] - AGI开发需同步建设超级计算机,涉及大规模基础设施投资 [18][19] - 未来AI基础设施需兼顾计算密集型与低延迟两类需求 [16][17] 行业发展趋势 - 多样化模型库正在成形,经济系统将逐步由AI驱动 [24][25] - 特定领域Agent开发需大量定制工作,创造新商业机会 [24][27] - 医疗、教育等垂直领域需专业知识和责任框架 [26]
商汤林达华:破解图文交错思维链技术,商汤的“两步走”路径
36氪· 2025-08-15 17:09
多模态智能技术路径 - 多模态是通向AGI的必经之路 因语言仅是智能的产物而非本源 需通过多模态感知和处理信息实现通用性[4] - 智能演进需经历四次破壁:长序列建模、多模态理解、多模态推理、数字与物理空间交互[5] - 公司2023年初推出国内最早多模态模型 2024年突破原生多模态融合技术 2025年实现图文交错思维链[5] 原生多模态技术优势 - 适应训练通过微调实现模态对齐 成本低但仅僵硬遵循范例模式[7] - 原生训练在预训练阶段融合多模态数据 从根源具备多模态能力[7] - 公司2024年确定融合路径:预训练中段开始多模态融合 形成统一模型且不再生产单独语言模型[7] 技术成果与性能表现 - 2024年Q3完成融合训练数据配方验证 Q4完成千亿参数级别多模态模型训练[8] - 模型在OpenCompass和SuperCLUE评测中位居国内首位 语言任务与DeepSeek V3并列[8] - 日日新6.5仅有多模态模型 无单独语言模型 与国内其他厂商架构存在显著差异[9] 图文交错思维链突破 - 主流多模态模型推理链仍为纯文本 通过图像转文本描述再进行语言推理[9] - 公司通过图像编辑工具构建图文交错思维链 实现逻辑思维与形象思维结合[10] - 采用两步走路径:先通过工具构建对外智能体 再通过多模态理解实现内生混合思考[10] 模型架构效率优化 - 视觉编码器专注连续信号感知 语言模型主干处理离散语义 需差异化结构与学习方式[11] - 架构更新后处理高分辨率大图和长视频更快捷 数据优化使同性能下效率提升超3倍[11] - 性能成本曲线显著优化 实现比Gemini 2.5系列更优的效费比[11] 具身智能与世界模型 - 世界模型通过虚拟系统模拟现实交互 提供近真实反馈且效率远高于真实环境[12] - 开悟世界模型基于多模态能力构建 用智能汽车业务数据增强模拟生成能力[12] - 可根据指定路径生成多视角视频 有效支撑智能驾驶系统训练[12] 商业战略与落地成果 - 采用"基础设施-模型-应用"三位一体战略 形成技术与商业正向循环[13] - 基础技术实现原生融合训练/多模态强化学习/无限时长视频交互记忆等突破[14] - 生产力AI装机量从百万级走向千万级 交互AI落地新型硬件与机器人[14]
GPT-5最大市场在印度?Altman最新访谈:可以聊婚姻家庭,但回答不了GPT-5为何不及预期
AI前线· 2025-08-15 14:57
GPT-5发布与市场反响 - OpenAI于2025年8月8日正式发布新一代大语言模型GPT-5 引发全球科技领域高度关注 [2] - 部分个人用户反馈使用体验不佳 包括反应速度变慢 回答篇幅缩短 基本问题错误率上升 甚至导致部分付费用户取消订阅 [2][3] - 企业级市场对GPT-5接受度显著更高 在发布后7天内 Cursor、Vercel和Factory等科技创业公司已将其设为关键产品的默认模型 [4] - 企业反馈GPT-5相比前代模型展现出三大优势:部署效率提升明显、复杂任务处理能力增强、总体使用成本大幅度降低 [4] - 云存储巨头Box正在对GPT-5进行深度测试 重点评估其在逻辑密集型长文档处理方面的表现 并计划在年底前将其整合至企业级文档处理解决方案中 [5] GPT-5技术特性与优势 - OpenAI CEO Sam Altman将GPT-5描述为一次技术飞跃 强调其流畅性和适应性智能远超以往模型 用户无需在不同模型间切换选择 [8] - GPT-5被定位为集成模型 能够执行从零开发软件、撰写复杂主题研究报告、策划活动等多样化任务 [8][9] - 模型在稳健性和可靠性方面有显著提升 对自主性工作流程非常有帮助 能处理的任务长度和复杂度令人印象深刻 [10] - 在印度市场 GPT-5成为OpenAI全球第二大市场 很可能成为第一 公司采纳了大量当地用户反馈 包括更好的语言支持和更实惠的价格 [11] - GPT-5在快速创建小型软件方面表现出色 比以往任何模型都更高效 能帮助用户解决生活中的小问题 [16] AI行业发展趋势与机遇 - 当前被视为有史以来最令人兴奋的职业起点阶段 工具能力的提升使个人将想法落地所需的时间、人力和经验大大减少 [13] - AI在科学领域的应用前景广阔 个人能发现的科学成果、速度和规模将是前所未有的 同时将彻底改变编程方式 [14] - 初创企业能够以非常小的团队完成大量工作 限制几乎只来自想法的质量和创造力 这些工具会帮助实现 [15] - 学习如何使用人工智能工具被视为最重要、最具体的硬技能 真正擅长使用这些工具的人与不具备这种能力的人差距非常大 [15] - 机器人领域在未来几年会变得极其重要 最有AGI感的时刻之一可能是在街上看到机器人像人一样走过 做一些日常任务 [41] 商业模式与竞争格局 - AI被视为一种通用技术 类似于晶体管 不会有一家公司能占到全球GDP的一半 价值将以分散的方式被捕获 [29] - 在AI模型之上构建业务时 如果业务能随着模型进步而变得更好 则会持续向好 否则可能面临被淘汰的风险 [33] - 与客户建立深度关系的公司更具长期价值 例如Cursor最近流行度爆发式增长 并与客户建立了非常牢固的关系 [34] - 拥有客户接口的服务公司比产品公司更能加深客户关系 因为服务会重复发生 有机会在交易中加入个人品味 [35] - 在一个充斥着无限AI内容的世界里 真实的人的价值会提高 人们非常在意对方是不是真人 这深植于我们的生物本能 [37][39] 技术局限性与未来方向 - GPT-5在知识、模式识别和短期记忆等方面已达到超人类水平 但在确定要提出哪些问题或长时间坚持研究一个问题方面还远未达到人类水平 [41] - 模型思考跨度从几分钟提升到了一个半小时 但要证明一个新的、重要的数学定理可能需要一千个小时 目前还无法做到 [41] - 现有电脑形态并不适合AI伙伴愿景 未来的形态可能是眼镜、可穿戴设备、放在桌上的小装置等 环境感知型硬件可能会很重要 [44] - 公司会尝试多种产品 打造AI可以寄居的硬件形态 这将是重要方向之一 [45] - 能够想出逆向且正确的创意的能力价值会随时间提升 擅长做模型做不到的事情会越来越有价值 [35]