Workflow
Artificial General Intelligence (AGI)
icon
搜索文档
独家|陈天桥布局端到端Deep Research生态赛道,MiroMind发布全栈开源深度研究项目ODR
Z Potentials· 2025-08-09 12:50
公司概况 - 专注于构建具有自主意识的数字Agent,目标是为全人类实现安全可控的AGI,核心理念是AGI为持续迭代的动态系统而非固化模型 [2] - 愿景成为人工智能创新领域的全球领军者,聚焦基础模型及下一代智能关键技术的前沿探索,强调长期主义、开发者友好和系统开放理念 [2] - 由前中国首富陈天桥创办,其曾创立盛大网络并保持中国最年轻内地首富纪录(31岁),近年All in AI+脑科学领域,孵化多家AI创业公司并捐赠5000万元成立复旦天桥人工智能研究院 [4] 技术架构与性能 - 全栈开源生态系统:包含Agent框架(MiroFlow)、模型(MiroThinker)、数据(MiroVerse)和训练基础设施(MiroTrain/MiroRL),所有组件开放共享 [1][8] - SOTA级性能:MiroFlow搭配商用模型API在GAIA验证集得分82.4,超越现有商用API;搭配开源MiroThinker模型在GAIA-Text-103数据集达60.2%性能,接近OpenAI Deep Research水平 [1][15] - 可复现性:MiroFlow框架代码和配置开源,第三方可复现GAIA验证集82.4的高性能表现 [13] 核心团队与技术背景 - 清华电子工程系副教授代季峰领衔,其研究成果包括可变形卷积Deformable ConvNets(PyTorch标准算子)、BEVFormer(自动驾驶多相机感知里程碑)、UniAD(CVPR 2023最佳论文)等 [5][6] - 代季峰开发的InternVL多模态基础模型Hugging Face下载量超1000万次,论文总引用6万余次 [6] 开发者生态 - 提供147k开源训练数据(MiroVerse),按月更新并响应社区反馈 [12] - 社区活动包括竞赛、排行榜、Hackathons,开发者可直接影响项目发展 [1][22] - 支持数据需求提报、功能定制与技术挑战,覆盖数据工程师、AI研究员等多角色参与 [22] 行业定位与竞品对比 - 对标OpenAI Deep Research概念,构建开源协作的深度研究生态系统(Agent框架+模型+数据+训练设施) [7] - 在GAIA性能表现上显著领先竞品:MiroMind ODR得分82.4,远超OpenAI Deep Research(67.4)、Manus(73.3)等 [10]
GPT-5:让每个人都成为超级个体|AI产品榜
36氪· 2025-08-08 21:34
全球AI网站访问量排名 - ChatGPT以59.1亿月访问量位列全球第五大网站,距离第四名Instagram仅差6.6亿访问量,按当前6.03%的增速预计将在9月超越Instagram [7][8] - 全球前五大网站依次为:Google(27年)、YouTube(20年)、Facebook(21年)、Instagram(15年)、ChatGPT(3年)[7] - 全球TOP100 AI产品月访问总量达126.89亿,其中国产产品占比10%(13.34亿),国产产品数量占比25%(25个)[23] ChatGPT发展态势 - GPT-5新功能显著提升用户粘性:邮件/日历链接功能使ChatGPT可管理用户日程,预计用户粘性将提升5倍 [14][15] - GPT-5编程能力降低开发门槛,预计将推动ChatGPT访问量增长,有望超越Facebook(当前差距1倍)[11][12] - ChatGPT 7月访问量增速6.03%,主要竞争对手Gemini增速7.88%,Claude增速10.47% [24][47] AI细分领域表现 - 代码辅助类产品增长迅猛,全球TOP100中占10个席位,仅次于聊天机器人 [10][37] - 图片生成领域:SeaArt增速24.28%领先,Midjourney保持15.82%增长 [53][54] - 视频生成领域:Creati增速达4612.21%位列第一,Sora访问量50.99M但增速-2% [57][58] - 国内增速最快产品:扣子空间(56.31%)、魔搭社区(37.98%)、扣子(27.9%)[42][43] 国内AI产品表现 - 国内总榜前三:DeepSeek(3.45亿)、纳米AI搜索(3.32亿)、纳米AI(1.97亿)[28] - 出海表现最佳产品:SeaArt(2822万)、Manus(1807万)、Fotor(1688万)[32][33] - 国内云服务商:阿里云(3061万+16.05%)、腾讯云(2050万+4.93%)、火山引擎(541万+2.03%)[65] 行业趋势 - AI产品榜覆盖10000+产品,跟踪100+细分领域,已成为行业数据基准 [75] - 代码辅助工具面临GPT-5冲击,预计部分产品将被淘汰 [38] - 全球AI应用MAU排名:ChatGPT(4亿)、豆包(8191万)、DeepSeek(6181万)[74]
The Intelligence Toll: Why Every Fortune 500 Company Could Pay Nvidia by 2035
The Motley Fool· 2025-08-08 19:15
核心观点 - 如果通用人工智能(AGI)在2030年前实现,英伟达将从芯片供应商转变为全球智能基础设施的收费平台,其商业模式将发生根本性转变 [1][2] - 公司当前40倍前瞻市盈率的估值在传统半导体框架下显得昂贵,但在AGI场景下可能被低估 [1] - 公司可能通过收取"智能通行费"的方式,从每个自主决策、模拟实验和跨行业AI代理中获取持续收入 [2] 财务预测 - 2025财年收入达到1305亿美元,较前一年翻倍 [4] - 华尔街预计2027财年收入将达2540亿美元 [4] - 假设2027-2035年复合增长率19%,2035年收入可能达到1万亿美元 [5] - 按45%净利率和20倍市盈率计算,市值可能达到9万亿美元,对应股价369美元(较当前翻倍) [5] - 乐观情景下若占据5万亿美元AGI计算市场的50%,股价可能达615美元 [6] 行业趋势 - 微软已承诺投入1000亿美元建设AI数据中心 [7] - 沙特、阿联酋和日本合计承诺900亿美元主权计算投资 [7] - OpenAI每年在英伟达硬件上支出70亿美元 [7] - Salesforce报告已有8000多家客户使用其AI代理 [9] - 制药行业可能通过AGI模拟所有可能的药物相互作用 [9] 竞争壁垒 - CUDA生态系统经过15年建设,拥有200万开发者 [10] - 迁移出CUDA生态需要承担数亿美元成本(如GPT-4级别模型需1亿美元重训费用) [10] - 即使拥有自研芯片的科技巨头(如Alphabet、特斯拉)仍采购英伟达GPU [11] - 主要AGI研发机构(OpenAI、Anthropic、xAI)均采用英伟达技术栈 [11] - 在AI推理领域面临AMD和云巨头的竞争压力 [12] 商业模式演变 - 从GPU销售转向成为"智能基础设施计费系统" [2] - 未来可能按计算周期收费的"智能通行费"模式 [2] - 当前业务仍以AI训练GPU为主,尚未充分定价AGI带来的需求爆发 [8][9] - 公司正在铺设AGI时代的基础设施轨道 [13]
GPT-5没有追求AGI,它代表的是OpenAI的商业化野心
36氪· 2025-08-08 18:28
模型性能对比 - GPT-5在AIME '25测试中达到94.6%准确率,领先Gemini 2.5 Pro的93.8%和Claude 4.1的94.1% [1] - FrontierMath测试中GPT-5表现26.3%,略低于Gemini 2.5 Pro的27.1% [1] - GPQA diamond测试GPT-5获得85.7%准确率,与Claude 4.1的85.9%接近 [1] - HMMT 2025测试GPT-5以93.3%领先其他模型 [1] 技术突破 - GPT-5采用新型合成数据训练方法,通过GPT-4o等前代模型生成高质量训练数据 [3] - 合成数据流程专门设计用于生成"正确类型数据",提升模型推理和规划能力 [3] - 在Tau²-bench电信领域测试中达到96.7%准确率,显著优于GPT-4.1的34% [7] - 上下文长度扩展至400k,思考过程token消耗减少50%-80% [20] Agent能力提升 - GPT-5优化了工具调用能力,支持自然语言描述触发工具使用 [8] - 具备出色的工具并行使用能力,可判断工具运行顺序与并行性 [8] - 在智能体式编码测试中表现优异,一次性解决其他模型无法完成的任务 [15] - 编程时采用"边想边做"的迭代方式,优于Claude 4 Opus的"想清楚再做"模式 [15] 商业化策略 - ChatGPT周活用户超过7亿,付费用户达500万,订阅收入27亿美元 [18] - API定价策略激进,输入1.25美元/百万tokens,输出10美元/百万tokens [18] - 价格直接对标Gemini 2.5 Pro,大幅低于Claude 4 Opus的75美元/百万tokens输出 [19] - 推出DeepResearch、Canvas编辑、生图功能等商业化导向的产品升级 [18] 行业趋势 - 2025年AI应用领域最热关键词为Agent,OpenAI引领此波热潮 [6] - 主流模型厂商均以Agentic AI为目标优化模型能力 [6] - 大语言模型进步呈现渐进式而非跨越式,可能遭遇技术瓶颈 [21] - AI应用市场呈现快鱼吃慢鱼特征,大厂在创新速度上不占优势 [21]
GPT-5 之后,我们离 AGI 更近了,还是更远了?
36氪· 2025-08-08 15:10
2023 年 3 月 15 日,GPT-4 发布。当时大部分人还在搞清楚 ChatGPT 到底怎么用、官网地址在哪里,而我也只是浅尝辄止地试了试 GPT-3.5 的效果,玩了 玩 ChatBox,问了一些无聊的问题就不知道问什么了。 所以,至今仍清晰地记得,第一次与 GPT-4 认真对话后的那种感觉,脑子里盘旋的只有一个念头:天变了。 然而,当大幕拉开,我们看到的,却是一场远比想象中更复杂、更矛盾、不可言说、不知从何说起的演出。就像今年 OpenAI 的常态:普通用户赞不绝 口、DAU 日益暴增;而硬核用户骂声遍天,我自己其实也早就经历了从 GPT 到 Claude 和 Gemini 的几次主力模型的更迭,很久不用 ChatGPT 了。而从去 年 GPT-4o 那场惊艳的春季发布会之后,每次 OpenAI 的发布会都令人五味杂陈,炒作大于惊喜。 发布会伊始,Sam Altman 的定调就充满了实用主义色彩:"GPT-3 像高中生,GPT-4o 像大学生,而 GPT-5,就像一个随需应变的博士级专家团队。" 关 键词不再是"聊天",而是"做事"。 而实现这一点的核心,并非简单地堆砌参数,而是一次架构上的哲学革命 ...
GPT-5 之后,我们离 AGI 更近了,还是更远了?
AI科技大本营· 2025-08-08 13:58
GPT-5发布背景 - GPT-4发布于2023年3月15日 引发行业震动 但仅是AI技术爆发的序章[1][2][3] - GPT-5于2025年8月8日发布 距离GPT-4发布间隔939天 行业期待值极高但实际反响复杂[4] - 发布会基调从"聊天"转向"做事" 强调实用主义 定位为"随需应变的博士级专家团队"[6] 技术架构创新 - 采用统一智能系统架构 包含快速模型(gpt-5-main)和深度推理模型(gpt-5-thinking) 通过实时路由器动态调度[7] - 提供三种API模型规格(常规/迷你/纳米)和四种推理级别(最小/低/中/高) 输入限制272k token 输出限制128k token[7][9] - 淘汰旧有"模型动物园"模式 建立统一协同的智能有机体[9] 性能表现 - 基准测试成绩突出:AIME 2025数学测试94.6% SWE-Bench编程测试74.9% MMMU多模态理解84.2%[16] - 发布会现场出现数据可视化错误 69.1%柱状图比52.8%更短 引发质疑[13] - 马斯克宣称Grok 4在ARC-AGI-2测试中击败GPT-5[15] 核心能力聚焦 - 专注三大核心场景:编程/写作/健康咨询 其他多模态功能(音频/图像)暂不整合[19][28] - 编程能力显著提升 可完成生产级代码修改 在复杂项目中表现优于Gemini 2.5 Pro和Claude 4 Opus[21] - 写作能力存在争议 不及情感特化的GPT-4.5 但Sam Altman宣称已有显著改进[24][25][27] 商业策略 - API定价极具侵略性:每百万输入Token仅1.25美元 较GPT-4o降价50%[21] - 对比此前失败的GPT-4.5(原价180美元/百万输出)形成强烈反差[22] - 采取以利润换市场策略 意图快速建立开发者生态[21] 技术挑战 - 模型幻觉问题持续改进 通过"安全完成"训练方法和诚实应答机制降低错误率[28][30] - 提示注入攻击防御能力达56.8% 但仍有较大改进空间[32][34] - 行业观点认为Transformer架构可能已达瓶颈 需要新的架构突破实现AGI[36] 行业影响 - 标志AI发展进入"工业时代" 从探索期转向专业化应用阶段[37] - 对开发者形成利好 提供更可靠的生产力工具[38] - 普通用户DAU持续增长 但专业用户评价分化[4][35]
SuperX Launches New All-in-One Multi-Model Server Series, Redefining Enterprise AI Productivity
Prnewswire· 2025-08-07 18:30
核心观点 - SuperX推出全新All-in-One Multi-Model Servers(MMS),预装OpenAI最新高性能大语言模型GPT-OSS-120B和GPT-OSS-20B,为企业提供开箱即用的全栈AI解决方案 [1][2][3] - MMS采用多模型融合架构,支持推理模型、通用模型、语音合成/识别模型等多种模型,实现与终端应用场景的深度融合 [5][7] - 该解决方案旨在解决企业AI部署中的数据隐私、部署复杂性和操作可扩展性等关键障碍,提供高效、安全、可靠的企业级生成式AI平台 [4][8] 产品特点 - **预装高性能模型**:MMS预装OpenAI最新开源模型GPT-OSS-120B和GPT-OSS-20B,在MMLU和AIME等关键测试中性能超越部分领先闭源模型 [3] - **多模型融合**:支持多种模型的预配置、调用、加速、管理和迭代,包括文本到图像模型、语音合成/识别模型等 [5] - **企业级功能**:内置门户助手和知识库系统,支持60多种预配置场景化智能代理(如公文起草、法律咨询、政策比较) [7] 技术优势 - **认知跃升**:多智能体协作支持更复杂的业务应用场景,例如通过文本描述直接定位视频片段 [7] - **知识赋能**:实现“所想即所得”的闭环业务流程 [7] - **云协同模型缓存**:通过本地和云端模型仓库的联动,用户可即时体验全球最新模型 [7] - **全栈集成**:从芯片到模型服务的统一平台,用户无需关注底层技术栈 [7] 企业应用 - **数据安全**:基于NVIDIA Blackwell平台的机密计算技术,提供可信执行环境(TEE),保护AI知识产权和模型安全 [10] - **高效部署**:全栈软硬件集成,可在几分钟内完成部署,无需额外基础设施或IT资源 [10] - **工作流效率**:提供预配置模板和操作指南,支持无代码或低代码界面快速构建智能代理 [10] 产品系列与定价 - **AI工作站系列**:AI Workstation Ultra(25万美元)适合企业级专业用途,AI Workstation Standard(5万美元)适合企业级个人使用 [9] - **AI服务器系列**:B200标准版(50万美元)适合中型企业,集群版(400万美元起)适合所有应用场景 [9][11] 行业影响 - SuperX通过MMS推动大模型应用向多模型智能体协作的新时代迈进,标志着AI基础设施产品的进一步扩展 [2] - 公司CTO强调多模型协作是AI向通用人工智能(AGI)演进的关键步骤,旨在构建与企业和AI开发者合作的生态系统 [8]
GPT-5难产内幕曝光,核心团队遭挖空,推理魔咒难破,靠英伟达续命
36氪· 2025-08-04 09:29
GPT-5研发内幕 - GPT-5未取得技术突破 不存在GPT-3到GPT-4级别的跃升 [1][8] - 面临严重数据瓶颈和技术难题 高质量网络数据日益枯竭 [1][7] - Orion项目失败 原计划作为GPT-5推出 最终降级为GPT-4.5 [5][6] - 推理模型成为新突破口 Q*技术能解决前所未见的数学问题 [16] - 内部测试显示新模型在更多算力下表现惊人 但转化为聊天版本后性能下降 [8][20] 公司融资情况 - 获得83亿美元融资 估值达3000亿美元 [3] - 本轮融资由Dragoneer投资集团以28亿美元领投 [4] - 软银牵头整个400亿美元融资计划 [4] - 融资将支持未来三年半烧掉450亿美元的计划 [10] 技术进展 - GPT-5编程和数学能力显著提升 驱动AI智能体优于前代 [10] - 开发"通用验证器" 可自动化确保模型产生高质量答案 [24] - 强化学习系统被认为具备通往AGI的潜力 [26] - o3模型理解科学知识能力大幅提升 受益于更多英伟达芯片和网络搜索能力 [19] 公司内部状况 - 核心研究者被Meta挖走 导致组织架构混乱 [1][12] - 研究副总裁公开抱怨团队变动问题 [14] - 与微软合作存在分歧 部分高级研究者抵触将成果交给微软 [12] - 公司决定回归GPT命名体系 因o系列模型造成用户困惑 [23] 未来发展 - 高管相信现有架构可达到GPT-8水平 [11] - CEO认为有望利用现有技术创造AGI [11] - GPT-5在不消耗更多算力情况下能生成更高质量代码和文本 [11] - 模型学会精准判断不同任务所需计算资源量 [11]
Meta stock surges after Q2 results blow past expectations despite heavy AI spending
TechXplore· 2025-07-31 16:20
财务表现 - 公司第二季度营收达4752亿美元 同比增长22% 超出分析师预期的4481亿美元 [6] - 净利润1834亿美元 每股收益714美元 同比分别增长36%和38% 远超市场预期的588美元每股 [6] - 广告收入增长和用户基础扩大是业绩超预期的主要驱动力 [4] 用户数据 - 旗下应用(包括Facebook Messenger WhatsApp Instagram Threads)日活跃用户达348亿 同比增长6% [6] - 员工总数增至75945人 同比增加7% [10] AI战略布局 - 计划2025年投入1140-1180亿美元用于AI基础设施和人才招募 同比增幅达20-24% [7] - 斥资143亿美元收购AI公司Scale并吸纳其CEO加入超级智能研发团队 [9] - 与核能企业签订20年供电协议以满足AI算力需求 [9] - CEO提出"个人超级智能"概念 认为AI眼镜将成为主要载体 区别于行业其他公司的中心化AGI路径 [8][9] 市场反应 - 盘后股价飙升118%至77708美元 创历史新高 [10] - 分析师认为AI投入正在帮助公司对冲反垄断案和社交媒体行业变动的风险 [5] 监管风险 - 面临可能强制拆分WhatsApp和Instagram的反垄断诉讼 目前等待法官裁决 [5]
Microsoft nears OpenAI agreement for ongoing tech access
TechXplore· 2025-07-30 19:39
微软与OpenAI合作协议谈判 - 微软正与OpenAI进行深入谈判 旨在获得持续使用其关键技术的权利 这将消除OpenAI转型为营利性企业的主要障碍 [1] - 新协议条款将允许微软使用OpenAI最新模型及其他技术 即使OpenAI实现人工通用智能(AGI)目标 现行合约规定微软在AGI实现后将失去部分技术使用权 [2] - 谈判已持续数月 双方高管近期在爱达荷州太阳谷会议上讨论重组事宜 最终协议可能在未来数周内达成 [3][4] 合作历史与现状 - 微软已向OpenAI投资约137.5亿美元 并获得知识产权使用权 是ChatGPT制造商的最大投资者 [4] - 合作关系始于微软为OpenAI建造超级计算机 用于开发ChatGPT背后的语言模型 作为交换获得技术整合权 [6] - 2023年11月OpenAI董事会解雇并重新聘用Altman事件 动摇了微软对合作伙伴的信心 [6] 谈判核心争议点 - 微软希望避免在2030年现有合约到期前突然失去技术使用权 [5] - OpenAI希望调整与微软的收入分成比例 并修改知识产权使用条款 [10] - 双方就微软在新公司中的持股比例进行协商 讨论区间为30%-35% [21] AGI相关条款 - 现行合约规定OpenAI实现AGI后 微软将失去部分技术使用权 AGI被定义为"在经济价值最高的工作上超越人类的自主系统" [2][15] - OpenAI董事会拥有技术层面AGI认定的决定权 达到后微软将无法使用此后开发的技术 [16] - 商业里程碑触发条件为OpenAI为投资者创造约1000亿美元总利润 届时微软将失去所有技术使用权 [17] 其他商业考量 - OpenAI寻求降低对微软的依赖 已获准与其他公司合作建设数据中心和AI基础设施 [8] - 公司计划改变非营利结构 以获取更多资金建设下一代AI模型所需的数据中心 [9] - 软银集团承诺投资数百亿美元 但若重组未能在年底完成可能减少投资额 [9] 近期商业动态 - 微软放弃部分与OpenAI收购io相关的知识产权 该交易价值65亿美元 [19] - OpenAI收购AI编程初创公司Windsurf的交易失败 部分原因是与微软的紧张关系 后者最终被谷歌以24亿美元收购 [20]