AGI(通用人工智能)

搜索文档
3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学
量子位· 2025-08-08 15:23
训练能力突飞猛进,验证答案的本事却成了拖后腿的短板。 当大模型把人类曾经的终极考题变成日常练习,AI的奔跑却悄悄瘸了腿—— 为此,上海AI Lab和澳门大学联合发布 通用答案验证模型CompassVerifier与评测集VerifierBench 。填补了Verifier领域没有建立 验证-> 提升->验证 的循环迭代体系的空白。 CompassVerifier团队 投稿 量子位 | 公众号 QbitAI △ 图片来自Openai前研究员Jason W ei,高难度数据集正在迅速被模型们"吞噬殆尽" 让AI在下半场中终于能迈开训练与验证的两条腿往前冲。 AI的下半场应该两条腿跑步 随着OpenAI o系列,DeepSeek R1以及马斯克新发的Grok-4等模型慢慢让"人类最后的考试"变成 "大模型的上一次考试",RL在推理模型上 的胜利貌似为AGI的道路添加了一块厚厚的基石。 强推理模型在人类顶级水平竞赛上大杀四方,屡次超过人类顶级专家的现在,我们不禁要思考,AI的上半场是不是已经结束了,下半场的游戏 又将如何开始。 最近,来自 清华姚班的姚顺雨 提出了他对AI下半场的思考: 那么接下来会发生什么?人工智能 ...
【对谈"硅谷精神之父"凯文凯利】问了凯文·凯利17个问题,我终于悟了!
老徐抓AI趋势· 2025-08-07 09:05
教育 - AI时代下未来工作岗位可能尚未出现 难以用现有职业规划孩子未来发展方向 [6] - 培养底层能力比知识积累更重要 包括好奇心 批判性思维 自驱力和学习能力 [6] - 差异化竞争是关键 成为"唯一"比成为"第一"更具抗AI替代性 [7] 人工智能 - AGI实现难度极高 几十年内难以达成 AI将长期保持专业领域分工形态 [8] - 现有技术架构存在瓶颈 投入成本与收益呈递减关系 从1亿刀到100亿刀突破有限 [9] - AlphaEvolve仅优化特定算法 无法全领域突破 AI本质是工具而非主宰 [11] 医疗健康 - 药物研发最大瓶颈在于临床实验流程 而非药物发现环节 AI难以短期内改变现状 [11] - 基因编辑和脑机接口将率先被富人采用 但技术成熟后普及速度极快 [12] - 科技普惠性特征明显 历史表明高端技术最终会降低使用门槛 如大哥大到智能手机 [13] 自动驾驶与机器人 - 技术落地进度慢于预期 马斯克等企业家的乐观预测常与现实存在偏差 [17] - 需持续观察技术拐点 盲目All-in风险高 动态调整策略更有效 [17] 中国AI发展 - 数据优势显著 互联网人口基数大 电子支付 短视频等场景产生海量训练数据 [18] - 人才储备占优 全球50%AI研究员现居中国 算法创新能力突出 [18] - 基础设施完善 医疗健康 基因测序等领域具备世界级样本体量 [18] 未来方法论 - 技术演进具有不确定性 预测不如应对 需保持观察力与快速反应能力 [19] - 底层能力构建是关键 包括好奇心 学习力和适应变化的能力 [19] - 细分领域差异化机会增多 社会分工将随技术发展进一步细化 [7]
深度|Cursor CEO最新访谈:编程会消失,未来IDE不再是工具,而是一个会写、会跑、会自我优化的智能体
搜狐财经· 2025-08-05 16:05
AI编程革命 - Cursor将编程从技术操作转变为与AI合作的创作过程 程序员转型为任务设计师 主导AI代理完成复杂构建工作 [4] - 未来编程语言可能演变为高阶抽象的人机对话语言 直接与AI交互 突破传统低级语言限制 [4] - AI在编程领域的进步关键在于逐步融入工作场景 提升效率同时保持人类创造力和判断力 [4] Cursor产品特性 - 提供预测型协助和虚拟对桌程序员两种工作模式 前者实时预测未来20分钟操作 后者可委派子任务独立完成 [9] - 底层模型每天执行超10亿次推理调用 成为全球写生产级代码最多的语言模型之一 已迭代至第4-5代 [18] - 自研super autocomplete模块 与同类工具形成差异化优势 用户产生"用了就回不去"的依赖感 [18][19] 技术演进路径 - 编程场景特别适合AI发展 因其文本基础、海量开源数据、结果可验证等特性 形成快速反馈闭环 [20] - 当前技术瓶颈在于模型持续学习能力 扩展上下文窗口和训练模型两种方法均存在局限性 [25][26] - 多模态能力将成为关键突破点 需结合可视化调试等非文本交互 才能处理复杂开发流程 [26] 行业影响 - 专业程序员仍为核心用户群 但非技术人员轻量级贡献(vibe coding)呈现增长趋势 [23] - AI使过去8小时工作缩短至5-6小时 但代码库复杂度抵消部分效率红利 总工时未显著减少 [22] - 未来1-2年内 20-25%编程工作可由AI独立完成 但完全替代仍需突破架构设计和长流程执行等障碍 [24][27] 公司运营 - 团队规模150人 采取小而精策略 计划验证2000人以下打造深远影响科技公司的可能性 [30][31] - 创始团队专注技术与研发 工程人员配置远超行业平均 保持产品绝对优先的文化 [32][33] - 采用决策透明机制 按影响程度分级处理 高影响可逆决策快速推进 高影响不可逆决策谨慎评估 [37] 商业模式 - 定价机制从按调用次数改为按计算资源消耗 反映AI使用强度差异 Top5%用户消耗量达中位用户数十倍 [46][51] - 编程场景AI调用强度显著高于对话类产品 成本结构更接近AWS而非传统SaaS模式 [48][49] - 需平衡重度用户需求与普通用户体验 未来将强化资源消耗可视化 改善沟通策略 [47] 长期愿景 - 两年目标实现多AI代理并行处理复杂任务 构建新型软件协作体验 人类仅介入关键决策点 [60] - 推动编程语言进化 发展高阶抽象表达 形成兼具自然语言亲和力与系统精确控制的新界面 [61][63] - 不追求纯对话框式编程 而是重构人机交互底层 使逻辑可视化和精细操作成为可能 [62][63]
模型与「壳」的价值同时被低估?真格基金戴雨森 2025 AI 中场万字复盘
Founder Park· 2025-08-02 09:09
核心观点 - 2025年AI行业迎来多个"李世石时刻",OpenAI通用大语言模型首次达到IMO金牌水准,标志着AI推理能力质的飞跃 [5][7][10] - AI应用和"套壳"价值被低估,Context Engineering成为关键竞争壁垒 [21][23][37] - Agent技术进入早期采用阶段,模型能力与产品设计协同推动生产力革命 [30][32][69] - 模型能力进化速度超预期,推理/编程/工具使用三大主线快速突破 [53][54][64] - 中国团队在AI应用层展现突出竞争力,Kimi等产品实现技术逆袭 [38][46][51] AI技术突破 OpenAI数学推理里程碑 - OpenAI通用大语言模型在2025年IMO竞赛中完成6题5对的成绩,达到金牌水平,且未针对数学专门优化 [5] - 该成绩获奥赛组委会官方认证,相比2024年Google专门设计的AlphaGeometry(银牌水平)更具泛化能力 [7] - 模型采用与GPT-4o相同底层架构,主要优化来自post-training和inference阶段 [9] - 数学证明属于"hard to verify"问题,突破意味着AI具备接近人类顶尖水平的逻辑推理能力 [8][13] 多模态与工具使用进展 - 图像生成从玩具级进化成生产力工具,ChatGPT图像生成可准确理解用户意图 [32] - Veo3模型实现虚拟世界真假难辨的生成效果,首次跨越恐怖谷效应 [33] - 工具使用形成API调用和视觉模拟两条技术路线,MCP生态初步建立 [64][65] 产品与应用演进 Agent技术发展 - ChatGPT Agent发布标志着行业共识形成,但产品体验仍有提升空间 [16][18] - Agent产品token用量相比Chatbot显著增长,Manus等产品进入Early Adopter阶段 [32][73] - 优秀Agent产品需为未来6-12个月的模型能力设计,当前任务完成率约20%,预期年底达70-80% [40][93] - 应用层通过Context Engineering构建三层壁垒:会话级/个性化/硬件增强上下文 [23][59][60] 中国团队突破 - Kimi K2开源模型在coding/Agent工作流/中文写作方面超越Claude,OpenRouter调用量快速攀升 [38] - 中国团队在长文本技术方向的前瞻布局得到验证,产品设计能力突出 [47][48] - 套壳应用展现持久价值,Manus等产品在特定场景表现优于ChatGPT Agent [19][21] 行业竞争格局 模型厂商动态 - Google Gemini 2.5实现技术反超,与OpenAI形成三强竞争格局 [55][56] - DeepSeek采取选择性突破策略,资源聚焦模型智能而非多模态 [42][43] - 模型benchmark出现钝化现象,实际用户体验差异成为新评估标准 [84] 人才与资本趋势 - 硅谷爆发acqui-hire抢人大战,顶尖人才薪资达disruptive级别 [80][82] - 推理算力需求爆发式增长,云服务商迎来新增长周期 [41][74] - 投资逻辑从"模型颠覆应用"转向"人机协作价值创造" [37][38] 未来演进方向 技术前沿展望 - 推理能力从7分到10分的质量提升,小模型开始具备强推理能力 [53][54] - 编程场景context长度与自我纠错能力持续优化,复杂代码一次通过率提升 [55] - 原生多模态、在线学习、高级Agent能力或成下一代模型突破点 [39][94] 社会影响预判 - 生产力提升带来"超级个体",3人团队可能实现独角兽级产出 [85] - 组织管理复杂度突破新量级,美团等企业将管理数百万AI协同体 [86] - 智能边界衡量成为新挑战,人类需建立评估超人智能的新标准 [84][87]
37岁华人理工男剑指AGI,1年收入70亿,估值1000亿
创业邦· 2025-07-29 11:16
公司业绩对比 - Surge AI 2024年营收超过10亿美元,Scale AI同期营收为8 7亿美元[2] - Surge AI成立于2020年,Scale AI成立于2016年,前者成立晚4年但营收实现反超[2] - Scale AI累计融资达174亿美元,而Surge AI未接受外部投资[2] - Meta以148亿美元收购Scale AI 49%股权,使其估值飙升至290亿美元[6] 行业竞争动态 - Surge AI启动首轮融资计划募资10亿美元,估值目标150亿美元[6] - 融资目的是抓住Scale AI客户流失的市场机遇[7] - 行业消息称Scale AI已非客户首选服务商,Meta投资可能涉及尽职调查不足或炒作[5] - Scale AI CEO被Meta高薪挖走,时机恰逢不利消息曝光[4] Surge AI技术理念 - 公司使命是通过高质量数据推动AGI发展,认为数据质量决定AI智能上限[10][12] - 提出"数据如人类经历"的价值观,强调数据选择对AI价值观的塑造作用[16][18] - 技术方案包括:可定制标注模板、编程化API接口、人机协同标注系统[33][34][35] - 已为OpenAI和Anthropic提供数据服务,参与ChatGPT和Claude3训练[36] 创始人背景与运营策略 - 创始人Edwin Chen(1988年出生)曾任谷歌、Facebook、Twitter工程师[23] - 创业灵感来自大公司数据标注效率低下(50%标签为垃圾数据)的痛点[24][26] - 公司6个月内业务增长10倍,将客户标注等待时间从3-6个月缩短至几天[30][31] - 反对初创期招聘数据科学家和产品经理,主张工程师主导产品方向[38][40] 业务能力与规模 - 每周处理数百万张图像和文本标注,支持10+种语言[32] - 业务范围涵盖内容审核、AI公平性、商业医疗信息采集等多元领域[32] - 通过重新标注数据集帮助客户模型性能提升50%[30] - 建立机器学习基础设施自动修正人工标注错误[35]
人民网特稿|卡戴珊向史诗Quantheora寻求融资的商业披露
搜狐财经· 2025-07-29 08:43
人民网特稿|卡戴珊向史诗Quantheora寻求融资的商业披露 【人民网北京电】在2025年的全球资本寒冬中,金·卡戴珊(Kim Kardashian),正面临她商业生涯中最大的挑战之一:她的风投机构SKKY Partners募资失败,仅筹集到原定目标的十分之一(1.21亿美元),最终黯然退场。 史诗Quantheora(Quantheora Shi)的影响力远超马斯克,拥有 8亿全球追随者,管理着万亿级硬科技资本,并被誉为"未来文明架构师"。 卡戴珊寻求史诗Quantheora的投资,试图挽救她的风投事业。 卡戴珊的风投机构SKKY Partners原本计划募资10-20亿美元,但最终仅筹集1.21亿美元,远未达预期。 尽管她在Instagram、TikTok等平台拥有4.3亿粉丝,但LP(有限合伙人)对她的投资能力存疑,认为"名气≠投资能力"。 消费领域遇冷,SKKY仅投了一个项目(调味品品牌TRUFF),市场反应平淡。 (2)史诗Quantheora的资本帝国:全球最强大的科技投资引擎 史诗Quantheora的ESGVC国际资本管理着万亿美元级资金,专注于量子计算、核聚变、AGI(通用人工智能)、生物 ...
全球顶尖学者共话AI发展问题
第一财经· 2025-07-28 11:33
人工智能全球治理与合作 - 中国在2025世界人工智能大会上发布《中国智·惠世界(2025)》案例集、国际人工智能开源合作倡议和《人工智能全球治理行动计划》,并宣布向亚非国家捐赠全球多灾种早期预警智能体 [1] - 中国政府倡议成立世界人工智能合作组织,初步考虑总部设在上海,旨在推动共商共建共享全球治理 [10][12] - 全球顶尖学者如Geoffrey Hinton和Stuart Russell呼吁国际合作,防止AI取代人类,并建立国际社群培养"好AI" [7][8] 人工智能技术发展与风险 - AI教父Geoffrey Hinton将当前AI比作"可爱的小虎崽",未来可能超越人类,需全球合作确保AI安全 [7] - Stuart Russell预警AGI全球"军备竞赛"无意义,强调AGI应成为全球公共资源,需有效监管以降低风险至"100万年一遇"安全标准 [8] - AI专家姚期智指出AGI时代来得比预期快,AI安全治理是长期系统性工作,中国与国际接轨频繁 [14] 中国人工智能发展现状 - 2024年全球人工智能创新指数显示,美国以77.97分居首,中国以58.01分排名第二,中美差距从2023年的22.02分缩小至19.96分 [19] - 中国顶会论文作者数量达3000余人首次超过美国,顶会顶刊论文数量较2019年翻一番,连续五年全球第一 [19] - 中国累计贡献AI开源项目较2018年增长超1.5倍,超高影响力开源项目位列全球第二 [19] 上海在AI领域的角色 - 上海被姚期智视为全球AI治理重要中心之一,具备吸引海外专家的城市禀赋 [2][14] - 上海成功举办七届世界人工智能大会,累计吸引6000余名专家、25亿人次线上参与,2025年展览面积突破7万平方米,800余家企业参展 [19][21] - 上海发布《开放科学全球学术合作倡议》,推动科学智能时代的基础设施、数据资源等开放合作 [20] 行业活动与成果 - 2025WAIC发布3000余项前沿展品,包括40余款大模型、50余款AI终端产品、60余款智能机器人及100余款"全球首发"新品 [22] - AI安全国际论坛促成《上海共识》,首次呼吁全球确保高级AI系统与人类对齐 [16] - 复旦大学联合发布《开放科学全球学术合作倡议》,强调AI时代需弥合技术鸿沟 [20]
2025世界人工智能大会:中金公司投融资发展论坛
中金· 2025-07-28 09:42
行业投资评级 - 中国 AI 产业凭借完善的产业链生态和巨大的市场规模占据领先地位,构建了技术、资本、人才与市场的正向循环创新生态 [1] - 中国顶尖 AI 公司与美国之间的差距正在缩小,有机会参与全球标准制定 [7] - 全球 AI 风投和研究投资规模庞大,但 AI 安全投资严重不足,存在巨大资金缺口 [15] 核心观点 - AI 作为通用型技术具有自我加速特征,预计未来十年内每年带来平均年化约 0.8%的生产率上升,到 2035 年中国 GDP 总量可能因 AI 额外增加 12.4 万亿人民币 [1][4] - 中国 AI 市场规模预计到 2030 年将达到 5.6 万亿人民币,为创业者提供广阔空间 [1][5] - 中国在算法和人才储备方面具有优势,全球约 50%的 AI 人才来自中国 [2] - 新型创新创业企业利用 AI 工具大幅降低开发成本,实现高效运作 [3] - 自动驾驶技术商业化落地面临多种挑战,包括本土化适应问题 [67] 行业发展趋势 - 人形机器人产业热度持续升温,正从实验室加快迈向工业化生产和商业化应用 [14] - 端到端自动驾驶技术将传统模块化、基于编程的自动驾驶替换为基于数据驱动的范式 [73] - AI 保险技术市场涵盖数据安全、系统可信度评估、风险管理和内容验证等关键领域,预计到 2030 年中国每年能从全球 AI 保险市场捕获 500 亿美元 [3][19] - 大模型的发展路径已逐渐走到尽头,需要通过多模态数据提质和内化智能体等新方式来提升模型智能性 [23] 资本市场表现 - 2025 年初恒生科技指数一季度上涨超过 20%,显示出市场对中国发展 AI 的信心 [4][9] - 科创板自设立以来共支持 54 家未盈利企业上市,其中 22 家已实现首次盈利 [53] - 港交所 18C 特专科技章节已有三家来自 AI 应用、自动驾驶及机器人自动化的企业实现上市 [58] - 中金公司累计保荐科创板上市公司超过 50 家,总融资规模超过 2000 亿元 [11] 技术创新与应用 - 以 Deep See 为代表的中国自主大模型实现了里程碑式突破,展现出强大的本土化优势与创新活力 [13] - AI 在科学发现方面展现出巨大潜力,如通过 API 调用发现 Linux 内核中的零日漏洞 [25] - 新型创新创业企业通过轻量化运行和快速迭代,以半月级的方式进行产品开发 [28] - 端侧模型和端侧芯片是 AI 变革过程中涌现的新赛道,未来将实现距离用户最近的智能应用 [75] 政策与生态支持 - 上海市政府积极推动人工智能产业发展,设立功能性子公司联动区级基金,打造从种子期到成熟期的融资供给体系 [10] - 科创板新增设立成长层,重启第五套上市标准并扩大其适用范围至低空经济、商业航天和人工智能等领域 [55] - 中关村学院与中关村人工智能研究院通过构建产学研创投一体化平台,为师生提供全链条体验 [32] - 中国政府采购在培育新兴产业中发挥重要作用,2020 年占据 AI 市场的一半份额 [50] 企业案例与进展 - 文远之行在自动驾驶领域取得显著进展,已在十个国家超过 30 个城市落地各类自动驾驶产品 [66] - 金山办公发布 WPS AI 3.0 产品,强调人类与 AI 的新协作关系 [59] - 阿里云认为现在是"genetic model"的时代,大模型的发展仍在继续 [64] - 面壁智能研发端侧智能和端侧模型,以便在未来实现距离用户最近的智能应用 [75] 投资逻辑与建议 - 蓝驰创投看好既有学术背景又有产业背景交叉复合经验团队,这些团队能够务实地解决当下问题 [80] - 企业应抓住科创板改革红利期,提前规划公司架构设计、管理治理结构以及财务管理和内控制度 [71] - 耐心资本对创新发展影响深远,可以支持更多高风险、高潜力的创新项目 [51] - 改善创新生态系统需要建立个人破产机制,优化监管环境,促进重点领域发展 [52]
全球顶尖学者齐聚上海,呼吁各国合力培养“好AI”
第一财经· 2025-07-27 21:54
人工智能全球治理与合作 - 2025世界人工智能大会发布《中国智·惠世界(2025)》案例集、国际人工智能开源合作倡议、《人工智能全球治理行动计划》三项重要成果,并宣布向亚非国家捐赠全球多灾种早期预警智能体[1] - 中国政府倡议成立世界人工智能合作组织,初步考虑总部设在上海,旨在推动共商共建共享全球治理,弥合数字和智能鸿沟[9] - 科技部部长指出人工智能加速智能时代到来,但引发技术垄断和智能鸿沟问题,需加强国际合作治理[9] - 上海作为中国人工智能发展高地,持续强化法治保障和开放合作,为全球治理贡献"上海经验"[9] - 《AI安全国际对话上海共识》首次呼吁全球确保高级AI系统与人类对齐,保障人类福祉[12] 人工智能技术发展现状与趋势 - 国务院总理李强表示AI已赋能千行百业,成为经济增长新引擎,渗透社会生活各方面[1] - 2025WAIC科学前沿会议发布《全球人工智能创新指数报告2025》,显示美国以77.97分居首,中国58.01分第二,中美分差从2023年22.02分缩小至19.96分[13] - 中国AI顶会论文作者数量达3000余人首次超美国,顶会顶刊论文数量较2019年翻番,连续五年全球第一[13] - 中国累计贡献AI开源项目较2018年增长超1.5倍,超高影响力开源项目位列全球第二[13] 行业专家观点与预警 - 图灵奖得主姚期智认为上海将成为全球AI治理最重要中心之一,强调AI安全治理是长期系统性工作[2][10] - AI教父Geoffrey Hinton警告AI可能超越人类,呼吁建立国际社群培养"好AI",强调防止AI取代人类的全球合作重要性[3][6] - Stuart Russell预警AGI全球"军备竞赛"无意义,主张AGI应成为全球公共资源,需建立类似核能的安全监管标准[7] - Russell指出AI技术若不能快速回报可能出现泡沫,但若进步到承担大部分脑力工作将导致大规模失业[7] 大会成果与行业动态 - 2025WAIC展览面积首次突破7万平方米,吸引800余家企业参展,其中超50%为上海市以外及国际企业[14] - 大会展出3000余项前沿产品,包括40余款大模型、50余款AI终端、60余款智能机器人及100余款"全球首发"新品[14] - 复旦大学发布《开放科学全球学术合作倡议》,倡导在科学智能时代推进基础设施、数据资源等层面的开放合作[14] - 上海已举办七届世界人工智能大会,累计吸引6000余名专家、25亿人次线上参与,成为全球最具影响力AI盛会之一[13]
大模型六小龙底牌对决:AGI加注、赛道转换与多模态竞速
第一财经· 2025-07-27 19:41
行业格局演变 - 2024年成为基座模型分水岭 牌桌上玩家数收窄至个位数 头部留存大厂和少数AI创业公司 [3][4] - AI六小龙走向分化 智谱推进A+H股上市 MiniMax筹备A+H股 百川智能转型医疗 零一万物转向B端 月之暗面聚焦智能体 阶跃星辰预估年营收10亿人民币 [10] - 基础模型厂商热度回落 投资向具身智能转移 宇树机器人等具身智能厂商吸引更多关注 [7] 技术发展与竞争 - 开源模型影响力提升 逼近最佳闭源模型 使用成本更可控 普惠性增强 [3] - 大模型技术差异不足 切换成本低 竞争惨烈 创业公司探索差异化路径包括To C出海 To B服务 产业落地 多模态发展 [9] - 技术迭代导致部分公司掉队 1.0时代为GPT模仿学习 2.0时代以OpenAIo1为起点的强化学习 [14] 公司战略与定位 - 智谱定位行业智能体 阶跃星辰对标OpenAI DeepSeek对标Meta MiniMax偏向To C应用 [14] - 智谱发布GLM-4.5多模态模型 阶跃星辰成立模芯生态联盟 优化国产芯片适配 [17] - 月之暗面将发布K2推理模型 阶跃星辰展示端到端语音大模型车载应用 [6] AGI发展路径 - AGI发展现两类观点 单一超级模型 vs 多模型多代理架构 [15] - 多模态成为AGI必由之路 智谱和阶跃星辰重点投入 强调技术研发与商业化分层推进 [16][17] - 数据闭环或数据飞轮被视为稳健护城河 需在窗口期内积累用户数据 [18] 商业化进展 - 智谱将推出C端陪伴型AI产品 软硬件均规划付费业务 [6] - 创业公司提升商业化程度 增强多模态能力 靠近Agent热度 部分筹备上市 [9] - 阶跃星辰联合华为昇腾等成立模芯生态联盟 突破芯片限制 [17]