AI前线

搜索文档
“多模态方法无法实现AGI”
AI前线· 2025-06-14 12:06
作者 | Benjamin 译者 | 王强 策划 | 褚杏娟 "将语言投射回思想模型时,我们忽视了支撑我们智能的不言而喻的具身认知。" 首先,虽然奥赛罗的移动可被证明用于推断奥赛罗棋盘的完整状态, 但我们没有理由相信有办法通 过语言描述推断出物理世界的完整画面 。将奥赛罗游戏与物理世界的许多任务区分开来的是, 奥赛 罗本质上位于符号领域,只是使用物理标记来实现,以便于人类玩耍 。一个完整的奥赛罗游戏可以 用纸和笔进行,但人们不能用纸和笔扫地、洗碗或开车。要解决这些任务,你需要超越人类用语言描 述的物理世界概念。这种描述世界的概念是否编码进了正式的世界模型中,或者例如编码进了一个价 值函数,还有待讨论, 但很明显,物理世界中有许多问题不能完全由符号系统表示并用纯粹的符号 操作解决 。 最近生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来。虽然这些模型似乎捕 捉到了人类智能的本质,但它们甚至违背了我们对智能最基本的直觉。它们之所以出现,并非因为它 们是解决智能问题的深思熟虑的解决方案,而是因为它们在我们已有的硬件上有效地扩展了规模。一 些人沉浸在规模扩展的成果中,开始相信这提供了通往 AGI 的 ...
看不见的底座:大模型 Infra 工程师的实战日常 | 直播预告
AI前线· 2025-06-14 12:06
大模型能跑起来、跑得好,背后有哪些看不见的工程细节?三位分别来自华为、蚂蚁集团与 SGLang 开源项目的 AI Infra 从业者 将分享他们的观察与体验。扫码预约直播,不见不散! 直播介绍 直播时间 Infra 工程师日常遇到的真实需求与故障类型 训练 / 推理流程中最常出错的环节有哪些 开源 Infra 项目的推进难点:技术之外还要兼顾什么 国产卡适配训练 / 推理过程中的实际体验与挑战 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 AI 前线视频号直播。 如何向讲师提问? 看不见的底座:大模型 Infra 工程师的实战日常 直播嘉宾 主持人 :ZOMI 酱 华为 / 昇腾技术专家 嘉宾 : 直播亮点 马介悦 蚂蚁集团 / 高级专家 尹良升 SGLang 核心开发者 6 月 16 日 20:00~21:30 直播主题 文末留言写下问题,讲师会在直播中为你解答。 ...
员工每天花1000美元也要用ClaudeCode!创始人:太贵了,大公司专属,但它比 Cursor 猛!
AI前线· 2025-06-14 12:06
对于许多开发者来说,每月 20 美元的 Cursor 和 Copilot 已经是"无限量"好用的标配。然而, Anthropic 的 Claude Code 却是个异类。它在处理大型代码库方面表现相当出色,但价格却直接 翻了几倍。如果你只是周末写写代码,几美元的 API key 兴许就够了;可一旦用于日常开发,每 月账单轻松就能突破 50、100 甚至 200 美元。有用户直言不讳地指出:"Claude Code 的能力比 Cursor 更强。我还在用 Cursor 的唯一原因,就是 Claude Code 实在太贵了。"据悉,Anthropic 内部的一些工程师一天的花费就超过1000美元。 价格似乎阻止这款产品爆发增长的主要因素,毕竟对比其他一票工具,Claude Code "真的很 猛"。 尽管 Cursor 的底层大模型同样来自 Anthropic, Steve Yegge 却评价道:"Claude Code 让 Cursor、Windsurf、Augment 这些工具看起来都像是过时产品。" 编译 | Tina 我用了 Claude Code 几天,它在清理我那堆乱七八糟的旧代码里的遗留 bug 时 ...
硅基流动完成新一轮数亿元融资,打造开发者首选生成式 AI 开发平台
AI前线· 2025-06-13 14:42
作者|AICon 全球人工智能开发与应用大会 审校|罗燕珊 硅基流动已完成数亿元人民币 A 轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟 投,华兴资本担任独家财务顾问。 硅基流动创始人袁进辉表示:"作为深耕 AI 基础设施领域多年的专业选手,硅基流动通过持续的技术 突破和产品创新有效解决了国内 AI 行业发展的多个重大问题。今年以来,随着阿里巴巴通义千问 Qwen、DeepSeek 等开源大模型崛起以及 AI 推理算力需求激增,公司业务迎来了爆发式增长。感 谢多方投资机构的信任与支持,在本轮融资帮助下,我们将继续加大研发投入,积极拓展海内外市 场,努力早日成为开发者首选的生成式 AI 开发平台。" 在即将于 6 月 27-28 日在北京举办的 AICon 全球人工智能开发与应用大会 上,我们荣幸邀请到 硅 基流动创始人 &CEO 袁进辉 带来主题演讲 《 AI-Native Cloud 构建之路与展望 》。他将分享基于 硅基流动在推理引擎、FaaS、MaaS、工作流等方面的探索,并展望 AI-Native Cloud 的未来。 硅基流动瞄准 AI 算力使用成本高企的难题,推出了一系列行业领先的技术 ...
三大云厂同时瘫了?Cursor、ChatGPT跟着倒下!网友:整个互联网都要废了
AI前线· 2025-06-13 14:42
作者|冬梅 北京时间昨天晚上,在 X 上,有网友称 AWS、谷歌云、Azure 和 Cloudflare 同一时间发生了中断。 | Web Services outages reported in the last 24 hours | | | | | | | | | Cloud outages reported in the last 24 hours | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 2:00 PM | 5:00 PM | 8:00 PM | 11:00 PM | 2:00 AM | 5:00 AM | 8:00 AM | 2:00 PM | 5:00 PM | 8:00 PM | 11:00 PM | 2:00 AM | 5:00 AM | 8:00 AM | | t Azure outages reported in the last 24 hours | | | | | | | | | re outages reported in the ...
SGLang 推理引擎的技术要点与部署实践|AICon 北京站前瞻
AI前线· 2025-06-13 14:42
采访嘉宾|尹良升,SGLang 核心开发者 编辑|罗燕珊 2025 年 5 月, SGLang 提出了第一个完全开源的 DeepSeek 大规模专家并行部署方案,该方 案也是目前开源实现中唯一能够复现官方博客所述推理性能和成本的方案。 近日,InfoQ 专访了 SGLang 核心开发者尹良升 ,他分享了该项目背后的关键技术、工程挑战 与社区生态,以及如何在大模型推理中实现性能与成本的平衡。从 PD 分离架构带来的尾延迟控 制,到推测解码提升 Token 生成速度,再到 KV 缓存落盘在多轮对话中的显存优化——这些关键 能力使 SGLang 成为支持低成本、大规模模型部署的高性能推理引擎。 尹良升,现就读于上海交通大学 ACM 班,即将前往加州大学伯克利分校 Sky Computing 攻读计 算机博士学位。他是 SGLang 最早期的几位核心开发者之一,深度参与了 SGLang 的研发和优 化。 6 月 27~28 日,在即将于北京举办的 AICon 全球人工智能开发与应用大会上,尹良升将发表演 讲《SGLang 推理引擎——高效的开源部署方案》,将深入解析前沿大模型推理关键技术,并探 讨其在实际应用中的优化 ...
长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级
AI前线· 2025-06-12 14:07
Github 链接:https://github.com/openbmb/minicpm Huggingface 链接:https://huggingface.co/collections/openbmb/minicpm-4- 6841ab29d180257e940baa9b 整理 | 华卫 近日,新一代"面壁小钢炮" MiniCPM4.0 端侧模型发布,拥有 8B 、0.5B 两种参数规模 。 一款 8B 稀疏闪电版,带来端侧性能大跃升;一款 0.5B "以小博大",适配广泛终端场景。 模型相关链接 Model Scope 链接:https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d 截至目前,面壁小钢炮 MiniCPM 系列全平台下载量累计破 1000 万。 据介绍,MiniCPM4.0 -8B 是首个原生稀疏模型,5% 的极高稀疏度加持系统级创新技术的大爆发, 让长文本、深思考在端侧真正跑起来。在 MMLU、CEval、MATH500、HumanEval 等基准测试中, MiniCPM4.0 -8B 以仅 22% 的训练开销,性能比肩 ...
被“网暴”两个月后,Yann LeCun 携最新世界模型杀回!小扎千万美元激励抢人,Meta AI 内部权利之争开始
AI前线· 2025-06-12 14:07
整理 | 华卫 昨日,Meta 推出了其新的"世界模型"V-JEPA 2,旨在实现物理世界中顶尖的视觉理解与预测能力,以提升 AI 主体的物理推理 能力。对于构建能在物理世界中运作的 AI 智能体和实现高级机器智能(AMI)的工作而言,物理推理能力至关重要。 在一段发布的 V-JEPA 2 视频演示中,图灵奖获得者、Meta 首席 AI 科学家 Yann LeCun 将 V-JEPA 2 描述为"现实的抽象数字 孪生",使 AI 能够 "预测其行为的后果" 并 "规划行动方案以完成给定任务"。 "我们相信,世界模型将开启机器人技术的新纪元,使现实世界中的 AI 主体能够帮助完成家务和体力任务,而无需海量的机器 人训练数据。" 比英伟达的 Cosmos 模型快 30 倍, 现已开源 作为人类,我们具备预测物理世界如何因响应自身或他人行为而变化的能力。例如,你知道将网球抛向空中时,重力会将其拉 回地面;在陌生的拥挤区域行走时,你会朝着目的地移动,同时避免碰撞沿途的人群或障碍物;打曲棍球时,你会滑向冰球的 前进方向,而非它当前的位置。 实际上,人类是通过观察周围世界并构建内部模型来形成这种物理直觉,进而预测假设行为 ...
对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天
AI前线· 2025-06-11 16:39
作者 | 华卫 今年的智源大会上,智源研究院推出全新的"悟界"系列大模型,其中包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、跨本体具身大小脑协作框架 RoboOS2.0 与具身大 脑 RoboBrain2.0 以及全原子微观生命模型 OpenComplex2。 据介绍,Emu3 作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于则 Emu3 架构,引入脑信号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。在初代版本 的基础上,RoboOS2.0 与 RoboBrain2.0 的原有性能有大幅提升,并新增多机协作规划与物理常识 驱动的空间推理能力。OpenComplex2 可在原子分辨率层面捕捉分子相互作用及平衡构象,探索微 观构象波动与宏观生物功能的跨尺度关联。 "大模型技术还远没有到发展的尽头。"在大会前夕,智源研究院长王仲远向我们透露了这一系列新模 型背后的技术思考与智源当下的战略布局。 王仲远指出,去年智源就对大模型的技术路线进行了预判,会从大语言模型往多模态、尤其是原生多 模态世界模型的方向发展。当前,智源的工作布局都是围绕这一技术发 ...
OpenAI o3-pro模型发布,但不能聊天
AI前线· 2025-06-11 16:39
作者 | OpenAI 译者 | 核子可乐 策划 | 褚杏娟 当地时间 6 月 10 日,OpenAI o3-pro 现已正式发布——ChatGPT Pro 用户现已可通过 API 使用。 与 o1-pro 类似,o3-pro 是 OpenAI 当前最强智能模型 o3 之下的一个子版本,旨在延长思考时间以 提供更可靠的响应结果。 "自 o1-pro 发布以来,用户一直在数学、科学、编程等领域对该模型青眼有加——学术评估表明, o3-pro 在这些领域延续了出色表现。"OpenAI 表示,与 o3 类似,o3-pro 可以使用 ChatGPT 所擅长 的各类工具——它能够搜索网页、分析文件、推理视觉输入、使用 Python、运用记忆个性化响应等 等。由于 o3-pro 可以使用工具,因此响应结果往往需要比 o1-pro 更长的时间才能生成完成。我们建 议大家仅将其用于可靠性的优先级远高于速度指标的棘手难题,甚至愿意为此等待几分钟时间。 在专家评估中,评估者在包括科学、教育、编程、商业及写作协助等关键领域在内的所有测试类别 中,始终更青睐 o3-pro(而非 o3)生成的结果。评估者们也一致认为,o3-pro 在 ...