AI前线

搜索文档
被骂“在乱讲”的专家,这次可能说对了:传统数据仓库正在被 Agentic AI 吞噬
AI前线· 2025-06-15 11:55
作者 | 郭炜 白鲸开源 CEO,Apache 基金会成员 从技术架构的角度看,我认为这一次的 AI 浪潮将深刻影响整个软件生态。DSS 系统的设计是以 人作为最终消费者的决策支持逻辑为中心,然而,随着 Agentic AI 时代来临,最终的"消费者"更 可能是 Agent,对数据仓库和复杂 ETL 链路将被重新设计,甚至消失。传统数据仓库偏重结构与 查询模式,会被 Agentic Data Stack 架构强调语义与响应模式取代。本文作者的原标题为《 传统 数据仓库正在被 Agentic AI 吞噬?Agentic Data Stack 初探》。 引言:Snowflake 换 CEO 背后的信号 2024 年春天,云数据仓库的明星公司 Snowflake 宣布换帅,前 Google 广告业务负责人 Sridhar Ramaswamy 接替了曾带领 Snowflake 实现 600 亿美元估值的传奇 CEO Frank Slootman 。 如果你只是把这当成一次高管轮换,理解就不够透彻,因为这背后真正的隐喻是, 数据仓库世界 的范式,正在悄然巨变 。 "技术的演进,从来不是线性推进,而是技术的跃迁,从 OL ...
阶跃星辰高管离职,跳槽京东;百度最大规模抢夺顶尖AI人才,岗位增超60%;阿里自曝:被DeepSeek逼急了 | AI周报
AI前线· 2025-06-15 11:55
整理 | 傅宇琪、褚杏娟 引言:元安回应长文引发关注一事:不要消费马云;阶跃星辰 Tech Fellow 段楠离职,跳槽京东;哪 吒汽车 CEO 被员工围堵讨薪,公司面临内部动荡;谷歌启动全公司范围"自愿离职计划",搜索等核心 业务部门受波及;阿里自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发;百度官宣启动最大 规模顶尖 AI 人才招聘,岗位扩增超 60%;年度"港股 AGI 第一股"来了!云知声冲刺 IPO 五年终通过 港交所聆讯;Meta 买 Scale AI,谷歌据称准备斩断合作关系,小扎 7000 万招揽人才…… 行业热点 元安回应长文引发关注一事:不要消费马云 据报道,近日,阿里钉钉 15 年老员工元安离职前夕在阿里内网发布一篇深情长文,文中他表达了对 阿里过去的怀念,以及对阿里的发展的很多思考。 元安在帖中展露了一位"老阿里人"的情怀:"那时候被尊重不是由于阿里人收入高,更多的是阿里人非 常善良,产品帮助了许多人,社会给我们的尊重来自对我们的品德与价值认可。但这几年各种糟糕的 事件和打击,外部社会舆论与内部员工心态,都发生了巨大的改变。也许丈母娘还喜欢找阿里女婿, 因为收入高。十五年 ...
智能投顾的大模型应用,为什么选择了“大小模型协同”?
AI前线· 2025-06-15 11:55
采访嘉宾|尹辰轩,北银金科高级算法专家 编辑|罗燕珊 大模型时代,金融行业依然站在技术革新的前沿。而在智能投顾这一高度合规、专业性极强的场 景中,大模型的落地不仅是技术挑战,更是业务安全的严峻考验。面对挑战,北银金科采用了"大 小模型协同"的架构思路,尝试在性能、准确性与合规之间找到更优平衡。 "大模型投顾落地的最大技术挑战,在于如何在高合规门槛的业务中避免幻觉和误答。" 北银金科 高级算法专家尹辰轩 表示 , 金融业务不像通用问答那样容错率高,一旦输出带有承诺收益或判 断错误的内容,不仅影响用户决策,更可能带来法律风险。 在这种背景下,大小模型协同成为一条更为稳妥的路径。一方面,它限制了大模型的职责范围, 主要负责任务扩写与流程编排,核心内容交由小模型完成;另一方面,也提升了整体的性价比 ——在更低算力消耗下,实现更稳定、深入的回答效果。 展望未来,尹辰轩认为,AI 应用架构会逐渐趋于"语言理解 + 工具调用"的组合形态,大小模型协 同也只是更大趋势的一部分。 关于"大小模型协同"的相关思路及其在金融领域的应用情况,尹辰轩近日在接受 InfoQ 采访时做 了简要阐述。更多实践细节他将在 6 月 27~28 ...
“多模态方法无法实现AGI”
AI前线· 2025-06-14 12:06
作者 | Benjamin 译者 | 王强 策划 | 褚杏娟 "将语言投射回思想模型时,我们忽视了支撑我们智能的不言而喻的具身认知。" 首先,虽然奥赛罗的移动可被证明用于推断奥赛罗棋盘的完整状态, 但我们没有理由相信有办法通 过语言描述推断出物理世界的完整画面 。将奥赛罗游戏与物理世界的许多任务区分开来的是, 奥赛 罗本质上位于符号领域,只是使用物理标记来实现,以便于人类玩耍 。一个完整的奥赛罗游戏可以 用纸和笔进行,但人们不能用纸和笔扫地、洗碗或开车。要解决这些任务,你需要超越人类用语言描 述的物理世界概念。这种描述世界的概念是否编码进了正式的世界模型中,或者例如编码进了一个价 值函数,还有待讨论, 但很明显,物理世界中有许多问题不能完全由符号系统表示并用纯粹的符号 操作解决 。 最近生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来。虽然这些模型似乎捕 捉到了人类智能的本质,但它们甚至违背了我们对智能最基本的直觉。它们之所以出现,并非因为它 们是解决智能问题的深思熟虑的解决方案,而是因为它们在我们已有的硬件上有效地扩展了规模。一 些人沉浸在规模扩展的成果中,开始相信这提供了通往 AGI 的 ...
看不见的底座:大模型 Infra 工程师的实战日常 | 直播预告
AI前线· 2025-06-14 12:06
大模型能跑起来、跑得好,背后有哪些看不见的工程细节?三位分别来自华为、蚂蚁集团与 SGLang 开源项目的 AI Infra 从业者 将分享他们的观察与体验。扫码预约直播,不见不散! 直播介绍 直播时间 Infra 工程师日常遇到的真实需求与故障类型 训练 / 推理流程中最常出错的环节有哪些 开源 Infra 项目的推进难点:技术之外还要兼顾什么 国产卡适配训练 / 推理过程中的实际体验与挑战 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 AI 前线视频号直播。 如何向讲师提问? 看不见的底座:大模型 Infra 工程师的实战日常 直播嘉宾 主持人 :ZOMI 酱 华为 / 昇腾技术专家 嘉宾 : 直播亮点 马介悦 蚂蚁集团 / 高级专家 尹良升 SGLang 核心开发者 6 月 16 日 20:00~21:30 直播主题 文末留言写下问题,讲师会在直播中为你解答。 ...
员工每天花1000美元也要用ClaudeCode!创始人:太贵了,大公司专属,但它比 Cursor 猛!
AI前线· 2025-06-14 12:06
对于许多开发者来说,每月 20 美元的 Cursor 和 Copilot 已经是"无限量"好用的标配。然而, Anthropic 的 Claude Code 却是个异类。它在处理大型代码库方面表现相当出色,但价格却直接 翻了几倍。如果你只是周末写写代码,几美元的 API key 兴许就够了;可一旦用于日常开发,每 月账单轻松就能突破 50、100 甚至 200 美元。有用户直言不讳地指出:"Claude Code 的能力比 Cursor 更强。我还在用 Cursor 的唯一原因,就是 Claude Code 实在太贵了。"据悉,Anthropic 内部的一些工程师一天的花费就超过1000美元。 价格似乎阻止这款产品爆发增长的主要因素,毕竟对比其他一票工具,Claude Code "真的很 猛"。 尽管 Cursor 的底层大模型同样来自 Anthropic, Steve Yegge 却评价道:"Claude Code 让 Cursor、Windsurf、Augment 这些工具看起来都像是过时产品。" 编译 | Tina 我用了 Claude Code 几天,它在清理我那堆乱七八糟的旧代码里的遗留 bug 时 ...
硅基流动完成新一轮数亿元融资,打造开发者首选生成式 AI 开发平台
AI前线· 2025-06-13 14:42
作者|AICon 全球人工智能开发与应用大会 审校|罗燕珊 硅基流动已完成数亿元人民币 A 轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟 投,华兴资本担任独家财务顾问。 硅基流动创始人袁进辉表示:"作为深耕 AI 基础设施领域多年的专业选手,硅基流动通过持续的技术 突破和产品创新有效解决了国内 AI 行业发展的多个重大问题。今年以来,随着阿里巴巴通义千问 Qwen、DeepSeek 等开源大模型崛起以及 AI 推理算力需求激增,公司业务迎来了爆发式增长。感 谢多方投资机构的信任与支持,在本轮融资帮助下,我们将继续加大研发投入,积极拓展海内外市 场,努力早日成为开发者首选的生成式 AI 开发平台。" 在即将于 6 月 27-28 日在北京举办的 AICon 全球人工智能开发与应用大会 上,我们荣幸邀请到 硅 基流动创始人 &CEO 袁进辉 带来主题演讲 《 AI-Native Cloud 构建之路与展望 》。他将分享基于 硅基流动在推理引擎、FaaS、MaaS、工作流等方面的探索,并展望 AI-Native Cloud 的未来。 硅基流动瞄准 AI 算力使用成本高企的难题,推出了一系列行业领先的技术 ...
三大云厂同时瘫了?Cursor、ChatGPT跟着倒下!网友:整个互联网都要废了
AI前线· 2025-06-13 14:42
作者|冬梅 北京时间昨天晚上,在 X 上,有网友称 AWS、谷歌云、Azure 和 Cloudflare 同一时间发生了中断。 | Web Services outages reported in the last 24 hours | | | | | | | | | Cloud outages reported in the last 24 hours | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 2:00 PM | 5:00 PM | 8:00 PM | 11:00 PM | 2:00 AM | 5:00 AM | 8:00 AM | 2:00 PM | 5:00 PM | 8:00 PM | 11:00 PM | 2:00 AM | 5:00 AM | 8:00 AM | | t Azure outages reported in the last 24 hours | | | | | | | | | re outages reported in the ...
SGLang 推理引擎的技术要点与部署实践|AICon 北京站前瞻
AI前线· 2025-06-13 14:42
采访嘉宾|尹良升,SGLang 核心开发者 编辑|罗燕珊 2025 年 5 月, SGLang 提出了第一个完全开源的 DeepSeek 大规模专家并行部署方案,该方 案也是目前开源实现中唯一能够复现官方博客所述推理性能和成本的方案。 近日,InfoQ 专访了 SGLang 核心开发者尹良升 ,他分享了该项目背后的关键技术、工程挑战 与社区生态,以及如何在大模型推理中实现性能与成本的平衡。从 PD 分离架构带来的尾延迟控 制,到推测解码提升 Token 生成速度,再到 KV 缓存落盘在多轮对话中的显存优化——这些关键 能力使 SGLang 成为支持低成本、大规模模型部署的高性能推理引擎。 尹良升,现就读于上海交通大学 ACM 班,即将前往加州大学伯克利分校 Sky Computing 攻读计 算机博士学位。他是 SGLang 最早期的几位核心开发者之一,深度参与了 SGLang 的研发和优 化。 6 月 27~28 日,在即将于北京举办的 AICon 全球人工智能开发与应用大会上,尹良升将发表演 讲《SGLang 推理引擎——高效的开源部署方案》,将深入解析前沿大模型推理关键技术,并探 讨其在实际应用中的优化 ...
长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级
AI前线· 2025-06-12 14:07
Github 链接:https://github.com/openbmb/minicpm Huggingface 链接:https://huggingface.co/collections/openbmb/minicpm-4- 6841ab29d180257e940baa9b 整理 | 华卫 近日,新一代"面壁小钢炮" MiniCPM4.0 端侧模型发布,拥有 8B 、0.5B 两种参数规模 。 一款 8B 稀疏闪电版,带来端侧性能大跃升;一款 0.5B "以小博大",适配广泛终端场景。 模型相关链接 Model Scope 链接:https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d 截至目前,面壁小钢炮 MiniCPM 系列全平台下载量累计破 1000 万。 据介绍,MiniCPM4.0 -8B 是首个原生稀疏模型,5% 的极高稀疏度加持系统级创新技术的大爆发, 让长文本、深思考在端侧真正跑起来。在 MMLU、CEval、MATH500、HumanEval 等基准测试中, MiniCPM4.0 -8B 以仅 22% 的训练开销,性能比肩 ...