Workflow
AI前线
icon
搜索文档
突发!特朗普对华加征 100% 额外关税、“锁死”所有关键软件,美股一夜蒸发1.65万亿美元
AI前线· 2025-10-11 12:14
美国对华贸易政策升级 - 美国总统宣布自11月1日起对从中国进口的商品加征100%新关税,该关税将叠加在现有关税之上[2] - 美国将在同一天对“所有关键软件”实施出口管制[2] - 加征关税被描述为针对中国对稀土矿物实施新出口管制措施的“报复”性举措[2] - 政策存在不确定性,总统表示有可能在截止日期前取消加征的关税[6] 中国稀土出口管制措施 - 中国商务部宣布自12月1日起,外国实体出口两类产品需获得许可证:产品中源自中国的稀土含量超过0.1%的产品,以及采用中国稀土技术生产的产品[2] - 中国供应全球约70%的稀土矿物,这些矿物对制造微芯片、半导体、人工智能技术和电子产品至关重要[2] - 美国总统称中国的稀土出口管制举措“毫无征兆”,并表示两国关系在过去六个月非常良好[4] 市场反应与影响 - 政策宣布引发市场大规模抛售,美股下跌1.65万亿美元[8] - 在总统首次威胁征收新关税后,道琼斯工业平均指数下跌876点(跌幅1.9%),标准普尔500指数下跌2.7%,纳斯达克综合指数暴跌3.6%[7] - 科技股受冲击尤为严重,英伟达股价下跌近5%,超威半导体股价下跌近8%,整个半导体板块跌幅超过5%[3] - 新限制措施引发美国企业极大担忧,分析人士认为可能会扰乱包括英伟达和苹果在内的全球多家大型企业的供应链[3] 潜在经济后果 - 有观点指出,加征关税对美国消费者造成的伤害可能远大于对中国的影响,可能导致所有商品价格大幅上涨[10] - 当前从中国进口商品的所谓实际关税税率已达40%,具体关税水平从钢铁和铝的50%到消费品的7.5%不等[2] - 在总统上一任期内,美国对中国产品的关税曾最低升至145%,导致大量贸易停滞并引发美国商店货架空置的担忧[4]
北大 & 作业帮团队提出 Text-to-SQL 新框架 Interactive-T2S,攻克宽表处理与低资源对齐难题
AI前线· 2025-10-11 12:14
论文核心信息 论文标题: Interactive-T2S: Multi-Turn Interactions for Text-to-SQL with Large Language Models 论文链接: https://arxiv.org/abs/2408.11062v1 Text-to-SQL 技术的 核心价值与现实挑战 作者 | 作业帮技术团队 审校 | 蔡芳芳 本论文由北京大学与作业帮教育科技(北京)有限公司联合研发,核心团队长期深耕自然语言处理与 数据库交互领域,聚焦大语言模型(LLMs)在结构化数据查询中的落地痛点,文章已入选国际顶会 CIKM2025(第 34 届信息与知识管理国际会议)。对比传统工作中将大型语言模型(LLM)看作一 个一次性生成完整 SQL 代码的翻译器,本文将其塑造成一个能够与数据库进行多轮、迭代式交互的 智能代理(Agent) 。这个代理通过一系列"思考 - 行动 - 观察"的循环,逐步分解问题、搜集信息、 构建并最终执行 SQL 查询,从而有效解决了现有方法在处理复杂、宽表(列数非常多)数据库时的 低效率和资源限制问题。 作者团队: Guanming Xiong (北京大 ...
承认自己开源不行?转型“美国DeepSeek”后,两个谷歌研究员的AI初创公司融到20亿美元,估值暴涨15倍!
AI前线· 2025-10-10 12:17
公司概况与融资进展 - AI创业公司Reflection AI由两位前Google DeepMind研究员于2024年3月创立,专注于自主编程智能体和开源前沿模型[2][3] - 公司在最新一轮融资中筹集了20亿美元,估值达到80亿美元,相比7个月前的5.45亿美元估值暴涨了15倍[2] - 本轮投资方阵容豪华,包括Nvidia、红杉资本、花旗、Lightspeed、GIC、Zoom创始人Eric Yuan、谷歌前CEO Eric Schmidt等知名机构和投资人[2] 团队背景与技术愿景 - 创始人Misha Laskin曾主导DeepMind Gemini项目的奖励建模,联合创始人Ioannis Antonoglou是AlphaGo系统的联合创作者[3][4] - 公司已从DeepMind和OpenAI挖来顶级团队,成员曾主导或参与PaLM、Gemini、AlphaGo、AlphaCode、AlphaProof、ChatGPT等项目的研发[6] - 公司团队规模约60人,主要为AI研究员和工程师,并已搭建出能在前沿规模上训练大规模专家混合模型的LLM与强化学习平台[7] - 创始人预测"小型任务的智能体"会先落地,而"通用超人类智能体"大概在3年左右出现[3] 产品战略与发展路径 - 公司最初选择从编程领域切入,认为训练能通过代码与软件交互的语言模型相当于给AI装上"手脚",是语言模型的天然优势领域[5] - 今年7月公司推出了代码理解智能体Asimov,在盲测中其答案在大多数情况下比Cursor Ask和Claude Code更受欢迎[5] - Asimov只是第一步,后续计划将"企业级超级智能"扩展到产品、营销、HR等领域的"团队记忆"和知识管理[6] - 公司计划在明年推出一个使用"数十万亿tokens"训练的前沿语言模型,该模型将以文本为主,未来具备多模态能力[7][12] 开源定位与商业模式 - 公司将自身定位为OpenAI、Anthropic等"封闭前沿实验室"的开源替代公司,目标是"将开放模型的前沿技术带回美国"[2][8] - 公司对"开放"的定义接近Meta或Mistral的策略,会开放模型权重供公众使用,但训练数据和完整训练流程不会公开[10] - 主要收入将来自大型企业在其模型上构建产品,以及各国政府建设主权AI系统的项目,研究者可免费使用模型[10] - 公司声称已经"找到了与开放智能战略相契合的可规模化商业模式",并承诺将训练系统对外开放[6][10] 行业竞争与效率优势 - 公司认为DeepSeek、Qwen等模型的崛起是一次警醒,如果不采取行动,全球智能标准将由别人制定而非美国[8] - 公司强调其运营效率高于大型实验室,大型实验室需要100单位资金完成的任务,公司聚焦核心方向只需10单位就够了,差了一个数量级[12] - AI公司的主要成本是GPU支出,公司融资规模会与进入下一阶段扩张的节奏匹配,无需像大实验室那样铺大摊子[12]
知名机器人专家喊话:投人形机器人初创公司的数十亿美元,正在打水漂
AI前线· 2025-10-10 12:17
整理 | 华卫 知名机器人专家罗德尼・布鲁克斯(Rodney Brooks)是 iRobot 公司的联合创始人,曾在麻省理工 学院(MIT)深耕数十年。他对特斯拉、以及备受关注的 AI 机器人公司 Figure 等企业的技术路线尤 为质疑——这些公司试图通过让机器人观看人类执行任务的视频,来教会它们掌握灵活操作的能力。 在一篇新文章中,他将这种方法称为"纯粹的空想"。 问题出在哪?人类的手部结构极其复杂,仅专门的触觉感受器就有约 1.7 万个,目前没有任何机器人 能接近这一水平。尽管机器学习彻底改变了语音识别和图像处理领域,但这些突破的基础,是数十年 积累的、用于捕捉高质量数据的现有技术。布鲁克斯指出:"在触觉数据领域,我们并没有这样的技 术积累。" 此外还有安全问题。全尺寸行走人形机器人需要消耗大量能量才能保持直立。一旦摔倒,它们会具有 极高的危险性。从物理学角度来看,若机器人尺寸是现有型号的两倍,其摔倒时产生的有害能量将达 到现有型号的八倍。 布鲁克斯预测,15 年后,成功的"人形"机器人实际上会搭载轮子、配备多条机械臂和专用传感器, 并且会彻底抛弃人类的外形。与此同时,他坚信,如今投入的数十亿美元,不过 ...
Sam Altman自曝羡慕20岁辍学生,还直言美国难以复制微信这类“全能App”!
AI前线· 2025-10-09 12:48
公司战略转型 - OpenAI正从一家模型公司向通用智能平台转型,标志性事件是2025年开发者日上推出的一系列重磅更新[2] - 公司推出ChatGPT内嵌应用、智能体构建器、开放Sora API,并对能处理长达一整天复杂任务的Codex进行了升级[2] - ChatGPT的周活跃用户数已达8亿,表明其已成为重要的分发平台[4] 产品与技术突破 - 智能体构建工具使开发复杂智能体变得异常简单,即使不懂代码的知识工作者也能独立开发,这被视为智能体领域的无代码革命[9][10] - 模型性能在22-23个月内取得巨大进步,是推出智能体构建工具的关键技术突破[8] - 借助代码生成工具和智能体工具包,快速开发高质量软件的能力发生了结构性变革[9] - 公司认为高质量视频生成技术对实现AGI有重要意义,涉及空间推理能力、世界模型知识获取及未来机器人技术突破[27] 开发者生态与市场影响 - 公司将为开发者发布文档,指导如何最大限度地提高应用在ChatGPT中被推荐的概率[7][8] - 全球软件开发总量预计将大幅增加,测试和优化想法所需时间会不断缩短[10] - 公司正在探索Sora的不同商业模式,包括按次生成收费模式,具体取决于产品最终形态的进化方向[28][30] 通用人工智能进展 - 公司首席执行官认为早期类AGI的突破正在当下开始发生,核心衡量标准是AI能否实现全新发现并拓展人类整体知识库[2][20] - 目前已经出现AI帮助科学家实现小发现、提出新方法或解决难题的案例,公司有信心在未来几年大力推进这项能力[20] - GPT-5在GDPval基准测试中排名第二,该测试用于衡量AI模型在知识工作者核心岗位的高经济价值现实任务中的表现[17] - 基准测试结果可能影响模型后训练阶段的一些做法,但不会改变GPT-6的核心开发战略[18] 行业前景与挑战 - 公司首席执行官预测出现由智能体运营的零人力十亿美元公司可能需要几年时间,但现在已能严肃讨论此话题[12] - 实现完全自主运行的智能体需突破更智能的模型、更长的上下文窗口和更优的记忆能力三大技术瓶颈[13][14] - 公司认为建立企业优势的核心逻辑未变,如网络效应、品牌营销优势等,但建立优势的具体方法有了新变化[16][17] - 社会需要适应AI生成视频以假乱真的现实,公司认为提前发布带防护机制的技术能让社会与技术共同进化[26]
AI Agent,如何重塑软件研发的「质」与「效」?| 直播预告
AI前线· 2025-10-09 12:48
当研发进入 Agent 时代,提效只是开始,质变才是真正的未来。一场关于智能研发范式的深度对话,即将开启。扫码预约直播。 直播介绍 直播时间 10 月 10 日 20:00-21:30 直播主题 AI Agent,如何重塑软件研发的「质」与「效」? 直播亮点 策划 |QCon 全球软件开发大会 黄金 趣丸科技 / 基础架构组负责人 王玉霞 中兴通讯 / 资深需求教练和 AI 教练 郭华翔 蚂蚁集团 / 高级前端技术专家 揭秘 AI Agent 实施中的"真坑"与"实锤" 一次看懂 AI 如何重塑"需求 - 开发 - 运维"全流程 抢先窥见 AI4SE 的下一站 如何看直播? 扫描下图海报 【二维码】 ,预约 InfoQ 视频号直播。 直播嘉宾 主持人: 刘亚丹 趣丸科技运维总监 嘉宾 文末留言写下问题,讲师会在直播中为你解答。 一次看懂 Al 则何里塑 需求-什友-匹维 主流在 抢先窥见 AI4SE 的下一站 当研发进入 Agent 时代,提效只是开始,质 变才是真正的未来。一场关于智能研发范式 的深度对话,即将开启。 扫 / 码 / 预 / 约 直播福利 AI 研发提效资料包 将大模型能力深度融入软件研发核 ...
北航团队提出新的离线分层扩散框架:基于结构信息原理,实现稳定离线策略学习|NeurIPS 2025
AI前线· 2025-10-09 12:48
研究背景与动机 - 离线强化学习的核心挑战在于如何仅利用固定的历史数据集训练有效策略,而扩散模型通过将策略学习重构为条件轨迹生成任务,能有效缓解分布外状态和动作导致的“外推误差”问题[3] - 为提升长时序任务效率,分层策略被引入扩散模型,但现有方法存在固定两层扩散层次结构和单一预定义时间尺度的局限,限制了其对不同任务复杂性的适应性和决策灵活性[2][3] - 这提出了一个核心开放性挑战:如何系统地分析历史轨迹,以构建一个既可泛化又具有任务感知能力的扩散层级结构[3] SIHD框架核心设计 - SIHD框架从层级构建、条件扩散和正则化探索三个方面进行创新设计,以应对现有方法的局限性[5] - 框架通过分析离线轨迹中内嵌的“结构信息”,自适应地构建一个多尺度的扩散层级,从而在具有稀疏奖励的长时序环境中实现高效、稳定的离线策略学习[2] - 其核心设计旨在克服固定层级结构和单一时间尺度的刚性限制,提升决策性能和灵活性[6] 基于结构信息的多尺度扩散层级构建 - SIHD首先从离线数据集中提取所有状态元素,并基于特征相似度构建一个k-近邻状态图[8] - 接着应用结构信息原理,通过HCSE优化算法最小化K-维结构熵,从而获得一个最优的树状编码结构,该树的每一层都代表了在不同粒度上对状态空间的划分[8] - 基于定义的社群结构,SIHD能够为每一条历史轨迹进行自适应的层级分割,确保每个片段内的状态都属于同一个社群,并将每个片段的末端状态定义为该层的子目标[8] - 这一过程使得SIHD能够从数据中自动推断出不同任务的动态时间尺度,构建出一个灵活的多尺度扩散层级[9] 基于结构信息增益的条件扩散模型 - 在SIHD中,每一层的扩散模型都由其上一层的子目标序列进行引导,但创造性地使用结构信息增益作为引导信号,而非传统方法依赖的局部奖励信号[10] - 对于层级中的子序列,其条件输入被定义为对应状态社群的结构信息增益,该增益项量化了从高层级社群过渡到更具体子社群所获得的“信息量”[10] - 这种引导方式不直接依赖于可能稀疏或有噪声的奖励函数,从而使生成过程更加稳定和鲁棒[10] 结构熵正则化器 - SIHD引入了一个结构熵正则化器,旨在缓解对有限离线数据集的过分依赖并鼓励有效探索[11] - 该正则化项通过最大化状态分布的香农熵来鼓励策略探索数据集中覆盖不足的状态区域,同时通过最小化在每个层级的社群划分上的结构熵来约束策略不会过度偏离由编码的行为模式,从而减轻分布偏移带来的风险[12] - 最终的训练目标函数将扩散模型的标准损失与这个正则化项结合起来,尤其是在底层的动作生成模型中,以实现探索与利用的平衡[12] 实验结果与分析 - 在D4RL Gym-MuJoCo基准测试中,SIHD在HalfCheetah、Hopper和Walker2D任务上均取得了最优的平均回报,相较于HDMI和HD等先进分层基线表现出更强的泛化能力[16][17] - 在中低质量的"Medium"和"Medium-Replay"数据集上,SIHD的性能优势尤为突出,平均提升分别达到3.8%和3.9%,验证了结构熵正则化器在缓解数据质量依赖方面的有效性[17] - 在奖励稀疏且对长时序规划要求更高的Maze2D和AntMaze任务中,SIHD的优势更加显著,在所有导航任务的数据集上均实现了最佳性能,平均奖励在单任务Maze2D、多任务Maze2D和AntMaze上分别领先8.3%、7.4%和4.4%[19][22] - 在AntMaze-Large数据集上,SIHD的得分为89.4,显著高于次优方法HD的83.6,并展现了卓越的鲁棒性,在数据质量下降时,其性能降幅被控制在17.1%以内,而基线方法最大降幅可达27.4%[22] 消融研究 - 消融研究证实了SIHD各个组件的必要性,尤其是自适应多尺度层级(SIHD-DH),它的缺失会导致最严重的性能下降,特别是在长时序任务中[21] - 研究结果表明,基于结构信息的自适应层级构建、结构信息增益的条件引导以及结构熵正则化探索共同贡献了SIHD框架的卓越性能[21][23]
“你的Agent,我一周末就能做出来!” AI时代的护城河:Cursor 卷每日迭代速度,DeepSeek 用技术撕大厂规模优势
AI前线· 2025-10-08 13:30
AI时代护城河的重要性 - AI应用看似极易复制 导致创业者对护城河的焦虑和讨论热度远超AI兴起之前 [2][3] - 护城河的本质是防御机制 防止公司陷入无限竞争和利润归零的绝境 [2][3] - YC认为护城河已成为许多聪明头脑犹豫创业的关键问题 [3] 七大护城河力量框架 - 框架源自汉密尔顿·赫尔默2016年著作《七大力量:商业战略的基石》 [7] - 框架概括了企业可以构建的七类护城河 在AI领域仍然具有现实意义 [7] - 七大力量包括:速度、流程之力、垄断资源、转换成本、反向定位、网络效应和规模经济 [7] 速度作为核心护城河 - 初创企业最重要的护城河是速度 这是起步阶段唯一的优势 [8] - Cursor凭借"一日一迭代"的极限速度 在巨头审批时就能推出新功能 [3][9] - OpenAI团队以几名工程师在数月间完成产品交付 体现初创企业追求速度的本质 [37] 流程之力护城河 - 流程之力体现为构建高度复杂的业务体系 提高复制门槛 [10] - Case Text文本分析系统、Greenlight身份认证系统和Casca贷款申请系统属于关键基础设施 [10][19] - Plaid为数千家金融机构提供支持 需要极其复杂的后端逻辑和CI/CD架构 [20] 垄断资源护城河 - 垄断资源指无法套利且具有独立价值的珍贵资产 如药品专利 [11][22] - Character AI通过微调大语言模型将服务成本降低10倍 [11][24] - Scale AI与国防部合作 Palantir与政府部门合作 都需要艰苦的审批流程 [22] 转换成本护城河 - 转换成本体现在系统接入周期长和工作流深度定制化 [12] - Happy Robot与DHL合作 Salient与银行合作 试点周期长达半年到一年 [26] - 记忆数据成为面向消费者AI厂商的新转换成本 Claude在记忆功能上落后 [27] 反向定位护城河 - 反向定位指采取老牌企业难以复制的举措 因其会蚕食传统巨头既有业务 [13] - AI原生初创公司按实际完成任务收费 传统SaaS企业按座席数量收费 [13][29] - Avoca在暖通空调领域占比从1%增长至10% 挖掘企业人力支出新预算池 [31] 网络效应护城河 - AI时代网络效应转化为数据形态 用户数据越多定制模型越精准 [14][39] - Cursor使用用户点击和键盘数据训练自动补全功能 [15][39] - OpenAI将聊天记录注入未来模型训练 如GPT-6 [15][39] 规模经济护城河 - 规模经济通过巨额投资构建基础设施降低服务成本 [16][42] - 训练前沿大语言模型需要巨额资本投入 只有少数公司能承担 [16][42] - DeepSeek以远低于预期成本训练前沿模型 动摇规模经济护城河逻辑 [3][42] 垂直领域AI机会 - 垂直AI SaaS智能体规模可能达到传统SaaS的十倍 [31] - 暖通空调客服岗位年流失率高达50%到80% 存在自动化机会 [32] - Giga ML在客服领域产品开箱即用性能更优 推动更快销售流程 [35] 品牌护城河案例 - ChatGPT日活用户远超谷歌Gemini 尽管谷歌拥有全球用户基础 [36] - OpenAI从零打造现象级消费AI应用品牌 迫使谷歌陷入追赶态势 [36][37] - 谷歌因需支撑广告业务和庞大组织结构 难以进行自我颠覆 [37] 给创始人的建议 - 首要任务是找到真实存在的痛点 实现从零到一的突破 [6][44] - 不必过早纠结护城河 护城河会在构建过程中自然形成 [6][17] - 痛点必须足够强烈 如关乎企业生存危机或勃勃野心 [44]
谷歌又赢麻了!两位灵魂人物斩获2025诺贝尔物理学奖,“量子霸权”玩真的?
AI前线· 2025-10-08 10:54
2025年诺贝尔物理学奖获奖者及其贡献 - John Clarke、Michel H Devoret和John M Martinis因揭示量子物理实际应用的实验获奖,为下一代数字技术奠定基础,分享1100万瑞典克朗(120万美元)奖金[2] 获奖者背景与谷歌关联 - John Clarke出生于1942年,现任加州大学伯克利分校教授,以超导量子干涉仪(SQUID)研究闻名,应用于核磁共振信号探测和量子计算机量子比特读取[7] - Michel Devoret出生于1953年,现任谷歌量子人工智能量子硬件首席科学家,1985年与Martinis首次证明约瑟夫森结的介观量子能级[8] - John Martinis出生于1958年,自2002年致力于约瑟夫森结量子比特研究,2014年谷歌通过数百万美元协议聘请其团队打造超导量子比特量子计算机[10] - 三位获奖者中两人与谷歌有渊源,这是连续第二年谷歌相关科学家获诺贝尔奖[6][12] 获奖研究的科学意义与商业应用 - 三位科学家在1984至1985年用超导体搭建电子电路,证明量子力学可影响日常物体,通过约瑟夫森结和隧穿效应展现宏观系统量子特性[15] - 研究推动新兴商用量子计算机发展,约瑟夫森结成为超导量子比特核心基础,支持谷歌Willow量子芯片和2019年量子优越性里程碑[6][13] - 量子计算机利用53量子比特实现优越性,解决传统计算机需数百万年完成的任务,有望应对气候变化等紧迫问题[11][18] 量子技术的前景与行业影响 - 量子技术已无处不在,计算机微芯片晶体管是日常例子,获奖为量子密码学、计算机和传感器等下一代技术创造机遇[17] - 量子力学是所有数字技术的基础,极具实用价值,百年历史领域不断带来新惊喜[16]
“杀死每家AI初创、造超级OS”?奥特曼的野望惊现缺口:资深人士曝出三大瓶颈
AI前线· 2025-10-07 12:56
AgentKit发布与能力 - 推出能够构建、部署和优化智能体工作流程的AgentKit,是一套面向开发者和企业的完整工具集[2] - 该工具集包含三大核心构建模块:用于可视化创建和版本化多智能体工作流的Agent Builder、管理数据与工具连接的Connector Registry、以及用于嵌入可定制聊天交互体验的ChatKit[5] - 实际应用案例显示,Ramp团队用几小时就从空白画布构建出采购智能体,将迭代周期缩短70%,上线时间从两个季度缩短至两个冲刺周期;LY Corporation在不到两小时内构建出工作助手智能体;为Canva开发者社区构建支持智能体节省超过两周时间且集成耗时不到一小时[7] AgentKit的局限性 - 有资深构建者指出AgentKit仅能覆盖20%的使用场景,剩余80%涉及私有API、认证层和合规工作流等复杂集成[10] - 在生产环境可靠性方面,AgentKit模板仅能应对10次请求,而真实生产环境需要支持10000+次请求且达到99.9%的正常运行时间,缺乏完善的重试、错误处理等机制[10] - 在医疗、金融等专业领域,模板无法承载监管细节或临床判断等专业知识,仍需人类专家介入[11] Codex的发展与应用 - Codex日使用量自8月初以来增长了10倍以上,GPT‑5-Codex是增长最快的模型之一,在三周内处理了超过40万亿个token[11] - 在OpenAI内部,几乎所有工程师都在使用Codex(7月时仅略超一半),工程师每周合并的拉取请求数量增加了70%,Codex会自动审查几乎每一个PR[3][11] - Codex正式全面开放,并推出Slack集成、Codex SDK和全新管理工具三项新功能,有评价称甚至7岁的孩子也可以借助Codex SDK将想象变为现实[11][12][16] Apps SDK与生态系统战略 - 以预览版形式开放Apps SDK,允许开发者在ChatGPT中构建、集成和调用原生应用,目前公开支持的应用包括Booking.com、Canva、Spotify等[12] - 行业观点认为此举措使ChatGPT成为新的操作系统和默认界面,目标是让用户在此与所有应用程序对话,让OpenAI变得无可匹敌[13] 新模型与API上线 - 上线三大重要API:针对高难度任务会投入更多“思考时间”的GPT-5 Pro、以及视频生成模型Sora 2与Sora 2 Pro,后者支持最长12秒视频和Remix调整功能[14][15][18] - 推出两个更经济的迷你版本模型:gpt-image-1-mini价格比完整版降低80%,gpt-realtime-mini价格降低70%[20]