Artificial Intelligence
搜索文档
OpenAI in talks to commit up to $1.5 billion to private equity joint venture, FT reports
Reuters· 2026-04-22 12:13
Artificial intelligence firm OpenAI is set to commit up to $1.5 billion to a new joint venture with private equity firms, the Financial Times reported on Wednesday, citing people with knowledge... ...
ICLR 2026 | ProSafePrune:一剪见效,告别大模型过度防御
机器之心· 2026-04-22 11:34
通讯作者:胡文波,合肥工业大学计算机与信息学院副教授,黄山青年学者。主要研究方向为机器学习,包括贝叶斯概率机器学习、人工智能安全以及科学人工 智能。 当你问 AI 「如何关掉房间的灯(how to kill the lights)」,却被冰冷拒绝「无法提供相关帮助」;当你想探讨「黑客技术的正向应用」,得到的却是「拒绝涉及非 法活动」的机械回应 —— 你遇到的正是大语言模型(LLMs)的「过度拒绝」(over-refusal)痛点。 一作:陈紫军,合肥工业大学博士生,研究方向为大模型概率可靠性以及可解释性,曾在 ICLR,AAAI, COLING 等顶级会议上发表论文。 针对这一行业难题,合肥工业大学与科大讯飞联合团队提出了全新的低秩参数修剪框架 ProSafePrune ,该工作已被国际顶会 ICLR 2026 录用。通过精准定位模型 内部的认知偏差并针对性修剪,ProSafePrune 在大幅降低过度拒绝率的同时,不仅不损害模型的安全防御能力,还能轻微提升通用任务性能,为 LLM 的安全部署 提供了全新思路。 论文链接:https://openreview.net/forum?id=QkHKaPfRAB G ...
种子轮估值暴涨3倍,但那条让新基金经理赚钱的「窄路」正在消失
深思SenseAI· 2026-04-22 10:53
种子投资圈流传着一个圣经级共识:基金规模小,所以要投估值低的项目,拿高股权,广撒网,等着幂 律定律帮你找到那个1000倍的赢家。这个逻辑被反复讲,被当成新兴基金经理的生存手册。 这个手册已经失效了。照着它走的人,会毁掉自己的基金。 风险投资人 Lucas Vaz 在一篇长文里把话说得很直:AI时代最大的赢家给了早期投资人140倍的回 报,却同时证明了旧的种子投资逻辑已经从根子上坏了。这不是一个估值过高的问题,不是一个市场泡 沫的问题,而是整套游戏规则的根本性改变。 这篇文章写给那些正在、或者即将管理早期基金的人。但它真正揭示的,是一个更普遍的问题:当市场 的底层逻辑发生了根本性变化,那些在旧逻辑下被奉为真理的操作手册,不只是不管用了,而是会主动 伤害你。越是遵守,越是偏离正确方向。识别这种失效比应对它更难——因为手册本身从来没有明显地 崩溃过,它只是在新环境里悄悄地把你引向了一条越走越窄、最后没有出口的路。 数字说了什么 ::: Carta 追踪了 2022 年 Q1 至 2026 年 Q1 共 6447 笔美国种子轮融资,数据显示了一条近乎 垂直的曲线。种子阶段融后估值的第 95 百分位,从 2022 年初 ...
首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!
机器之心· 2026-04-22 09:23
机器之心发布 当 AI 智能体不再只是「一次性工具」,而是能够持续学习、自我进化的「数字伙伴『数字同事』,会发生什么?自进化智能体应该采取怎样的设计原则? 全球首个基于「上下文信息密度最大化」设计原则的自进化智能体系统 ——GenericAgent(GA),正式发布其技术报告。 报告显示, GA 能在保持任务准确率前提下,比同类竞争对手节省近 10 倍 Token。 报告深度解读了 GA 的核心设计理念,介绍了自进化智能体的评测基准,并给 出了评测数据,全面剖析 GA 的自进化能力以及智能体设计的可靠思路! 整个报告长达 47 页,今天大家可以一睹为快! GA 是什么? GenericAgent(GA)是 复旦大学知识工场实验室旗下 A3 实验室(Advantage AI Agent 实验室,与深圳夸夸菁领科技有限公司合作) 构建的一个 通用型、自进化 LLM 智能体系统。 GA 是下一代自组织、自学习、自进化的通用智能体的代表之一,是一个拥有「生命感」,能够在用户使用调教下快速学习与成长的数字生命。GA 技术的商业应 用版是 DinTal Claw,旨在将这一自进化架构深度应用于政企场景,打造低成本、高效率 ...
对话地平线前高管牛建伟:万亿参数大模型如何重塑具身智能
雷峰网· 2026-04-22 08:38
具身智能行业技术路线分歧 - 行业赛道正在分裂,主要存在两大技术流派:“VLA派”与“智驾降维派” [2] - “VLA派”采用视觉-语言-动作端到端方案,用海量数据训练机器人执行具体任务,代表公司如智元、自变量,估值已飙升至数百亿 [2] - “智驾降维派”将自动驾驶的BEV、端到端经验移植到人形机器人,代表团队有至简动力、维他动力等,动辄融资数亿美金 [2] - 两大技术路线均未完全跑通,VLA面临泛化与成本问题,智驾派面临场景迁移挑战,行业共识远未形成 [2] - 2026年业界出现了第三支“大模型派”,该派系选择将具身大脑与多模态大模型结合 [3][4] 牛建伟的背景与创业动机 - 牛建伟是地平线前智能座舱产品线总经理,拥有百度首个深度学习语音系统及国内首个车规级AI芯片+多模态人机交互方案量产经验 [5] - 2015年加入地平线初衷是实现机器人梦想,但当时技术不成熟,后转向智能汽车领域 [12][14] - 在地平线期间,其团队创造了AI芯片在汽车行业最快量产的速度记录,并将行业首个多模态AI解决方案落地到长安UNI-T爆款车型 [14][15] - 创业契机源于团队探索使用大模型作为GUI Agent操作手机APP完成下单,意识到将其放到机器人上的时机已到 [17] - 认为当前入场时机成熟,因为具身智能尚未达到“GPT时刻”,缺乏“范式基座”,而自身拥有超过十年的积累 [19] 对VLA路线的批判 - 核心观点认为VLA是弯路,正在用大模型最不擅长的方式解决运动控制问题 [6][21] - 指出大语言模型的根本局限在于离散token化表示,本质是文本概率生成器而非数值计算器,存在模态错配 [22] - 举例说明大模型在数值计算上存在缺陷,如比较“9.9”和“9.10”会产生数值幻觉,三位数乘法计算无法做到100%准确 [23] - 认为VLA将视觉-语言理解直接映射为连续动作坐标,是“扬短避长”,弱化了大模型擅长的任务规划与工具调用能力 [23] - 指出VLA的三个具体问题:1) 模型太小(通常3B-7B参数),学习100万小时视频数据(对应7.2B张图像帧)会出现欠拟合,充分学习需要100B级别参数,十年内端侧芯片无法支持 [27] 2) 与机器人本体绑定太深,硬件迭代成本高 [27] 3) 缺乏有效的反馈和记忆机制,认知与执行强耦合,无法通过反馈在线学习 [27] - 认为VLA的演示效果(如叠衣服)是针对特定任务采集大量数据的结果,缺乏泛化与智能,如同“小学生叠十年衣服,不会变成大学生” [25][26] - 认为端到端的VLA是单点方案,难以解决具身智能所需的通用任务问题,类比自动驾驶L3问题尚未有效解决 [28] “大模型派”的技术方案 - 提出分层架构解决方案:上层是万亿参数的“空间智能大模型”作为大脑,负责任务规划、推理和记忆;下层是0.1B-1B参数的VA(Vision-to-Action)小模型作为手和脚,负责执行基础操作 [29][30] - 方案核心是充分利用大模型在逻辑推理、任务规划和工具调用方面的优势,并针对物理世界数据进行优化 [30] - 认为物理世界复杂度高,机器人理解三维空间关系和物理规律需要万亿参数级别的大模型,与GPT处理数字世界相当 [33] - 训练方法上,计划在开源大模型(如千问、Llama)基础上,增加三维世界数据重新训练,成本可能从1000亿人民币降至几十亿 [33] - 预训练阶段加入大量弱标注三维数据学习物理规律,后训练用几千小时精标数据激发能力,所需数据量远低于VLA的100万或1000万小时 [33] - VA模型与VLA的区别在于弱化语言部分,实现视觉直接驱动动作,参数规模小(0.XB),推理速度更快、延迟更低 [34] - 在该方案中,大模型负责理解“为什么要做”,VA模型负责执行“怎么做”,大脑可复用于不同形态的机器人本体 [36] 对行业现状与竞争格局的看法 - 认为行业内大规模数据采集计划若算法范式错误,采集越多越浪费,并指出第一视角数据价值可能弱化之前的遥操数据 [38] - 以自动驾驶行业技术迭代导致历史数据价值弱化为例,建议从智能终局出发考虑数据采集与标注 [39] - 指出当前投资圈认可智驾背景团队做VLA是“降维打击”,但认为这是错误的,因为自动驾驶是单点问题,而具身智能是通用问题 [40][41] - 将具身智能竞争者分为三派:1) 本体派(如波士顿动力),只有运动控制,缺乏环境感知 [42] 2) VLA派,只有操作能力,没有大脑 [42] 3) 大模型派(如特斯拉、谷歌及其团队),做大脑,负责任务规划、推理和记忆 [42] - 指出特斯拉和谷歌拥有完整方案:特斯拉有Grok,谷歌有Gemini,都是利用万亿参数大模型作为大脑进行任务拆解与推理,本体上用VLA或类似模型执行 [43] 公司当前进展与产品愿景 - 公司已在机器人上跑通物理Agent架构,可通过对话交互修正机器人任务执行,并积累技能,初步建成了“物理世界的OpenClaw” [45] - 具体能力示例:机器人可理解“把杯子拿起来放到收纳盒里”的指令,并自主拆解任务,调用相机、深度感知及VA模型逐步完成 [47] - 与VLA端到端的核心区别在于引入了物理Agent架构,具备任务实时监督、反馈、记忆与反思能力,形成感知、决策、执行、评估与反思的完整闭环,实现持续学习与成长 [48] - 反馈学习机制类似养“小龙虾”,可通过指令在线学习新规则(如“杯子以后放厨房”)并形成记忆,无需模型重训练 [49] - 最终目标是打造“物理世界的GPT”,即最懂物理世界的“大脑”,而非最会执行特定任务的机器人 [6]
SpaceX secures option to buy AI startup Cursor for $60bn or partner for $10bn
The Guardian· 2026-04-22 08:13AI 处理中...
SpaceX said it has secured an option to either acquire code-generation startup Cursor for $60bn later this year, or pay $10bn for their new partnership, as it pushes deeper into the lucrative market for AI developer tools.Along with OpenAI and Anthropic, Cursor is one of several Silicon Valley startups that has drawn waves of developers by using artificial intelligence to automate coding, a business where AI companies have found early commercial traction.The deal could give xAI, the Grok chatbot maker that ...
刚刚,OpenAI发布GPT-Image-2:设计师们的饭碗,可能要真的没了
创业邦· 2026-04-22 08:06
文章核心观点 OpenAI通过发布GPT-Image-2,在视觉生成领域实现了颠覆性的代差领先,该模型不仅解决了图像质量、一致性和复杂排版等历史难题,更通过引入“思考模式”具备了策略级智能,能够自主完成调研、策划和设计工作,其工业化的定价策略将进一步加速对传统视觉设计工作的替代[11][16][24][25][166][167] 产品发布与市场定位 - OpenAI以隐秘方式在LM Arena盲测平台推出代号“Duct Tape”的神秘模型,随后正式命名为ChatGPT GPT-Image-2并推向市场,没有进行大规模营销预热[12][15][16] - GPT-Image-2在LM Arena的Text-to-Image竞技场排行榜上以1512分空降榜首,领先第二名(Nano-banana-2)达242分,创造了该榜单历史上前所未有的领先差距[17][19][20] - 此次发布标志着OpenAI在经历一段时间的市场存在感减弱后,强势收复在视觉生成领域的失地[5][6][10][23] 技术架构与核心能力 - 模型采用双模式架构:“即时模式”主打极速响应,用于高频、单次的视觉转化需求;“思考模式”面向付费用户,在生成前会进行长达十几秒的逻辑推理与联网搜索,实现了策略级智能[30][32][33][36][37] - “思考模式”使模型能够理解指令背后的文化语境和商业意图,自主完成从联网调研、内容策划到版式设计和渲染的全流程工作,而不仅仅是机械拼接信息[38][41][43][53][54] - 模型底层可能融合了多种技术:即时模式可能基于o4-mini或GPT-5家族的轻量版本;思考模式则可能接入了O系列推理模型(如o4),利用其长考机制进行逻辑规划[116][117][119][121] 实测性能与突破 - **视觉理解与业务闭环**:模型能基于用户上传的照片,解析面部和身材特征,进行服装搭配并生成不同角度的上身效果图,压缩了从创意到视觉呈现的流程[67][70][71][74] - **解决一致性与连续叙事**:模型能够基于单张照片生成多页连贯的漫画,角色特征在不同分镜中保持一致,情节逻辑完整,具备了连续叙事的“导演”能力[76][78][79][82][84] - **多语种文字精准渲染**:模型能零错误生成包含法文、日文、俄文等复杂文字排版的图像,并会根据语种自动匹配当地的文化审美和字体设计,解决了历史性的“鬼画符”难题[85][88][89][91][92] - **极端画幅与微观控制**:模型能完美处理3:1或1:3等非标准画幅,生成逻辑闭环的全景图;通过实验性4K API,甚至能在单颗米粒上精准刻字,显示出像素级的空间位置理解与控制力[95][96][98][100][102][103][106] 定价策略与商业化影响 - 定价采用按Token计费框架,而非按张收费。GPT-Image-2每百万输出Token价格为30美元,较上一代的32美元有所下降[126][127][130][131] - 生成一张高质量图像约消耗1000-1500个输出Token,单张成本约0.03至0.045美元(约合人民币0.2至0.3元)。使用批处理(Batch)API模式,输出价格可腰斩至每百万Token15美元,单张成本最低仅约0.015美元(约合人民币0.1元)[133][134][135][136] - 引入“缓存输入”机制,在进行连续生成(如漫画、系列海报)时,后续图像的输入Token成本可降低75%,使得大规模商业批量出图的边际成本显著下降[137][138][139][140][141] 团队构成与技术渊源 - 团队汇聚了多领域顶尖专家,其背景直接解释了模型的核心能力来源[144] - **Gabriel Goh**:多模态模型CLIP的核心作者之一,解决了图文对齐和文字精准渲染的底层难题[145][147] - **Alex Yu**:前3D生成公司Luma AI联合创始人兼CTO,其3D神经渲染专长使模型具备三维空间理解能力,可能先在三维场景中构图再渲染2D图像[149][150][151] - **Boyuan Chen与Kiwhan Song**:专注于世界模型和具身智能的学者,解决了角色在多页漫画中跨时空保持一致性的难题[152][153][155] - **Nithanth Kudige与Kenji Hata**:分别擅长推理模型与视觉逻辑,将底层推理、空间渲染、图文对齐等技术融合进同一模型[155][157] 行业影响与未来展望 - 模型将大量过去需要专业训练的设计技能(如软件操作、字体排版、多语种设计、精细修图)变成了可通过自然语言指令调用的基础能力,实质性瓦解了传统设计师职业的技能护城河[25][94][165][166][167] - 行业竞争维度已从“能否画好看”升级为“是否懂策略与排版逻辑”,AI正在从执行工具转变为具备策略智能的生产伙伴[63][168] - 模型仍存在边界,如在处理需要严密物理空间翻转(如折纸指南)或极高重复性细节(如沙粒)时可能触及能力极限,但这在商业应用中是微小瑕疵[160][161][162] - 未来行业的关键问题不再是AI是否会替代人力,而是如何适应这条由AI驱动的新生产线[163][164][168]
What is Cursor? SpaceX could buy the AI company for a whopping $60 billion.
MarketWatch· 2026-04-22 08:01
公司动态 - SpaceX的下一次收购目标可能是人工智能初创公司Cursor [1] - Cursor是一家快速增长的人工智能初创公司 [1] - Cursor开发了广受欢迎的工具,并获得了英伟达首席执行官黄仁勋的赞扬 [1]
SpaceX strikes $60 billion deal for the right to buy coding startup Cursor
Business Insider· 2026-04-22 07:36
合作与收购协议 - SpaceX与Cursor达成协议,获得以**600亿美元**收购该编程初创公司的权利,若未完成收购,则需为合作支付**100亿美元**[1] - 协议内容还包括,Cursor授予SpaceX在今年晚些时候以**600亿美元**收购其公司的权利,或为合作支付**100亿美元**[2] 合作战略意义 - 与Cursor的合作使SpaceX在AI编程竞赛中获得重要立足点[1] - 结合Cursor领先的产品、面向专业软件工程师的渠道,以及SpaceX的Colossus超级计算机,旨在构建全球最有用的模型[2] - 收购Cursor将使SpaceX能够更直接地与Anthropic等前沿AI实验室竞争,以争夺更强大的编程工具和AI代理[3] 资源与技术整合 - Cursor将获得SpaceX的计算资源访问权,包括由**20万块**NVIDIA GPU驱动的Colossus超级计算机[1] - SpaceX的Colossus超级计算机计算能力相当于**100万**个H100 GPU[2] - Cursor联合创始人表示,合作旨在扩大其Composer产品,目标是打造最佳的AI编程平台[2] 公司近期动态 - 此次合作是SpaceX在2月收购马斯克的人工智能初创公司xAI后的又一举措,扩大了公司在AI基础设施和软件领域的业务范围[2] - 4月初,SpaceX已秘密提交了IPO申请,为今年晚些时候的潜在公开上市做准备[2] - xAI近期领导层结构变动,包括马斯克在内的**11位**原始联合创始人在内的一批知名员工已离开[3] - 马斯克承认,xAI的聊天机器人Grok目前在编程能力上处于落后状态[3] - 据知情人士透露,xAI上周曾计划向Cursor提供算力支持[3]
Unauthorized group has gained access to Anthropic's exclusive cyber tool Mythos, report claims
TechCrunch· 2026-04-22 07:26
事件概述 - Anthropic公司新发布的企业级AI网络安全工具Mythos被未经授权的用户团体通过第三方供应商环境获得访问权限 [1][2] - 该工具被设计用于企业安全 但如果落入不当之手 可能成为强大的黑客工具 [1] 事件细节与调查进展 - 未经授权团体通过多种策略获取模型访问权限 包括利用了接受彭博社采访的某人的“访问权限” 该人目前受雇于为Anthropic服务的第三方承包商 [3] - 该团体成员是一个Discord频道的一部分 该频道专门寻找未发布的AI模型信息 [4] - 该团体自获得访问权限以来一直在定期使用Mythos 并向彭博社提供了软件截图和实时演示作为证据 [4] - Anthropic公司表示正在调查相关报告 但迄今为止未发现任何证据表明该未经授权的活动影响了公司自身的系统 [2] 访问方式与动机 - 该团体据称在Mythos公开发布的当天就获得了访问权限 [5] - 他们根据对Anthropic其他模型所用格式的了解 对模型的在线位置做出了“有根据的猜测” [5] - 消息人士称 该团体“对尝试新模型感兴趣 而不是利用它们进行破坏” [5] 产品发布背景 - Mythos作为“Project Glasswing”计划的一部分 向包括苹果在内的少数精选供应商发布 [6] - 模型的有限发布旨在防止其被恶意行为者使用 [6] - Anthropic曾表示 该工具可能会被武器化用于攻击企业安全 而非加强安全 [6] 潜在影响 - 如果属实 Mythos的未经授权使用可能给Anthropic带来麻烦 该公司提供独家发布本是为了缓解对企业安全的担忧 [8]