Workflow
量子位
icon
搜索文档
10倍加速化学推理大模型!Haven团队在隐空间思考分子式,碾压显示CoT
量子位· 2026-03-20 13:04
文章核心观点 - 由Haven团队与斯坦福大学、普林斯顿大学研究人员提出的LatentChem模型,旨在革新AI在化学领域的推理方式,其核心观点是:对于科学推理(尤其是化学),将推理过程从显式的自然语言思维链(CoT)转移到模型内部的连续隐空间中进行,可能比传统的“把步骤写出来”更有效、更符合化学推理的本质 [5][6][7] 传统思维链方法的局限性 - 在化学场景中,传统大模型通过生成大量文本思维链进行推理的方法存在“说一套,做一套”的问题,即模型能写出专业的化学分析文字,但最终生成的分子结构(如SMILES)却与分析对不上 [8][9][10][11] - 其根本原因在于化学推理本身更适合在**连续、结构化**的空间中进行,而自然语言token是**离散**的,强行将连续推理过程切割成离散文本步骤会产生“连续性-离散化鸿沟”,导致推理效率低下且描述与结果脱节 [12][13][14] LatentChem的核心机制 - 核心思路是“先在隐空间里思考,再在语言空间里回答”,将推理与表达拆分开,并非取消推理,而是更换了推理介质 [15][23] - 具体流程分为四步:1) 将分子信息编码为固定数量的ChemTokens作为软提示;2) 在隐空间生成一串承载关键推理信息的latent thought向量,而非主要依赖文本;3) 通过ChemUpdater模块,使推理每一步都能回看并更新分子表示,实现动态聚焦;4) 通过Latent Projector将隐状态映射回输入空间,形成多步连续更新的闭环 [16][17][18][19][20][21][22] 模型行为的转变与验证 - 在强化学习训练阶段,当奖励机制只关注最终结果(输出格式、答案有效性、准确性)而不鼓励写出思维链时,模型会**自发减少显式CoT**,通常只在内部完成推理后输出一个极短过渡符号(如“.”或“:”)便直接给出答案 [24][25][26][27] - 实验证明,latent thinking并非摆设:当用高斯噪声替换前面的隐状态步骤时,模型性能下降明显,表明这些隐状态承载了推理所需的关键信息 [28][29][30] - 模型学会了灵活的分配策略:当隐空间推理预算充足时,更多在内部计算;当预算被压缩时,会重新启用显式文本推理来补足能力,这说明模型学到的不是简单禁止输出,而是更优的计算资源分配 [34][35][36][37][38] 性能表现与效率提升 - 在化学基准测试中表现亮眼:在高度依赖推理的ChemCoTBench测试中,相比强大的显式CoT基线模型,取得了**高59.88%的非平局胜率** [42] - 效率大幅提升:通过将冗长的文本推理转化为紧凑的隐状态,**平均推理速度暴涨10.84倍**,在特定反应任务上效率甚至提升了近30倍 [42] - 性能数据概览:在多个基准测试中,LatentChem表现优异,例如在ChemCoTBench (All) 上达到59.88,在Mol-Instructions (All) 上达到49.88,在ChEBI-20 (Open) 上达到85.26 [43] 对AI Scientist发展的意义 - LatentChem不仅是新的化学模型,更是构建未来AI Scientist系统的关键组件,展示了让AI在**结构化的连续隐空间**中完成科学推理,再按需输出可解释结果的新范式 [44][45][46] - 这项工作挑战了传统认知,证明显式CoT可能只是推理的一种外化形式,而非推理本身,其真正意义在于将推理从文本表面收回到模型内部,为下一代科学AI奠定了更符合底层规律的计算基础 [39][42][47] - 未来的AI Scientist在执行分子设计、实验规划等复杂科学工作流时,其持续推理、探索和发现的过程可能主要发生在隐空间中,而不必将每一步思考都写出来 [48][49]
一年一度最值得关注的AI榜单来啦!申报即日启动
量子位· 2026-03-20 13:04
行业趋势与峰会背景 - 中国生成式AI行业正从“新技术”、“新工具”阶段,进入必须被企业面对的“产业深水区”,其影响范围已从内容生产扩展至研发效率、营销方式、团队协作及决策流程[1] - AI的发展已跨越一个分水岭,从论文和发布会中的概念,转变为短视频创作工具、手机助手等广泛应用的“全民参与期”,标志着行业从“观望期”迈入新阶段[16][17] - 2026年中国AIGC产业峰会将于5月在北京举办,主题为“@所有人,马上AI起来”,旨在聚焦“如何用好AI”,邀请从业者共同推动AI技术的普及与应用[17] 2026年度值得关注的AIGC企业评选 - 评选旨在发掘拥有最创新、最前瞻或最有规模落地潜力的AI企业,结果将于2026年5月的中国AIGC产业峰会上公布[1][4] - **参选条件**:公司主体或主营业务在中国;主营业务为生成式AI及相关,或已将AI广泛应用于主营业务;近一年在技术/产品、商业化方面有出色表现[7] - **评选维度**: - 技术维度:关注技术实力、研发能力与创新性,包括技术成果、研发投入、人才储备[12] - 产品维度:关注核心产品的创新性、市场适配性与用户体验,包括产品创新性、用户规模、用户体验[12] - 市场维度:关注市场表现与增长机会,包括商业模式、市场规模、营收情况、合作生态[12] - 潜力维度:关注核心团队实力与品牌潜力,包括核心团队、投融资进展、品牌影响力[12] 2026年度值得关注的AIGC产品评选 - 评选旨在发掘拥有最创新、最实用、最热门或最有应用潜力的AI产品[10] - **参选条件**:产品主要功能基于生成式AI能力;已具备成熟技术并投放市场,拥有一定用户规模;近一年有重要的技术创新或功能迭代,推动了应用落地并对行业有影响力[13] - **评选维度**: - 产品技术力:关注技术的先进性、成熟度与高效性,包括技术架构、技术成果、产品效果[13] - 产品创新力:关注功能、体验和应用场景的创新性与独特性,包括核心功能、应用场景、解决的核心痛点、趣味性[13] - 产品表现力:关注用户反馈与市场表现,包括用户规模与留存率、用户反馈、产品影响力[13] - 产品潜力:关注未来发展与市场扩展潜力,包括产品生态、市场潜力、战略规划[13] 评选参与与行业参与 - 评选报名自即日起至4月27日截止,最终结果将于5月峰会公布,企业可通过指定网页链接或扫描二维码报名[14][16] - 峰会将邀请数百万行业从业者共同见证优秀企业的荣誉[2]
量子位编辑作者招聘
量子位· 2026-03-20 13:04
公司平台概况 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年积累,在AI及前沿科技行业具有顶流影响力和广泛产业资源[1] - 截至2025年,公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上,是AI及前沿科技行业TOP1新媒体[12] 招聘岗位方向 - AI产业方向:关注基建层创新,包括芯片、AI Infra、云计算领域[6] - AI财经方向:关注AI领域创投和财报,跟踪产业链资本动向[6] - AI产品方向:关注AI在应用和硬件终端方向的进展[6] 岗位职责与要求 - AI产业方向岗位职责:跟进AI基建层新进展及核心玩家动态,对前沿论文、开源社区、技术大会报告进行大众化解讀,参与产业专家访谈及撰写案例[6][7] 任职要求:对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解,熟悉AI行业供应链与生态,能将复杂技术内容结构化表达,有技术背景者优先[11] - AI财经方向岗位职责:聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向,产出创投融资、招股书财报解析、公司战略分析等稿件,访谈投资人及创业者[11] 任职要求:对数据敏感,对财报、股权结构、战略规划感兴趣,逻辑结构强且对商业叙事敏感,热爱对话采访[11] - AI产品方向岗位职责:关注AI在终端的落地,包括软件应用和硬件产品,撰写AI应用深度评测、跟踪多终端新品发布,对话AI应用创业者及产品专家[11] 任职要求:对智能硬件及AI终端趋势敏锐,是重度AI产品体验人士,熟悉各大终端厂商业态及体验方法论,有强逻辑和结构化表达能力[11] 岗位层级与类型 - 社会招聘覆盖编辑、主笔、主编各个层级,按能力匹配岗位[4][6] - 校园招聘面向应届毕业生,接受实习且可转正[6] 员工发展与福利 - 员工可第一时间接触AI领域最新技术和产品,构建完整AI认知体系,并将AI新工具应用于工作以提升效率[6] - 员工可通过撰写独家原创内容建立个人影响力,成为AI领域意见领袖,并与行业大咖零距离接触以拓展人脉和视野[6] - 应届新人会获得主编级编辑的一对一指导,团队氛围扁平、简单、开放、多劳多得[6] - 公司提供行业TOP薪资待遇,福利包括五险一金、餐补、项目绩效、商务绩效、加班补助等[6]
龙虾也能当导演了!LibTV解锁全自动拍片,一句话从剧本干到成片
量子位· 2026-03-20 13:04
产品发布与核心创新 - LiblibAI正式推出其首款AI视频产品LibTV,这是一个全新的一站式AI内容创作社区[1] - 该产品的核心创新在于首次将人类用户和AI Agent(龙虾)作为两个平等的用户来设计,提供了“人+Agent双入口”的产品形态[4] - 产品玩法新颖,通过“无限画布+节点工作流+独家专业功能+全网顶级模型”实现一站式创作体验[12] 人类用户创作功能详解 - 创作界面是一块可以无限延伸的画布,用户双击可放置文本、图片、视频、音频、脚本五种基础节点[13][17] - 节点之间可自由连接,上游输出成为下游输入,用户可像搭积木一样搭建专属创作流程,实现多素材协同创作[19] - 平台内置超过20种专业实用功能,其中多机位九宫格、剧情推演四宫格、25宫格连贯分镜、电影级光影校正、角色三视图生成等功能被描述为行业独有[5][34][35] - 图片生成器内置专业摄像机控制功能,可自由选择相机类型、更换镜头、调节焦距和光圈[25] - 生成的图像支持一键高清、智能扩图、局部重绘、擦除、抠图、多角度生成、打光调节等精细化编辑功能[27][29] - 独有的“标记”功能允许用户精准标记不同图中的元素并融合生成,例如让图1中的人手握图2中的香水[31][32] - 脚本节点支持三种生成模式:剧本生成分镜脚本、视频参考生成分镜脚本、角色生成分镜脚本[50] - 生成的脚本可批量生成对应的分镜图像,并能一键转换成动态视频分镜[52] - 画布设计使用户无需在不同工具间反复切换,并能将创作流程“打组”为可复用的工作流模板,便于高效复刻爆款风格[56][57][59] AI Agent自动创作功能 - LibTV通过OpenClaw解锁了“自动挡拍片模式”,用户只需给AI Agent(龙虾)一句话指令,它便能自动调用LibTV的Skill完成从理解需求到成片交付的全过程[61][62][63] - 以生成“龟兔赛跑”短片为例,AI Agent自动完成了剧本创作、角色视图生成、6个分镜设计、视频生成及配乐剪辑,最终返回成片和项目画布链接[64][65][66][72][76][77] - 如果AI生成的视频不符合预期,用户可手动对画布中的每个节点进行编辑,然后让其重新生成[79] 公司背景与竞争优势 - LiblibAI是一家成立于2023年的年轻公司,发展势头迅猛,于去年10月完成了1.3亿美元B轮融资,这是国内AI应用赛道迄今为止最大的一笔融资[90] - 公司已成长为中国最大的多模态模型与创作社区,平台聚集了超过2000万创作者,拥有超10万款原创风格模型[92] - 公司在产品形态探索上领先,于2025年率先在设计领域推出了垂直Agent产品“星流”,为LibTV接入Agent能力完成了技术验证与实践[92][93] - LibTV的推出标志着公司定位从“图片生成/模型社区”转向综合性的AI创作平台[94] - 产品定价策略具有明显竞争力,年卡最低可至39折,部分模型享约6折叠加优惠,综合折扣低至2折,会员SKU价格较竞品低76%,模型积分定价可比竞品低92%[96]
AI屠刀下一站“Vibe设计”!谷歌一个产品把合作伙伴Figma干崩了
量子位· 2026-03-20 13:04
谷歌Stitch发布Vibe Design功能 - 谷歌于3月18日宣布其AI设计工具Stitch支持“Vibe Design”功能,用户可通过语音指令直接生成UI和前端界面,无需使用键盘进行传统设计操作 [3][4] - 该功能允许用户用自然语言描述需求,例如要求生成不同菜单选项、配色方案或指定参考风格(如Airbnb),工具即可直接输出设计结果 [14][16] Stitch工具的五大能力升级 - **AI原生画布**:对用户界面进行全面重新设计,采用基于节点的无限画布,可同时容纳图像、代码和产品需求文档,支持并行处理多个想法,并新增浅色模式以改善编辑对比度 [19][20][22] - **升级Agent能力**:Agent能理解画布上的所有上下文,通过自然语言指令执行任务,并支持在同一画布上混合使用移动与桌面屏幕进行跨屏幕操作 [23][24] - **语音实时交互**:支持通过语音提出需求并与工具实时交互,获得点评或改进建议,该功能能“看见”画布内容并处理需求,实现免手动操作,目前为预览功能并将快速迭代 [25][26][27] - **即时原型**:点击“播放”按钮可将静态屏幕瞬间转换为交互式原型,工具能自动评估屏幕顺序、添加连接,或根据点击位置生成逻辑上的下一个屏幕,支持设计过渡效果并展示不同状态视图 [28][29][31] - **设计系统一致性**:每个新项目自动从统一的设计系统开始,一次编辑即可同步更新所有关联屏幕,支持通过DESIGN.md文件导出或导入设计规则,确保项目间设计规范一致并减少信息丢失 [32][33][34] 对Figma及软件行业的市场冲击 - 谷歌Stitch发布后,Figma股价在周三当天暴跌8%,周四续跌约5%,两天内累计跌幅约13% [5] - 自2026年初以来,Figma股价已累计下跌约35%,与软件行业整体下滑趋势一致,同期Adobe股价也下跌约3% [8][9] - Figma在2025年7月于纽交所IPO,2025年全年收入达10.6亿美元,同比增长41% [36] 谷歌相较于Figma的竞争优势 - **免费策略**:谷歌目前未对Stitch收费,免费策略本身构成竞争武器,未来若收费则意味着谷歌试图掌控更多产品设计流程并将用户留在其生态系统内 [41][42] - **强大分发渠道**:谷歌拥有Gmail、Docs、Drive等产品及数亿企业用户生态,Stitch可一键集成并触达Figma难以企及的用户群,显著降低企业转换成本 [43][44] - **企业套餐捆绑**:谷歌可将其Workspace企业套餐与Stitch打包销售,用户可能在购买Workspace时顺手使用Stitch [45] - 谷歌无需在技术上完全碾压Figma,只需产品“够用”即可凭借其生态系统侵蚀市场份额 [46] 行业合作背景与技术迭代 - 2025年10月,谷歌云与Figma曾宣布扩大合作,计划将更多生成式AI技术集成到Figma平台中 [12][47] - Figma自身的Make工具也支持通过输入文字生成或修改App设计,但技术发展迅速,其功能已落后于直接通过语音修改设计的新方式 [49][50][51] 行业高层对AI冲击的回应 - 行业人士认为软件行业不会消亡,但将面临变革,包括软件创建方式、使用方式、内容获取方式及对一致用户体验的追求都将发生改变 [53][56][57] - 有观点指出,市场因AI替代担忧而对一批软件公司股价施加巨大压力,但这被认为是“世界上最不合逻辑的事情”,时间将证明一切 [54][55]
Cursor自研模型反超Opus 4.6!价格脚踝斩,氛围编程沸腾了
量子位· 2026-03-20 11:52
文章核心观点 - Cursor公司发布其最新编程模型Composer 2,该模型在多项基准测试上的性能超越了Claude Opus 4.6,同时价格实现了大幅下降,即“脚踝斩”[1][3][4] - 公司能够在行业普遍涨价的背景下实现降价,核心在于引入了一种名为“自我总结”的新强化学习方法,该方法通过训练使模型具备主动总结长任务上下文的能力,从而在提升性能的同时显著降低了成本[6][21][22] 模型性能与定价 - **性能表现**:Composer 2在CursorBench、Terminal-Bench 2.0和SWE-bench Multilingual等所有衡量基准上均取得大幅提升[11] - 在Terminal-Bench 2.0上的水平已跃居GPT-5.4和Claude Opus 4.6之间[12] - 具体基准分数:CursorBench为61.3,Terminal-Bench 2.0为61.7,SWE-bench Multilingual为73.7[15] - **定价策略**:Composer 2的价格远低于竞争对手,实现了“脚踝斩”[16] - 标准版定价:输入价格为0.5美元/百万tokens(约3.5元人民币),输出价格为2.5美元/百万tokens(约17.2元人民币)[15] - 快速变体Composer 2 Fast定价:输入为1.5美元/百万tokens(约10.3元人民币),输出为7.5美元/百万tokens(约51.7元人民币)[19] - **模型迭代速度**:从Composer 1到Composer 2的进化速度不断加快,性能提升显著[14][15] 核心技术:自我总结强化学习 - **解决的核心问题**:解决AI编程助手在处理长链条、复杂任务时,因上下文窗口有限而容易“掉链子”或遗忘关键信息的问题[25][26][27] - **方法原理**:该方法不是推理技巧,而是通过强化学习训练出来的能力[22][34] - 模型在任务执行过程中,会主动暂停并生成“阶段总结”(即“做笔记”),将关键信息压缩后传递至后续步骤[23][31] - 在强化学习过程中,总结能力被计入奖励函数,使模型学会区分并保留关键信息[35] - **技术优势**:相比传统的上下文压缩方法(如摘要法或滑动窗口),Cursor的新方法更高效、更准确[28][29] - 在高难度软件工程任务上,传统摘要法需要数千tokens的提示词,压缩后平均仍需5000+ tokens[37] - Composer方法仅需一句简单提示词(如“Please summarize the conversation”),压缩后输出平均仅1000个tokens[38] - 效果对比:Composer的token用量仅为传统方法的1/5,且压缩带来的错误减少了约50%[39] - **实际效果验证**:模型成功解决了经典长链条难题——将Doom游戏移植到MIPS架构[43][44] - 经过170轮交互,模型将超过10万tokens的上下文总结压缩至1000个,并最终找到精确解法[45] 公司战略与行业背景 - **行业背景**:随着大模型(文中喻为“龙虾”)的爆火,全球大模型Token消耗量呈指数级增长,导致年初以来国内外云厂商和大模型公司集体涨价[6][9] - **公司定位与目标**:Cursor在此背景下,将发展重心明确转向“性价比”[9][10] - 公司CEO表示,Cursor既不是纯粹的应用程序开发商,也不是纯粹的模型提供商,具有双重身份[48] - **产品迭代节奏**:公司发展节奏很快,在发布Composer 2后,研究员已开始放出Composer 3的消息[47]
月下载破亿工具链被OpenAI打包收购!Python包管理神器uv现在姓O了
量子位· 2026-03-20 11:52
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI大手一挥,Python包管理神器uv要被收购了。 OpenAI与uv开发商Astral同时官宣,已经 达成了收购协议 。 对于这个协议,Astral创始人兼CEO Charlie Marsh表示,他创立公司的目标就是提高编程效率,创造出"能够彻底改变Python使用体验的 工具"。 Marsh认为,加入OpenAI,就是向着这个目标迈出的重要一步。 并入CodeX团队,继续支持开源 OpenAI和Astral的这笔交易,具体金额暂未披露,但已经引起了开发者社区的广泛关注。 OpenAI表示,收购完成后 会继续为这些开源产品提供支持 。 Astral创始人Charlie Marsh也确认,他们会坚持目前的开源路线,和整个Python社区一起把工具做得更好。 在保留原有开源项目的基础上,双方也透露了合并后的技术整合方向。 加入Codex团队后,Astral会配合OpenAI探索更深度的功能结合。 大家最关心的问题,就是Astral手里那些高频使用的开源工具,未来会何去何从。 根据双方公布的安排,在收购交易正式完成并拿到监管审批前,OpenAI和A ...
全网都在扒的小米MiMo团队,几乎被“北大学子”承包了
量子位· 2026-03-20 08:18
小米MiMo团队的管理与绩效 - 团队负责人罗福莉对团队管理提出思考,暗示对Agent对话次数有高要求,每天少于100次可能面临离职[1][2] - 团队的管理风格和绩效要求引发外界广泛关注[3] 小米MiMo模型的市场表现与行业地位 - 小米MiMo-V2-Pro模型在OpenRouter调用量榜单上排名第一[1] - 从发布首个推理大模型MiMo-7B至今不到一年,模型能力曲线陡升,已进入全球一线梯队[5] - 与Meta超级智能实验室近期模型跳票、性能不及预期的表现形成对比[7] 小米MiMo团队的核心成员构成 - 团队核心成员共21人,包括Bingquan Xia、Bowen Shen、Cici、Dawei Zhu、Di Zhang、Gang Wang、Hailin Zhang、Huaqiu Liu、Jiebao Xiao、Jinhao Dong、Liang Zhao、Peidian Li、Peng Wang、Shihua Yu、Shimao Chen、Weikun Wang、Wenhan Ma、Xiangwei Deng、Yi Huang、Yifan Song、Zihan Jiang[14] - 肖邦骏(Bangjun Xiao)是MiMo-V2-Flash的首作,本博均就读于北京大学,导师为北京大学人工智能研究院副院长黄罡教授,研究方向为边缘计算和联邦学习[16][18][19] - Bingquan Xia是MiMo-V2-Flash核心作者之一,中科院计算技术研究所2021届研究生,有相关论文发表[20][21] - 马文晗(Wenhan Ma)自2025年9月起在北京大学计算机科学学院攻读博士,导师为穗志方教授,研究方向为大语言模型推理能力,本科毕业于北京大学,是罗福莉的同门师弟[23][24][25] - 朱大为(Dawei Zhu)是北京大学三年级博士生,导师为李素建教授,研究方向为长上下文建模,对智能体、对齐及多模态模型感兴趣[26][28] - 董谨豪是中国人民大学信息学院讲师,小米LLM核心团队技术顾问,负责代码相关LLM开发,主导建立了人大-小米基础大语言模型联合重点实验室[32][34] - 张海林专注于AI基础设施建设,为MiMo系列打造强化学习基础设施,2025年获北京大学计算机科学博士学位[36][37] 小米MiMo团队的背景与成功因素 - 团队具有浓厚的北京大学背景,核心成员与技术骨干多来自北京大学计算机学院,这为团队提供了持续的人才输送和科研想法快速落地的渠道[41][42][43] - 罗福莉是团队与北大学术背景之间的重要桥梁[44] - 团队技术理念受小米公司产品基因驱动,强调“性价比”和“互联网生态”思维[46] - 在MiMo模型上体现为7B参数规模、开源策略及端侧部署方向,反映了公司的战略布局和生态思路[47] - 团队成功是北大科研背景、核心成员技术经验以及小米产品与工程基因共同作用的结果[48] 行业关联与人物关系 - 前阿里通义实验室Qwen大模型负责人林俊旸是罗福莉的师兄,两人硕士阶段均在北京大学从事自然语言处理研究,学术路径同源,先后加入阿里达摩院[49][50][51] - 林俊旸曾负责Qwen模型,罗福莉带领MiMo模型,两人是国内头部模型线的关键人物,成长于同一套学术和产业体系[52][53]
前荣耀AI实验室主任带队:用“超级大脑”接管农场,24小时不打烊
量子位· 2026-03-20 08:18
公司核心产品:AlphaFarm系统 - **全球首个自主进化决策无人农场系统**,旨在打造能够独立思考并主导农场各个环节的智慧大脑[1][6][13] - **系统具备100%自主决策执行率,支持24×7不间断实时监控**[2] - **系统由四大核心“黑科技”构成**:AlphaFarm智脑(农业大模型)、IDRCO自主进化引擎、光谱巡检系统、借鉴OpenClaw的协同引擎[15][19][26][28] 产品技术细节与核心功能 - **AlphaFarm智脑**:基于自研的AgriLLM农业大语言模型构建,底层积累亿级农业语料,通过混合RAG技术接入海量结构化知识块,知识库已迭代至v3.0[15][18] - **自主进化引擎(IDRCO)**:由数据采集、模型训练、决策优化、反馈学习四个环节构成闭环,支持六大高级决策模块,包括抢收调度、销售时机、成本优化等[16][20][24] - **光谱巡检系统**:支持12+光谱波段的多光谱遥感分析,可输出土壤湿度、NDVI植被指数等四类关键信息,识别准确率大于92%,处方图生成小于30秒[26][27][30] - **多机协同引擎**:借鉴OpenClaw思想,通过CNP竞标机制分配任务,系统边缘响应延迟小于50ms,可用性达99.9%[32][34] 产品性能验证与评估 - **自主研发MAJE六维评估体系**,涵盖诊断准确性、方案完整性等六个维度[36] - **构建AgriDecBench-2200专业评测集**,包含2200道高难度农业决策题,覆盖20个农业场景[37] - **在评测中综合得分为9.02分(满分10分)**,在农业垂直领域显著领先于国内外知名通用大模型[38] - **区域适应性维度得分高达9.45分**,相比GPT-4o的7.58分领先1.87分,凸显其高度本地化决策能力[40][41] 团队背景与核心优势 - **创始人汤泳**:拥有20余年AI经验,曾任荣耀南京研究所模式识别实验室主任、富士通全球研发中心首席研究员[5][12] - **联合创始人奚波**:来自清华大学与央企管理层[5] - **核心团队包括“全球前2%顶尖科学家”**,如高广谓和郭景华教授,以及来自北京大学、江苏大学的L4级自动驾驶与机器人专家团[5][44] - **团队兼具顶级AI研究能力、真实工程落地经验及深厚农业领域知识**,是农业AI落地最难跨越的壁垒[45] 行业背景与市场需求 - **中国拥有18亿亩耕地**,但面临劳动力稀缺、种地难度高的困境[7][51] - **农业决策极其复杂**,需要整合土壤、天气、虫害、市场等多维度知识,传统数字化方案仅能采集数据,无法替代决策[8][9][11] - **公司旨在解决的核心问题是**:在劳动力稀缺背景下,如何打造能独立思考的智慧大脑,让AI主导农场全环节[6] 产品价值主张与商业影响 - **推动农业从“数字化”向“AI自主决策”的范式转移**,目标是用AI替代人的决策,将人从执行层解放[46][47] - **宣称能带来显著的商业价值**:人工成本降低60%以上,作业效率提升3-5倍,农资成本节省20-30%,产量提升10-15%[49] - **最终目标是让系统落地到中国的18亿亩耕地**,重写农业生产效率边界[50][51]
老黄怒怼玩家根本不懂AI!英伟达新AI功能遭全网抵制,游戏圈炸锅了
量子位· 2026-03-19 18:33
DLSS 5技术发布与市场反应 - 英伟达在GTC 2026大会上发布新一代图形技术DLSS 5,但遭到游戏玩家群体的集体抵制[1] - 玩家批评该技术将游戏角色(如《生化危机:安魂曲》中的格蕾丝、《星空》中的Marika Boros)变成了统一的“AI网红脸”,认为这破坏了艺术家的原创设计[2][4][24][31] - 英伟达CEO黄仁勋将DLSS 5称为图形领域的“GPT时刻”,并强调该技术不会改变艺术控制,开发者可进行微调以匹配其风格[11][13][42] DLSS 5的技术原理与演进 - DLSS 5的核心是“实时神经渲染模型”,它利用生成式AI为游戏场景注入逼真的光照和材质,与源3D内容紧密关联[17] - 该技术从DLSS 1.0至4.0的“超分辨率”和“帧生成”(即提升性能)演进为“重绘画面”,实现了从辅助工具到“共同创作者”的转变[15][16][22][23] - 模型经过端到端训练,能理解复杂场景语义(如人物、头发、织物)和环境光照条件,仅需分析单帧图像即可完成,最高支持4K分辨率实时运行[17][18][20] - 公司称DLSS 5是自2018年推出实时光线追踪以来在计算机图形领域的“最重大突破”[21] 行业支持与开发者控制权 - DLSS 5已获得卡普空、贝塞斯达、育碧、华纳兄弟游戏等业内主要发行商和开发商的支持[57] - 首批支持的游戏包括《刺客信条:暗影》、《霍格沃茨之遗》、《幻影之刃:零》、《生化危机:安魂曲》、《星空》、《上古卷轴4:湮没重制版》等[56] - 英伟达及合作方(如贝塞斯达)强调,开发者对DLSS 5的效果拥有“完全的艺术控制权”,玩家也可在设置中选择开启或关闭该功能[45][48][49] - 技术计划于今年秋季推出[56] 艺术界与社区的争议 - 艺术家和玩家社区强烈反对,认为AI用“审美平均值”覆盖了独特的艺术设计,是对创作者的不尊重[33][41] - 社区创造了新词“Sloptracing”(结合AI slop与Ray Tracing)和“slopium”来嘲讽该技术生成的“低质内容”[33][38] - 批评者指出,即便有控制权,AI修改(如使角色嘴唇更丰满、颧骨更突出)仍体现了对特定审美标准的偏好,可能偏离原始3D模型设计[50][52][53] - 存在担忧认为,游戏开发者对画面的决定权可能因AI的覆盖而减小,从而削弱艺术家的价值[54][55]