Workflow
量子位
icon
搜索文档
哈佛女生AI电商创业,19岁华人,刚获投百万美元
量子位· 2025-10-28 16:04
公司概况 - 19岁华人女生Christine Zhang从哈佛休学创办Veil公司,专注为电商卖家提供AI优化平台[1][2] - 公司成立不到三个月完成种子轮融资,获得100万美元资金[2][16] - 融资资金用于扩充团队与产品打磨,目前团队规模为6人[17] - 公司已拥有近500家客户,客户在1-2周内能看到AI可见度平均提升约67%的效果[14] 产品与技术 - Veil通过GEO(生成式引擎优化)和AEO(问答引擎优化)技术优化商品介绍,使其更易被AI识别[6][8] - 具体优化方案包括增加结构化FAQ页面、优化关键词布局、使用JSON-LD标注产品核心信息[9][10][11][12] - 优化后商户获客率显著提升,AI可见度平均提升约67%[14] - 产品解决长尾商品被市场忽略的痛点,让商品更容易出现在ChatGPT、Gemini等AI搜索结果中[6][43] 行业趋势 - AI正成为新流量入口,今年6月AI为全球前1000网站带来11.3亿次引荐,同比增长357%[22][23] - AI推荐在用户参与度方面优于传统流量,零售网站跳出率降低23%,页面停留时间延长41%[23] - GEO(生成式引擎优化)类似传统SEO,关注提高被AI引用概率而非网页排名[34][36] - 研究显示产品页面针对AI优化后曝光度可提升30%-40%[42] 创始人背景 - Christine Zhang为哈佛大学计算机科学与统计学专业学生,具有机器学习项目开发经验[55][58] - 联合创始人Julia Hudson同为哈佛计算机科学专业学生,与Christine共同休学创业[73][75] - Christine中学时期曾开发公共卫生类网络应用并获得国际创新挑战奖[52]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-10-28 16:04
大会核心主题与背景 - 当前正迈入人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴 [1][2] - 智能技术跨越产业、学科和场景边界,数字世界与物理世界的界限正逐步模糊并融合,催生出全新生态和机遇 [3][4] - 人工智能正成为基础设施的一部分,企业、技术与社会之间的连接与共生是推动发展的核心动力 [5][7] - 大会以“共生无界,智启未来”为主题,探讨AI作为驱动社会演进的核心动能,其本质是连接、共生、重塑和跃迁 [7][14] MEET2026智能未来大会概况 - 今年是MEET智能未来大会的第七年,是年度影响力科技商业峰会 [9] - 过往大会曾吸引李开复、张亚勤等产业领袖,倪光南、谭建荣等多位院士,以及百度、阿里、腾讯、华为、京东等科技行业领军者参与 [9] - 大会每年吸引上千名科技从业者现场参与,百万观众线上围观,并获得近百家合作媒体联合曝光,已成为智能科技行业的年度风向标 [12] - 本届大会将聚焦智能科技产业,邀请技术、产业、投资领域代表,探讨人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿话题 [13] - 大会地点设在中国北京,参会报名通道即将开启 [28] 2025人工智能年度榜单 - 量子位发起的“人工智能年度榜单”是AI行业最具影响力榜单之一,旨在发现引领变革的探索者 [16] - 榜单从公司、产品、人物三大维度评选五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [17][18][19] - 评选报名从即日起至2025年11月17日截止 [20] 2025年度AI十大趋势报告 - 依照惯例,量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》 [23] - 报告将结合技术成熟度、落地现状和潜在价值,提名释放巨大潜力的十大AI趋势,并进行深入分析,提名代表机构和最佳案例 [24]
超越英伟达Describe Anything!中科院 & 字节联合提出「GAR」,为DeepSeek-OCR添砖加瓦
量子位· 2025-10-28 13:12
文章核心观点 - 中科院与字节联合提出的Grasp Any Region (GAR) 模型,通过创新的“细粒度+全局上下文”架构设计,在区域级多模态大模型领域实现了突破性进展,为构建自然图像的Dense Caption和视觉信息压缩提供了新的可行路径 [2][4][39][80] 技术能力与创新 - GAR模型具备三种核心能力:精准描述用户指定区域、建模多个区域间关系、进行复杂的组合推理(如非实体判别)[5][7] - 模型采用两大创新组件:简洁高效的提示编码方案,以及RoI-Aligned Feature Replay机制,实现了局部细节与全局上下文的平衡 [39][40][42][43][48][53] - 该技术方案有效解决了传统Region MLLMs在局部细节与全局信息之间的两难困境,避免了如Osprey模型的局部细节丢失和DAM模型的全局信息丢失问题 [15][16][18] 性能表现与基准测试 - 在GAR-Bench-VQA测试集上,GAR-8B模型取得59.9分的综合成绩,表现超过GPT-4o,直逼最强推理模型o3和Gemini-2.5-Pro [70][71] - GAR-1B模型以50.6分的综合得分,在参数量远小于其他模型的情况下,性能超过了InternVL3-78B等大规模公开模型,凸显了方法在效率与效果上的优势 [71][72] - 在GAR-Bench-Cap测试集上,GAR-1B与GAR-8B分别取得57.5分和62.2分的最高综合成绩,表现超过Gemini-2.5-Pro等性能强劲的私有模型 [73][74] - 在Ferret-Bench与MDVP-Bench的零样本测试中,GAR模型在所有细分类别均位列第一,其中GAR-8B在自然图像任务中取得178.6分,大幅领先竞品 [75][76] 应用潜力与迁移能力 - GAR的能力可zero-shot迁移至视频任务,在VideoRefer-Bench测试中,GAR-8B性能超过DAM-8B,甚至优于in-domain训练的VideoRefer-7B模型 [78][79] - 该模型可作为Data-engine工具,为多模态理解模型提供精细的图像/视频描述用于预训练,提升文生图/视频模型对复杂指令的遵循能力,并为细粒度编辑模型提供精准的区域描述 [81][82][83] - GAR可天然作为Reward Model,在多模态理解任务的post-training阶段提供准确的区域理解奖励信号 [84]
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
量子位· 2025-10-28 13:12
技术趋势:无VAE潜在扩散模型的兴起 - 图像生成领域出现技术范式转变,VAE(变分自编码器)正被无VAE潜在扩散模型替代 [1] - 清华与快手可灵团队联合提出名为SVG的无VAE潜在扩散模型,标志着技术路线的演进 [1] SVG模型的核心技术创新 - 采用“语义+细节双分支+分布对齐”的架构,从根本上解决VAE的语义纠缠缺陷 [4] - 语义纠缠指传统VAE将不同语义特征置于同一潜空间,导致调整单一数值(如猫的颜色)会引发连锁反应(如体型、表情改变) [4] - 以DINOv3预训练模型作为语义提取器,确保不同类别(如猫、狗)的特征边界清晰可辨 [14] - 专门设计轻量级残差编码器补充DINOv3忽略的颜色、纹理等高频细节信息 [14] - 通过分布对齐机制调整细节特征,使其数值分布与DINOv3语义特征匹配,避免细节扰乱语义结构 [15][16] - 消融实验证明分布对齐机制至关重要,移除后生成图像的FID值从6.12升至9.03,生成质量大幅下滑 [16] SVG模型的性能优势 - 在训练效率上实现62倍提升,在生成速度上实现35倍提升 [3] - 在ImageNet 256×256数据集上,SVG-XL模型仅训练80个epoch,无分类器引导时FID达6.57,远超同规模基于VAE的SiT-XL(FID 22.58) [18] - 当训练延长至1400个epoch,SVG-XL的FID可低至1.92,接近当前顶级生成模型水平 [18][19] - 在推理效率上,5步采样时SVG-XL的gFID为12.26,显著优于SiT-XL(SD-VAE)的69.38和SiT-XL(VA-VAE)的74.46,表明其在较少采样步数下即可达到较好生成质量 [19][20] - 10步采样时,SVG-XL的gFID为9.39(无CFG)和6.49(有CFG),优于对比模型 [20] SVG模型的多任务通用性 - 模型构建的特征空间具备多任务通用能力,不仅用于图像生成,还可直接用于图像分类、语义分割、深度估计等视觉任务,且无需微调编码器 [22] - 在ImageNet-1K图像分类任务中Top-1精度达到81.8%,与原始DINOv3(81.71%)几乎一致 [22][23] - 在ADE20K语义分割任务中mIoU达46.51%,接近专门的分割模型 [22][23] 技术路线对比:SVG与RAE - SVG技术路线旨在兼顾生成与多任务通用,而谢赛宁团队的RAE技术路线则极致聚焦于图像生成性能 [4][11] - RAE直接复用DINOv2、MAE等预训练编码器,不修改编码器结构,仅优化解码器来还原图像细节,并针对性改造扩散模型架构 [9][10] - SVG则主动构建语义与细节融合的特征空间,而非直接复用预训练特征 [12]
华为世界模型来了!单卡30分钟生成272㎡场景
量子位· 2025-10-28 13:12
技术突破 - 华为联合上海交通大学、华中科技大学推出世界模型WorldGrow,可生成1800㎡超大室内场景(19x39块),单卡30分钟生成272㎡ [1] - 生成场景具备连贯几何拓扑和照片级真实感外观,虚拟人可在复杂空间布局中自主规划路径且不迷路 [3][4] - 技术解决了传统方法视角转换导致的物体变形(如沙发腿歪斜)、纹理断裂、扩展性差及布局逻辑混乱(如冰箱塞进卧室)等问题 [7] 核心技术流程 - 数据精准预处理:从3D-FRONT数据集提取优质样本,通过Blender进行场景切片和区块切分,利用occupancy检测确保区块内容密度≥95%,并构建粗/细两级数据集分别控制宏观布局与纹理细节 [10] - 3D块补全机制:通过结构生成器确定3D框架,latent生成器重建结构化潜变量特征,结合带噪潜变量、二进制掩码等输入消除边缘断裂和纹理错位,实现无缝拼接 [11] - 粗到精生成策略:粗结构模型先规划窗户朝向、走廊连接等整体布局,再通过三线性插值上采样匹配细块分辨率,由细结构生成器补全家具纹理等细节 [12] 性能优势 - 在3D-FRONT数据集上,几何重建指标MMD(0.97×10²)、COV(51.82%)达SOTA水平,FID指标低至7.52,显著优于SynCity(FID 51.97)、BlockFusion等主流方法 [15][16][17] - 单张A100显卡30分钟生成10×10区块(约272㎡),速度达同类技术6倍,扩展至7×7块超大场景时边缘质量仍保持稳定 [16]
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-28 13:12
评选活动概述 - 正式启动2025人工智能年度榜单评选报名 旨在让从业者感受智能浪潮跃迁并给予同行掌声与鼓舞 [1] - 评选从企业、产品、人物三大维度设立五类奖项 共同见证年度之星并点亮未来方向 [2] - 评选报名从即日起开始 截至2025年11月17日 结果将在MEET2026智能未来大会上公布 [22] 企业类奖项评选标准 - 年度领航企业评选针对中国AI领域最具综合实力企业 参选需满足注册地在中国或主营业务面向中国市场等四项条件 [5][6] - 年度潜力创业公司聚焦最具投资价值和发展潜力的AI创业公司 参选需满足公司未上市且拥有AI产品服务落地等条件 [9][12] - 领航企业评选标准涵盖业务能力、技术能力、资本能力及其他综合能力四大方面 [11] - 潜力创业公司评选标准包括业务潜力、技术创新、资本能力及其他综合能力 [12] 产品与解决方案类奖项评选标准 - 年度杰出产品评选要求产品以AI技术为核心特色且已投入市场 近一年需完成重要技术创新或迭代升级 [17] - 年度杰出解决方案聚焦AI在不同行业场景的典型应用 需在技术融合应用创新或商业模式上有显著突破 [18] - 杰出产品评选标准包括产品力与技术力、落地情况及其他综合能力 [17] - 杰出解决方案评选标准涵盖创新性、落地情况及其他综合能力 [18] 人物类奖项及大会信息 - 年度焦点人物评选面向国籍为中国或所属公司在中国的创始团队成员或核心高管 近一年需在AI技术或商业化方面取得突破 [23] - 焦点人物评选标准包括企业情况、个人能力及其他综合能力 科研院所中具同等影响力的个人也可参与 [23][19] - MEET2026智能未来大会以共生无界智启未来为主题 将邀请科技产业学术领域领军人物探讨AI+等前沿话题 [25][26] - 大会每年吸引上千名科技从业者参与 百万观众线上围观 近百家合作媒体联合曝光 已成为智能科技行业年度风向标 [26]
两大数学奖项同时颁给王虹!北大三校友包揽“华人菲尔兹”
量子位· 2025-10-28 13:12
王虹获奖与学术成就 - 王虹于2025年同日荣获两项重量级数学大奖:国际数学界的塞勒姆奖和世界华人数学家大会数学奖金奖 [1][2][5] - 塞勒姆奖被视为菲尔兹奖风向标,从1968年至2024年的56位获奖者中诞生了10位菲尔兹奖得主,例如陶哲轩在2000年获塞勒姆奖后于2006年获得菲尔兹奖 [2] - 王虹获得塞勒姆奖的理由是"在解决调和分析和几何测度论中的主要开放问题中所发挥的作用",其主攻方向在多个世纪难题上取得突破性进展 [17][18] - 王虹与哥伦比亚大学Joshua Zahl教授合作,在一篇长达127页的论文中宣布证明了困扰数学界多年的挂谷猜想,该成果使其被视为最有机会获得菲尔兹奖的青年数学家之一 [20][28] - 王虹在傅里叶限制猜想、Falconer距离集猜想等问题上做出重要贡献,仅2025年就在数学四大期刊上发表了两篇文章 [23] - 王虹现任加州大学洛杉矶分校助理教授,同时是法国高等科学研究所的终身教授,她是该所历史上首位女性终身教授,也是数学领域第14位终身教授,此前13位终身教授中有8位获得过菲尔兹奖 [15][16] 邓煜获奖与学术成就 - 邓煜与王虹、袁新意共同获得2025年世界华人数学家大会数学奖金奖,三位获奖者均为北京大学数学科学学院校友 [5][30][55] - 邓煜现任芝加哥大学教授,曾荣获普特南大学生竞赛最高奖Putnam Fellow和国际数学奥林匹克竞赛金牌,并获得斯隆研究奖学金等荣誉 [32] - 邓煜与合作者在偏微分方程与数学物理领域取得系列重要成果,其2017年发表的论文《Global solutions of the gravity-capillary water-wave system in three dimensions》被引用131次 [33] - 邓煜在2024年与马骁、Zaher Hani共同突破了希尔伯特第六问题,该问题是David Hilbert于1900年提出的23个数学难题之一,困扰数学界一百多年 [35][37] - 解决希尔伯特第六问题的路径是通过稀薄气体硬球模型和Boltzmann方程实现从粒子系统到气体动力学再到流体力学的数学严谨推导链,最终推导出可压缩流体的欧拉方程以及Navier-Stokes-Fourier方程 [38] 袁新意获奖与学术成就 - 袁新意与王虹、邓煜共同获得2025年世界华人数学家大会数学奖金奖,是北京大学数学"黄金一代"成员 [5][30][41] - 袁新意于2000年获得国际数学奥林匹克竞赛金牌,现任北京大学北京国际数学研究中心教授 [43][55] - 袁新意研究集中在Arakelov几何、代数动力学、丢番图几何等领域,2022年与谢俊逸合作证明了几何Bogomolov猜想的所有情形,2024年独自研究证明了一个关于曲线的统一Bogomolov型定理 [45] - 袁新意曾作为首位中国人获得美国克雷研究所研究奖学金,并在2022年获得科学探索奖 [46] - 袁新意与张伟、恽之玮、朱歆文在数学界有"数学界四小天鹅"美誉,与导师张寿武一起将库达拉猜想中的模性问题推广到全实域,建立了Waldspurger公式在算术代数几何下的模拟 [48] 北京大学数学人才培养 - 三位ICCM金奖获得者王虹、邓煜、袁新意均毕业于北京大学数学科学学院,其中王虹和邓煜同为07级校友 [5][30][55] - 三位获奖者均为2026年国际数学家大会的45分钟报告人,邓煜和袁新意均为国际数学奥林匹克竞赛金牌得主 [55] - 北京大学数学"黄金一代"包括袁新意、刘若川、恽之玮、宋诗畅、肖梁和许晨阳等00级左右毕业生,他们包揽了2018年、2019年、2020年的科学突破奖新视野数学奖,以及拉马努金奖、斯隆研究奖等一系列国际数学界重量级奖项 [51] - "黄金一代"成员之间形成紧密合作网络,彼此扶持共同在数学领域取得成就,据张寿武评价,他们之间不是相互竞争者而是合作者,有问题可立即咨询同领域高手 [52][53]
全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币
量子位· 2025-10-28 09:18
模型性能与排名 - 在第三方评测机构Artificial Analysis的测试中,Minimax M2以61分获得开源模型第一,总排名第五[2][14] - 测试涵盖10个热门数据集,包括MMLU Pro、GPQA Diamond、人类最后测试、LiveCodeBench等[15] - 在具体数据集表现上,M2在AIME25得分为78,MMLU-Pro得分为82,GPQA-Diamond得分为78,LiveCodeBench得分为83[16] 技术架构与特点 - M2是一个稀疏度较高的MoE模型,总参数量230B,激活参数量仅为10B,网友称10B激活参数运行起来会非常快[9][10] - 模型采用交错的思维格式,使其能够规划和验证跨多个对话的操作步骤,这对Agent推理至关重要[11] - 技术细节显示M2使用全注意力机制,未采用滑动窗口注意力或Lightning Attention,因测试发现这些会造成性能损失[45][46][51] 成本与效率优势 - M2的推理速度是Claude 3.5 Sonnet的两倍,API价格仅为Claude 3.5 Sonnet的8%[5][6] - 具体定价为输入Token每百万0.3美元/2.1人民币,输出Token每百万1.2美元/8.4人民币[16] - 在线推理服务速度可达每秒100 Token,以速度衡量的性价比表现突出[20] 智能体与编程能力 - 模型专为智能体和编程而生,表现出对复杂、长链工具调用任务的出色规划和稳定执行能力[4][12] - 支持Shell、浏览器、Python代码解释器和各种MCP工具的调用,在工具使用和深度搜索方面不逊于海外顶尖模型[12] - 在智能体、全站开发和Terminal Use三项任务比拼中,M2相对于Claude Sonnet 4.5等模型有极高Win+Tie比例[23][24] 应用生态与平台部署 - Minimax已将M2部署到Agent平台并限时免费使用,免费期直到服务器扛不住为止[7][32] - 平台展示了许多Minimax Agent现成作品,包括网页应用、经典游戏复刻、在线五子棋平台等[35][36][38][40] - 网友实战案例显示,通过三轮反馈即可完成足球小游戏制作,应用效果非常不错[42][43]
Thinking Machine新研究刷屏!结合RL+微调优势,小模型训练更具性价比了
量子位· 2025-10-28 09:18
文章核心观点 - Thinking Machine提出一种名为“在线策略蒸馏”的新型大语言模型后训练方法,该方法通过结合在线策略的自主探索与离线策略的密集监督,显著提升了小模型在专业领域的学习效率和性能 [1][8] - 该方法在数学能力迁移和企业AI助理应用两个实验中展现出巨大优势,训练效率提升高达50-100倍,并能有效解决模型“灾难性遗忘”问题 [4][18][26] 方法原理与创新 - 在线策略蒸馏的核心创新在于融合了实战演戏(在线策略)和请家教(离线策略)两种传统训练模式的优点,如同一位“天才教练”在AI自主解题时提供即时指导 [3][4] - 该方法使用KL散度作为评估学生模型与教师模型分歧的指标,学生模型通过最小化逆向KL散度来模仿教师模型,该指标具备防作弊和使学习过程更稳定的优秀特性 [12][15][17] 实验验证与效果 - 在数学能力迁移实验中,使用在线策略蒸馏方法,仅需约150个训练步骤就将8B学生模型在AIME'24基准上的性能从60%提升至70%,计算成本相比传统监督微调方法降低了9-30倍 [19][21][22] - 在企业AI助理应用中,该方法成功解决了灾难性遗忘问题,使模型在内部知识评估得分从36%提升至41%的同时,通用聊天能力也从79%恢复至83% [23][25][26] 行业影响与团队背景 - 该方法的高效性(效率提升50-100倍)使得资源受限的个人或小公司也能训练出在特定领域具备竞争力的专业小模型,降低了AI应用门槛 [4][5] - 该研究由前OpenAI员工Kevin Lu领导,其曾在OpenAI负责4o-mini发布并参与o1-mini、o3发布,研究背景与强化学习、小模型和合成数据密切相关 [27][28][29]
微调已死!「共识机制」实现提示词自我进化,性能飙升
量子位· 2025-10-28 09:18
AI范式转变 - 人工智能领域正经历从“模型微调”向“上下文工程”的范式转变 [1] - “上下文工程”通过引入明确指令和丰富知识,无需高昂训练成本或开源模型参数,提供更强可解释性 [1] - “微调已死”成为AI领域近期广泛认可的热门话题 [2] 单一提示词的局限性 - 单一提示词表达能力有限,难以全面严谨地表述复杂任务的所有需求 [4] - 多提示词相互协作是自然解决方案,单个提示词无法处理的输入可由其他提示词弥补性能损失 [4] C-Evolve算法核心思想 - 基于“共识机制”的提示词组进化算法C-Evolve通过进化算法生成一组提示词 [6] - 该组提示词对输入信息独立处理后,通过提取所有输出结果的共识以实现最优任务性能 [6] - 算法创新性提出“共识表决得分”评估单个提示词在成组工作时的性能潜力,并采用海岛算法提升组内多样性 [6] 共识机制技术细节 - 共识机制由一组独立、同功能的提示词共同完成 [11] - 对于封闭回答类问题采用多数表决输出高频一致答案,对于开放式提问则用LLM表决筛选最具代表性的输出 [13] - 优化目标是寻找在共识机制下最优的一组提示词 [13] 基于海岛的进化算法 - 算法采用基于海岛的进化算法,在相互独立的海岛内并行迭代种群 [14] - 进化过程包含基于个体独立性能的预热阶段和基于跨海岛分组协作表现的共识进化阶段 [14] - 预热阶段将个体独立得分作为进化算法的适应度评分 [16] 共识表决阶段 - 共识表决阶段以个体组成提示组之后的性能作为进化的适应度 [23] - 算法构建提示组,从各岛屿中分别采样一个个体,并基于共识机制测试这些组的评估性能 [23] - 采用指数平滑后的共识表决得分作为适应度评分,赋予最新采样出的组更高权重以抑制早期历史结果影响 [26][28] 算法性能表现 - C-Evolve同时适用于Qwen3-8B开源模型和GPT-4.1-mini闭源模型 [29] - 在Qwen3-8B模型上,C-Evolve在IFBench任务得分为70.67,相比Baseline的50.03提升显著;在GPT-4.1-mini模型上,C-Evolve得分为70.64,相比Baseline的44.24提升显著 [30] - 算法在Hover、MATH、HotpotQA等多个任务上均取得性能提升,例如在Qwen3-8B的MATH任务上从37.66提升至50.33 [30] 算法优势与意义 - C-Evolve通过多提示词共识机制突破单一系统提示词的性能局限,显著提升系统整体性能 [7][32] - 该方法无需参数微调即可实现算法效能的显著提升,为挖掘成熟商业LLM的模型能力提供了新思路 [34] - “共识机制”模拟生物进化与群体协作,提升了提示词性能并增强了模型在复杂任务中的适应能力 [34]