Workflow
量子位
icon
搜索文档
摩尔线程新一代GPU架构10天后发布
量子位· 2025-12-09 13:39
MDC 2025不仅是 摩尔线程MUSA技术体系与全栈能力 的集中呈现,更致力于打造一个 连接技术创新、开发者共创与产业应用 的战略平 台。 允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025年12月19日至20日,摩尔线程首届MUSA开发者大会(MUSA Developer Conference,简称MDC 2025) 将在北京中关村国际创新 中心拉开帷幕。 作为国内首个聚焦全功能GPU的开发者盛会,大会以"创造、链接、汇聚(Create, Connect, Converge)"为核心理念,直面技术自立自强与 产业升级的时代命题,旨在汇聚全球AI与GPU领域开发者、技术领袖、产业先锋及行业数智化转型实践者,共同探索国产算力的突破路径, 擘画自主计算生态的崭新蓝图。 大会将围绕MUSA统一系统架构,全面展示从硬件到软件、从技术到场景的全栈能力与生态进展,加速推动国产全功能GPU技术扎根千行百 业,筑牢智能时代的坚实算力底座。 主论坛:揭晓新一代GPU架构与路线图 演讲还将深入分享摩尔线程在AI计算、图形渲染、科学计算及多场景融合中的落地实践、生态进展与前瞻思考。 20+技术专场:前沿探索,赋能生态 ...
明天!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-09 13:39
大会核心信息 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办 [24][37][39][56] - 大会主题为“共生无界,智启未来”,关注AI技术如何穿透产业、学科与场景边界 [39] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》 [35][39][54] 嘉宾阵容与背景 - 大会累计邀请近三十位重量级嘉宾,覆盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授、智源研究院王仲远院长、交大高金朱宁教授等 [1][17] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、中关村科金、高通、亚马逊云科技、谷歌云、昆仑万维、潞晨科技、PPIO等代表性企业 [1][21] - 参会的新生力量企业包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等 [28] 核心议题与议程亮点 - 大会议题涵盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 设置“重磅GenAI对话”与“前沿Agent圆桌”两场高浓度对话,探讨真问题 [5][7] - GenAI Talk由文远知行创始人兼CEO韩旭对话量子位总编辑李根,探讨GenAI赋能自动驾驶及Robotaxi大规模商业化落地 [8][11][12] - Agent圆桌主题为“距离AI Agent革新千行百业还有多久”,汇聚小宿科技、联汇科技、蚂蚁百宝箱的平台方、技术方与应用方嘉宾,探讨Agent技术架构与应用落地 [13][16][50] - 上午议程包括人工智能+趋势、AI打造超级智能体、AI从数字世界迈向物理世界、混合AI、Agentic AI未来已来等主题演讲 [41] - 下午议程涵盖多模态与智能体、AI基础设施、AI操作系统层、大模型赋能千行百业、国产算力生态、硬件觉醒、物理世界基础模型、具身智能平台等主题演讲与圆桌讨论 [45][48][50] 大会影响力与参与价值 - MEET系列大会是业界最具代表性的年度智能商业峰会之一,每年获数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 参会观众质量极高,不乏企业管理层等高精尖人才,是绝佳的交流机会 [31] - 嘉宾阵容构成从理论、平台、应用到终端的完整AI落地拼图,专注解决现实问题而非空谈AGI [33] - 通过一线实践者的分享,有望找到AI从炒作走向产生实际影响的真实路径 [34]
论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解
量子位· 2025-12-09 13:39
核心观点 - 国产AI应用“秘塔AI搜索”推出对标海外Nano Banana 2的“漫画式课件生成”功能,通过将复杂资料(如学术论文、行业报告)自动转化为图文并茂、带语音讲解的PPT,显著提升了知识获取与学习的效率,并坚持免费、零门槛的普惠模式 [1][2][3][4][11][48][58] 产品功能与体验 - 核心功能是“学点啥”模块,可将上传的文档、链接或关键词搜索的内容,自动生成逻辑清晰、带语音讲解的PPT课件 [12][14][15][20] - 支持近20种画面风格(如像素风)和多种讲解风格供用户选择 [5][18][36] - 生成过程全自动,用户上传素材并设定偏好后,约五分钟即可获得结果,课件支持自动播放与语音讲解,如同上课 [20][22] - 课件具备交互性,用户可点击PPT中的陌生词汇获取名词解释 [25] - 除单篇文档解析外,还支持通过“知识库”功能一次性上传并解析多个文件(包括音视频),并生成总结与PPT [29][30][31][34] - 在常规搜索结果页面,也可直接点击“生成幻灯片”将冗长文字转化为PPT [40][41] - 功能应用场景广泛,不仅用于学习,也可用于快速梳理热点事件(如人物关系) [43][44] 市场定位与差异化 - 与市面上侧重精美模板和演示的AI PPT工具不同,该产品将重心转向“对内输入”,专注于辅助用户自主学习与消化复杂信息 [53][54][55] - 产品定位从“办公耗材”转变为辅助用户理解信息的“外挂大脑”,将制作PPT从负担转化为获取知识的捷径 [56][57] - 该功能延续了公司产品线的一贯逻辑,即通过免费AI工具(如AI搜索、DeepResearch)降低信息获取门槛,致力于让用户从“搜得到”、“研究深”到“看得懂” [58] 商业模式与用户价值 - 功能完全免费开放,无需内测申请或排队,零门槛使用 [8][48] - 官方每日提供100积分(相当于100页PPT),免费额度足以覆盖绝大多数用户日常高频的学习与阅读需求 [49][51] - 上传文档会消耗额外积分,但实测将一篇《自然》(Nature)论文转为PPT后,每日积分仍有剩余 [50] - 公司旨在利用科技手段抹平信息鸿沟,使AI带来的效率提升普惠于每一个人 [58][59]
量子位编辑作者招聘
量子位· 2025-12-09 13:39
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 09:21
一水 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek梁文锋,现在有了新头衔! 刚刚,权威科学期刊《自然》(Nature)公布了2025年度十大科学人物榜单,而梁文锋赫然在列。 该榜单主要用于表彰过去一年中重要的科学趋势或发现,而梁文锋因DeepSeek模型对AI领域的重要贡献与变革性影响成功当选。 Nature给他的形容词也是"Tech disruptor",意指科技领域的颠覆者、变革者,简介上也鲜明提到了梁文锋金融从业者的身份: 在投资界声名鹊起后,一位中国金融奇才创立了DeepSeek。 在随后的介绍文章中,DeepSeek和梁文锋本人的故事也被再次提及。Nature还悄咪咪透露,由于梁文锋为人低调,他这次还拒绝了他们的采 访请求,同时还语带调侃: 梁的模型开放程度与他本人的神秘程度不相上下 (笑死,精准形容了不是) 。 而除了梁文锋,还有一位中国研究员也成功入选。 梁文锋和杜梦然入选 老实说,对于梁文锋因DeepSeek模型入选,我们其实并不意外。 毕竟年初DeepSeek的横空出世,可是切切实实给整个AI行业带来了冲击。 凭借出色的"性价比"策略,DeepSeek模型不仅把模型成本打 ...
准确率腰斩!大模型视觉能力一出日常生活就「失灵」
量子位· 2025-12-09 09:21
研究背景与核心问题 - 当前大多数第一人称视频问答基准集中于日常生活活动,忽略了真实世界应用中的巨大领域差异[3] - 现有多模态大语言模型在真实专业场景中面临泛化瓶颈,例如在外科、工业、极限运动与动物视角等场景下表现不佳[1] - 研究核心在于评估模型在视觉风格和语义内容上与日常家务大相径庭的专业领域中的表现,即应对领域差异的能力[7][8] EgoCross基准概述 - 该研究首次提出跨域第一视角视频问答基准EgoCross,填补了该领域的评估空白[3] - 基准覆盖手术、工业、极限运动、动物视角四个高价值专业领域[3] - 数据集包含957个高质量问答对,覆盖识别、定位、预测和计数四类核心任务下的15种子任务[11][12] - 每个问答对同时提供开放式和选择式两种评测格式[3][12] 模型评估关键发现 - 评测了8款主流多模态大语言模型,包括GPT-4.1、Gemini 2.5 Pro等闭源模型,以及Qwen2.5-VL、VideoLLaMA3等开源模型[12] - 模型在跨域场景中表现不佳:表现最好的模型在闭卷格式下准确率低于55%,在开卷格式下低于35%[12] - 领域差距显著:模型在日常活动基准上的准确率为73.58%,但在EgoCross跨域场景中骤降至43.14%[13] - 专业领域挑战不均:工业和极限运动领域对模型最具挑战性,动物视角相对容易[13] - 任务类型影响显著:预测类任务比基础识别任务性能下降更严重[18] - 通用大模型表现优于专用模型:Gemini 2.5 Pro等通用模型优于专门针对第一人称视频训练的模型,表明当前领域适应方法存在局限[13][18] 模型性能数据详述 - 在手术领域,GPT-4.1闭卷准确率为57.24%,开卷为39.58%;Gemini 2.5 Pro闭卷为61.48%,开卷为42.40%[13] - 在工业领域,GPT-4.1闭卷准确率为45.71%,开卷为12.24%;Gemini 2.5 Pro闭卷为37.55%,开卷为24.49%[13] - 在极限运动领域,GPT-4.1闭卷准确率为43.09%,开卷为20.33%;Gemini 2.5 Pro闭卷为43.90%,开卷为21.54%[13] - 在动物视角领域,GPT-4.1闭卷准确率为64.48%,开卷为34.43%;Gemini 2.5 Pro闭卷为68.85%,开卷为49.18%[13] - 开源模型Qwen2.5-VL-7B总体闭卷准确率为44.82%,开卷为20.41%[13] 改进方法探索与效果 - 研究探索了提示学习、监督微调和强化学习三种改进方法[12] - 提示学习通过在推理阶段加入领域特定提示,不改动模型参数,挖掘模型已有能力[15] - 监督微调在目标领域少量数据上全参数微调,在工业领域使性能相对基线提升接近20个百分点[15] - 强化学习方法基于GRPO框架,对模型策略进行优化,在四个领域上平均带来约22个百分点的闭卷准确率提升,效果最显著[12][15] - 具体数据:以Qwen2.5-VL-7B为基座,强化学习方法使其在手术、工业、极限运动、动物视角领域的平均准确率从44.82%提升至60.12%[14] 研究价值与影响 - 该研究系统揭示了现有多模态大语言模型在跨域第一人称视频理解上的短板[4] - 研究验证了微调、强化学习等方法的改进潜力,为未来构建更具泛化能力的模型提供了方向[4][12] - 所有数据集、代码已全部开源,该项研究已入选AAAI 2026[5]
看完最新国产AI写的公众号文章,我慌了!
量子位· 2025-12-08 20:00
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 只需静候几分钟,AI就水灵灵地把完整的微信公众号科普文章给呈现了出来,来感受一下这个feel (上下滑动浏览) : 这一次,AI真的是快要砸掉我的饭碗了。 因为如果你现在想根据 NeurIPS 2025 的最佳论文写一篇 公众号文章 ,只需要把它丢给AI并且附上一句话: 帮我解读这篇论文,并写一个 图文并茂 的微信公众号推送来介绍这篇文章。 不得不说啊,这个AI从标题开始就真的把最最最重要的关键信息 "NeurIPS 2025最佳论文" 精准抓了出来。 并且 "Gates一下" ,更是把名词动词化,是有点语言编辑功底在身上的。 回头细看这个AI处理的过程。 首先,它会根据这篇论文的内容,先处理文字的部分,将文章分为了引言、核心问题、破局之道、实验结果、深入分析、结论与展望这六大部 分,是符合一篇论文解读文章的逻辑。 然后AI会把论文中要引用的图片和表格进行适当的裁剪和标注,并插进文章里面,还会在图片下方附上图注: 一气呵成,真的是 "文字+图片+排版" 一气呵成。 那么这到底是何许AI是也? 不卖关子,它就是 智谱 最新升级的新一代视觉推理模型—— GLM ...
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
量子位· 2025-12-08 19:36
文章核心观点 - 基于对OpenRouter平台超过100万亿Token使用数据的实证分析,揭示了2025年AI行业的发展趋势,核心结论包括开源与闭源模型关系转变为互补、中国开源模型力量崛起、模型功能向推理与执行系统演进、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等[1][8][12] 开源与闭源模型格局演变 - 开源模型不再是闭源模型的廉价替代品,两者关系已演变为互补,开发者常同时使用两类模型[9][10] - 开源模型使用量稳步增长,预计到2025年底将占据约三分之一的Token用量[10][12] - 开源模型市场从高度集中走向多元化,早期DeepSeek V3和R1曾占一半以上用量,但预计到2025年底,没有单一模型能持续占比超25%,市场将由5~7个模型均分[16][17][18] - 中型模型(参数在150亿到700亿之间)更受市场青睐,小模型正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型上[20][21] 中国开源模型崛起 - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,与其他地区开源模型平均13.7%的份额相当[12][13] - 中国模型如DeepSeek、MiniMax、Kimi K2等在开源领域受到青睐,其中DeepSeek在角色扮演和闲聊领域有极高粘性,超过三分之二的流量用于此[1][16][50] - 在编程领域,中国模型如MiniMax已成为快速崛起的新秀,近几周取得显著增长[48] 模型功能与使用范式转变 - 语言模型正从对话系统升级为推理与执行系统,使用推理功能的Token用量从年初可忽略不计增长至超过50%[22] - 模型调用工具的功能使用占比上升,从年初集中于少数模型发展到更多模型支持,缺乏可靠工具的模型有落后风险[29][30][31][33] - 用户任务复杂度提升,从生成短文转向解决难题,如分析完整文档或代码库[35] - 用户平均每次提示词长度增加约4倍,模型完成任务所需Token用量增加近3倍,反映出工作负载更依赖上下文且推理消耗更多[36][39] - AI正从聊天机器人转变为能独立规划步骤、调用工具并完成复杂目标的自动智能体(Agent)[42][43] 主要应用场景与模型偏好 - 编程和角色扮演是AI模型最主要的使用方式[12][44] - 编程查询的Token用量从年初的11%上涨至最近的超过50%,增长最为稳定[45] - 在编程领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但其份额在2025年11月首次跌破60%[47] - OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌份额稳定在约15%[47][48] - 在角色扮演领域,开源模型中其使用量占比高达52%,中国与西方开源模型在该领域平分秋色[50] 用户行为与留存特征 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定用户痛点,便能锁定一批高粘性用户,即使后续有更好模型也难以被替换[12][67] - 例如,Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40%高位[67] - 该效应窗口期很短,仅在模型被视为“最前沿”时有效,一旦竞品能力赶超则难以吸引新用户[69][70] - 用户留存模式可分为:成功锁定(如Claude、GPT-4o Mini)、从未合脚(如Gemini 2.0 Flash)、回旋镖效应(用户离开后因性价比或特定能力又回归,如DeepSeek)[74] 市场与区域动态 - AI不再是硅谷独角戏,亚洲地区付费使用量占比从13%翻倍至31%[71] - 北美仍是最大市场,但份额已不足50%[80] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二[80] 其他关键发现 - 模型价格下降对使用量的影响有限,价格下降10%仅带来0.5%-0.7%的使用量增长[80] - 存在“杰文斯悖论”现象,即模型降价且好用后,用户会在更多场景更频繁地调用,导致总Token用量飙升,总支出可能并未降低[75][76] - 报告数据主要反映开发者与服务端API调用行为,未涵盖通过App或Web直接访问的流量,且平台定价策略可能影响数据代表性[76]
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东
量子位· 2025-12-08 18:53
新公司“明日新程”的创立与定位 - 前小冰公司CEO李笛于2025年12月7日陆奇“奇绩创坛路演日”上,以压轴身份公开其全新创业公司“明日新程”,英文名Nextie,寓意“下一程”[1][2][6][7] - 新公司核心团队由小冰公司核心初创团队构成,包括联合创始人曾敏、大模型与算法负责人王文斓等,目前团队规模约30人[4][44][45][46] - 公司正计划启动一轮千万美元级别融资,陆奇旗下的奇绩创坛是股东之一,但尚未完成正式对接[5][8] 核心技术理念:群体智能与认知模型 - 新公司的技术方向是“群体智能”,旨在教会AI什么是“认知”,以解决个人、组织及大模型普遍存在的认知盲区[11][12] - 技术路径不追求单个模型预训练最大化,而是让一群各有所长、拥有独特视角和认知方法的AI智能体(Agent)对同一问题进行辩论与思维碰撞,综合不同认知进行研判,以逼近更合理的答案[12][13] - 该理念与当前以Manus为代表的去中心化智能体路径不同,更侧重于中心化能力展现,组合不同领域的专家智能体以提供生产力[14][15] - 公司整理了1800年至2020年跨越220年的人类论文,试图构建群体智能演化史,为技术路线提供参考[18] 内测产品“团子”与初步成果 - 公司理念已在内测产品“团子”上得到具象化,该产品有两种运行模式:“官方姐妹团”侧重生活化场景与情感问题,“官方研究团”聚焦课题研究、学术检索与行业洞察[21][22] - 产品推理机制不依靠“思维链”,而是直接展现不同AI智能体间的相互博弈与投票,例如在“姐妹团”模式下,系统会筛选出3名最匹配的AI发起辩论,最终由40位AI“姐妹”投票后总结输出结果[24][27] - 李笛表示,基于群体智能与认知模型的多智能体框架,在内测阶段的大部分案例中,其表现显著优于任何单一大模型或智能体产品,并已取得SOTA成果[30][31] - 公司将成绩归功于群体智能框架下AI之间的对抗学习[32] 商业模式与产品规划 - 商业模式明确不会按Token收费,更倾向于按照任务结果本身定价,原因是不同任务语境中单个Token所承载的信息密度和价值差异极大[33][34][35] - 技术内测已基本完成,产品预计将于明年1月7日正式上线[36] 创始团队背景与关联 - 李笛是小冰公司的创始人与核心灵魂人物,曾主导微软小冰AI聊天机器人从0到1的发起与发展,并于2020年小冰从微软分拆后出任CEO[47][48][49][50] - 2025年5月,小冰公司完成工商信息变更,李笛不再担任公司法人,但仍为第二大股东,法人代表变更为前首席架构师周力,公司董事长为沈向洋[39][40][41][42][43] - 除李笛外,核心团队成员曾敏是小冰联合创始人、前微软首席研发总监,负责小冰开放域对话系统;王文斓是小冰大模型与算法负责人,曾任职于英特尔和虎牙[51][52][53][56][57] - 在当日的奇绩创坛路演中,53个创业项目里有三个来自李笛带出来的团队,李笛可能扮演类似驻场企业家的角色[58][60]
量子位编辑作者招聘
量子位· 2025-12-08 14:07
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 任职要求: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰 ...