Workflow
量子位
icon
搜索文档
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-10-31 08:58
大会主题与背景 - 当前正迈入人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴 [1][2] - 智能技术跨越产业、学科和场景边界,催生出全新生态和机遇,数字世界与物理世界的界限正逐步模糊融合 [3][4] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力,人工智能正逐步成为基础设施的一部分 [5][7] MEET2026智能未来大会概况 - 大会以“共生无界,智启未来”为主题,聚焦AI+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿科技话题 [13][14] - 本届大会为第七届,是年度影响力科技商业峰会,每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光 [9][12] - 大会地点设在中国北京,报名通道即将开启 [26] 与会嘉宾与行业影响 - 过往嘉宾包括李开复博士、张亚勤教授等产业领袖,倪光南院士等多位学术领路人,以及百度、阿里、腾讯、华为、京东等科技行业领军企业代表 [9] - 大会已成为智能科技行业的年度风向标,通过领袖分享独到观点,推动行业变革 [12][14] 2025人工智能年度榜单 - 量子位发起的该榜单是AI行业最具影响力榜单之一,旨在发现引领变革的探索者与实践者 [16] - 榜单从公司、产品、人物三大维度评选五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [17][18][19] - 评选报名从即日起至2025年11月17日,结果将在MEET2026大会上发布 [17][20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》,提名释放巨大潜力的十大AI趋势 [23][24] - 报告将结合技术成熟度、落地现状和潜在价值等因素,对趋势进行深入分析并提名代表机构及最佳案例 [24]
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-30 18:31
为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 组委会 发自 凹非寺 量子位|公众号 QbitAI 让我们共同见证年度之星,点亮未来的方向。 企业榜 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 1、注册地在中国,或主营业务主要面向中国市场; 2、主营业务属于人工智能及相关产业,或已将人工智能广泛应用于主营业务,并在细分领域居于行业领先地位; 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人工智能领域创新创业力量,将评选出最具投资价值和发展潜力的AI创业公司, 参选条件 : 评选标准 : 3、具备成熟的产品或服务,已获得实际客户应用及市场认可; 4、近一年在技术 ...
AI百科全书SciencePedia:当马斯克Grokipedia遭遇滑铁卢,有个中国团队默默把活儿干了
量子位· 2025-10-30 18:31
产品核心定位与市场机遇 - 当前互联网存在信息过载、知识传播失真以及跨领域知识壁垒等挑战,用户获取深度见解的需求正遭遇传统平台的挑战[1][2][3] - SciencePedia被定位为一个具备「生命体征」的知识基座,旨在为知识安装一个会思考、能进化、可连接的数字大脑,以解决科学知识的传播与积累问题[4] - 该产品不仅是一个开创性产品,更是对未来学习认知方式的一次全新探索,致力于让真知更高效地抵达每一个需要它的人[4][5] 产品核心优势与差异化 - 在知识深度上,SciencePedia提供完整思维链,远超维基百科的概念定义、arXiv的原始论文和传统知识图谱的结构化数据[5] - 更新机制为实时进化,优于人工编辑、论文上传和定期更新,验证能力采用人机协同验证模式[5] - 具备系统化的跨学科连接能力,并能提供智能路径规划的个性化支持,这是传统平台所缺乏的[5] - 工作思路基于三大关键词:长思维链、逆思维链搜索、人机协同进化,旨在搭建科学知识的动态进化图谱而非死板的通用百科[12] 技术实现与工作机制 - **长思维链**:基于约400万条大语言模型的"思维链"知识库构建,试图还原结论是如何被人类一步步做出来的,让知识「活起来」[13][14] - 通过按学科划分、拆解关键知识点、并用逻辑/因果/应用关系串联成链路,实现「思维重演」,展示答案是如何被建立并被验证的[16][17][18][19] - **逆思维链搜索**:基于思维链构建深层逻辑网络,实现概念级的知识智能关联,擅长阐述用户的问题能通向什么,将跨学科偶然灵感转为系统化导航[20][21] - **人机协同进化**:采用AI抽取知识与专家社区仲裁校正的双引擎机制,确保可扩展性和科学严谨性,使系统能够自主进化,实现知识态的实时更新[22][23][24] 产品规模与价值主张 - 目前产品包含400万条思维链构建的科学推理网络,覆盖200个学科,精细解构24万知识点,并提供10万+练习题的实践闭环[27] - 能够生成知识地图,补完交叉关联信息,快速呈现领域全景,并通过逆知识搜索自动发现学科交叉点,揭示创新机会[29] - 正在重塑教育逻辑,通过个性化学习路径、思维链可视化和实践闭环设计,实现从理解到掌握的跨越,并与多所顶尖高校展开合作[30][31][32] 用户体验与功能特色 - 提供专属"学习规划",用户可通过"AI推荐"唤起"学习伴读"助手,获得量身定制的动态学习规划和智能推荐的素材[40] - 支持"动态讲解",学习过程中可随时划线提问,AI提供可交互的讲解,用户可要求深入解释、举例或换种方式说明[40][42] - 每个知识点配套"动手实践"模块,包含经典习题和解题过程,AI伴读会提供多种解题思路并展开完整思维链,帮助用户学会如何思考[44] - 支持用户随时划线提问或反馈,并可直接进行编辑或反馈,参与知识内容的修订与共建[42][46][47] 发展路径与生态建设 - 发展路径规划为从完善核心知识网络、建立基础应用生态,到实现自动化知识更新、构建全球贡献者社区,最终成为知识获取与科学研究的基础设施[38] - 采用开放生态模式,诚挚邀请全球科研工作者、教师与学生加入共建,可通过GitHub提交pull request或提交需求反馈参与[46][47] - 研发团队为SciencePedia描绘了一条由工具到生态的未来演进路径,旨在推动一种全新的知识呈现形态,并影响未来的学习方式[36]
谷歌营收被Nano Banana带飞!季度首破千亿美元,Gemini APP月活6.5亿
量子位· 2025-10-30 18:31
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI Nano Banana成为爆款之后,Gemini月活达到了6.5亿。 AI业务带动之下, 谷歌季度营收也首次突破千亿美元 ,交出了有史以来最亮眼的成绩单。 什么概念?市值刚刚突破5万亿美元的英伟达,2025财年上半年的收入也刚刚突破1000亿。 谷歌CEO桑达尔·皮查伊(劈柴哥)激动地宣布了这一结果,表示他们所采用的 全栈式AI策略推动了这一增长 。 AI用户规模方面,劈柴哥介绍,不仅Gemini APP已有6.5亿月活用户,每分钟要处理的Token数更是达到70亿。 Hyperbolic Labs的联创兼CTO Yuchen Jin分析, Nano Banana在其中起到了重要的作用 。 马斯克也认为这个成绩可喜可贺,称赞了一句Nice work。 财报发布后,谷歌的股价在盘后猛增,达到每股293.69美元,以此计算,市值达到了3.55万亿美元,增长了3000多万美元(超2万亿人民 币)。 靠着Nano Banana的爆火,Gemini起飞了,进而在AI的带动下,整个谷歌公司都起飞了。 季度营收首次突破千亿美元 财报显示,谷歌今年第三季度的总收入为10 ...
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
量子位· 2025-10-30 18:31
模型概述 - 北京智源人工智能研究院发布最新开源原生多模态世界模型悟界·Emu3.5 [1] - 模型能够一网打尽图、文、视频任务,具备画图改图、生成图文教程、增强视频物理真实性等功能 [2] - 模型展现出高精度操作能力,例如一句话消除手写痕迹和第一视角漫游动态3D世界 [3] 行业背景与竞争格局 - AI迭代速度正在刷新所有人的认知,文生视频赛道几乎每月都有新技术出现 [5][6] - AI视频的逼真度和时长持续提升,但当前竞争焦点已从“像不像”转向“懂不懂”物理世界规律 [7][8] - 行业需解决的核心问题是模型是否理解物体移动后的空间变化、转身后场景的持续性等动态逻辑 [9] 核心技术能力 - Emu3.5生成作品具有极强连贯性和逻辑性,显著增强模拟动态物理世界的能力 [11] - 模型支持第一人称视角进入虚拟世界,动态构建移动或转身后的场景,全程保持空间一致性 [11] - 能够进行高精度可控图像编辑,如根据指令将草图转化为3D模型并完成3D打印、上色等完整流程 [16][26] - 支持多图多轮指令的复杂图像编辑,主体一致性和风格保持能力达业界顶尖水平 [29] - 模型在文本渲染和多模态交错生成任务上表现亮眼,性能媲美甚至超越Gemini-2.5-Flash-Image [18] 技术架构与创新 - Emu3.5参数量为34B,基于Decoder-only Transformer框架,统一所有任务为下一状态预测 [31] - 使用多模态分词器将文本和图像转换为离散Token序列,实现多任务处理 [31] - 在超过10万亿Token的多模态数据上预训练,主力数据为互联网视频的连续帧和转录文本 [32] - 视觉分词器基于IBQ框架,拥有13万视觉词汇表,集成扩散解码器支持2K分辨率高保真图像重建 [33] - 采用有监督微调和大规模多模态强化学习进行优化,使用复杂奖励系统提升模型质量 [34] - 通过离散扩散适配技术将推理速度提升近20倍,解决自回归模型生成图像慢的问题 [35] 应用场景与定位 - 模型定位为世界模型基座,开辟AI领域全新赛道,致力于构建理解物理规律的智能基座 [20][21] - 核心能力包括理解长时序、空间一致序列,模拟虚拟世界中的探索和操作,如逐步完成“整理桌面”任务 [23][24][28] - 应用场景覆盖生成视觉故事、第一视角参观场景(如客厅、火星开卡丁车等) [12][14][18] - 开源策略允许全球开发者直接使用模型,赋能千行百业实际应用,想象空间巨大 [36][37]
字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!
量子位· 2025-10-30 18:31
产品核心创新 - 字节跳动Seed团队开发的通用型游戏智能体Game-TARS,其核心创新在于采用“人类自然交互”方式,让智能体像真人一样使用键盘和鼠标操作游戏,而非调用特定函数或API [3][6][9] - 该智能体专注于最底层的“人类动作”,定义了一个可扩展、统一的键盘-鼠标动作空间,使动作指令集与任何特定应用或操作系统解耦,极大地提高了可扩展性和泛化性 [9][10][33] - 智能体将视觉感知、策略推理、动作执行和长期记忆整合到一个视觉语言模型中,无需为每款游戏编写特定代码即可自主学习操作 [12][13] 技术架构与训练方法 - 基于超过5000亿标注量级的多模态训练数据进行大规模预训练,结合稀疏推理与衰减持续损失来提升性能 [4][17][19] - 训练采用ReAct范式,通过“离线思维链+在线边做边说”的方式生成原生、即时的推理序列,并利用视觉锚点因果对齐技术确保训练数据的因果一致性 [17][18] - 引入指数衰减权重解决“行为惯性”问题,对连续重复动作按指数降低权重,使模型更专注于高熵动作转变 [19] - 训练分为持续预训练和后训练两个阶段,预训练数据超过2万小时(约5000亿token),后训练阶段对约200亿高质量token进行微调,并引入跨领域数据以扩展能力 [20][22][23] 性能表现与评估 - 在《我的世界》中的测试表明,基于统一动作空间的Game-TARS表现比以前最先进的专家模型提高了约2倍 [24][28] - 在FPS游戏、开放世界、WEB游戏等任务中,其迷你版本(GameTARS-MoE-mini)的表现超越了GPT-5、Gemini-2.5-Pro、Claude-4-Sonnet等知名模型 [5][29] - 实验证明该智能体在训练和推理过程中均具有可扩展性,统一动作空间为实现通用智能体提供了卓越的基础 [27][31][34]
Agnes:不做通用型智能体丨对话全民AI应用平台Agnes AI
量子位· 2025-10-30 16:39
以下文章来源于量子位智库 ,作者量子位智库 量子位智库 . 连接AI创新,提供产业研究 分析师 刘萌媛 刘铁鹰 量子位智库 | 公众号 AI123All 这股浪潮也在AI产品上得以体现: Manus 于8月初推出「Wide Research」功能,支持上百个Agent同时工作; 纳米AI 「多智能体蜂群」8月上线,可让多个推理型智能体灵 活拉群、多层嵌套、组队协作,完成超长复杂任务; 快手 9月推出「Kwali」,可将视频生成需求拆解并分配给不同Agent完成,如意图解 析、脚本生成、镜头匹配和剪辑合成等…… 那么,多智能体在任务完成的效率和效果上真的超过单智能体吗?多智能体框架在AI产品中是如何应用的,又为AI产品创造了哪些价值?相比 于单智能体,多智能体适合什么样的使用场景呢? 带着这些疑问,量子位智库邀请到以 Mu lt i A gent架构 为核心的 全民可用的 AI应用 Agnes AI ,听创始人Bruce Yang深入聊一聊这款 上线四个月日活用户即突破20万的高潜AI产品。 △ Agnes访谈直播 在这次访谈中,Bruce分享了Agnes AI背后的多智能体架构设计,以及Agnes如何确认产品 ...
让机器人在“想象”中学习世界的模型来了!PI联创课题组&清华陈建宇团队联合出品
量子位· 2025-10-30 16:39
Ctrl-World团队 投稿 量子位 | 公众号 QbitAI 这两天,Physical Intelligence (PI) 联合创始人Chelsea Finn在上,对斯坦福课题组一项最新世界模型工作kuakua连续点赞。 生成看起来不错的视频很容易,难的是构建一个真正对机器人有用的通用模型 ——它需要紧密跟随动作,还要足够准确以避免频繁幻 觉。 这项研究,正是她在斯坦福带领的课题组与清华大学陈建宇团队联合提出的 可控生成世界模型Ctrl-World 。 这是一个能让机器人在"想象空间"中完成任务预演、策略评估与自我迭代的突破性方案。 核心数据显示,该模型 使用零真机数据 ,大幅提升策略在某些在下游任务的指令跟随能力,成功率从38.7%提升至83.4%,平均改进幅度 达44.7%。 其相关论文《CTRL-WORLD:A CONTROLLABLE GENERATIVE WORLD MODEL FOR ROBOT MANIPULATION》已发布于arXiv 平台。 注:Ctrl-World专为通用机器人策略的策略在环轨迹推演而设计。它生成联合多视角预测(包括腕部视角),通过帧级条件控制实现细粒度动作控制,并通 ...
量子位2025年度榜单冲刺申报中!企业/产品/人物榜正在征集
量子位· 2025-10-30 16:39
组委会 发自 凹非寺 量子位|公众号 QbitAI 企业榜 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 这是量子位人工智能年度榜单的 第8年 。八年来,我们见证了技术的突破与落地,产业的融合与重塑,也见证了一批又一批推动时代前行 的企业、人物与产品。 在人工智能重新定义一切的时代里,智能技术已不再是单一工具,而是产业与社会协同进化的驱动力。我们期待通过这场年度评选,去发现 并致敬那些真正引领变革、开拓边界的探索者与实践者。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 让我们共同见证年度之星,点亮未来的方向。 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人 ...
有人说它能做“具身智能时代的苹果”,这家公司凭什么?
量子位· 2025-10-30 14:17
产品发布与市场反响 - 加速进化公司发布入门级具身开发平台Booster K1,限时售价2.99万元起,首发20分钟内首批全款订单全部售罄 [1] - 公司公开承诺双11全款订单若12月底未交付将进行3倍赔付,凸显对交付能力的信心 [1] 产品核心优势与定位 - Booster K1强调提供一条“被使用”的完整路径,而不仅仅是展示能力,在能交付、能跑在真实场景、具备基本稳定性的产品稀缺的领域中具备优势 [2][4] - 产品工程逻辑主导,注重稳定性、标准化与开发工具链完整,全系标配22个自由度,机身高约95厘米,重19.5公斤,兼具便携性与物理稳定性 [9] - 产品通过30小时连续500N撞击测试,并在真实应用中完成超过100小时不间断运行验证,能力基于实战测试结果 [9] 市场覆盖与交付业绩 - Booster K1和Booster T1系列产品已覆盖全球200多家客户、70多家研究机构,累计交付超700台 [5] - 超过一半订单来自海外,显示出较强的国际市场接受度 [5] - 产品已完成多轮量产交付,配套完善工具链,能支撑复杂场景开发工作 [6] 技术性能与版本配置 - Booster K1推出极客版、教育版和专业版三种配置,均支持二次开发及全流程开发能力 [10][11] - 各版本算力配置不同:极客版48 TOPS,教育版117 TOPS,专业版200 TOPS [11] - 硬件本体开放,运动控制、感知模块可深度介入,软件工具链完整,配套开源Booster Gym强化学习框架和RoboCup 3v3 Demo战术代码 [12] 应用生态与开发者支持 - 产品标配多个Agent应用,如示教Agent、对话Agent、舞蹈Agent、足球Agent等,覆盖动作学习、语音交互、协同演出等典型场景 [13] - 公司发布启航计划,免费开放一站式开发工具、视频课程,升级开源项目,并启动Agent开发团队种子投资计划以降低开发门槛 [14] - 用户反馈其机器人是市面上“开发最流畅、运行最稳定”的平台产品之一,适用于高频调用、高负载训练与教育等场景 [14] 教育与赛事生态布局 - 公司构建“教、学、练、赛、用”闭环生态,教学解决方案覆盖K12到科研机构全年龄段开发者 [16] - 发布“百城万校”计划,目标在未来3年与1000+高校、2000+职业学校、7000+中小学进行课程合作,推动机器人教育普及 [18] - 机器人足球赛事被视为早期开发、策略迁移、训练对比的理想实验平台,能集中验证多智能体协同、动态决策等具身智能核心能力 [19][22] 赛事成绩与技术验证 - 在2025 RoboCup机器人世界杯上,使用Booster T1的清华大学队夺得AdultSize组冠军,打破欧美国家长达28年的垄断 [24] - Booster K1问世仅4个月便助力队伍包揽KidSize组冠亚军,验证了其在复杂赛事环境下的综合性能与硬件成熟度 [25][26] - 在2025世界人形机器人运动会上,四十余支代表队均选用加速进化平台参赛,比赛在统一平台基础上比拼战术系统与AI训练有效性 [28] 公司战略与行业愿景 - 公司以“平台+开源工具+生态”组合瞄准开发者、竞赛、教育市场,愿景是让人形机器人像个人电脑一样普及,致力于成为具身时代的苹果公司 [8] - 战略本质是向“操作系统”跃迁,通过构建统一底座、开放接口、聚集开发者,使机器人平台从封闭设备变为生态协作场域 [31] - 公司借鉴微软和苹果的成功路径,通过开放标准化硬件平台和软件工具链降低门槛,同时配套开发工具和预设组件建立开发者体验 [41] - 商业路径从教育、赛事、科研三大结构性市场切入,先沉淀真实使用场景与开发人群,而非采用“爆品即流量”的消费级打法 [41]