量子位
搜索文档
Hinton加入Scaling Law论战,他不站学生Ilya
量子位· 2026-01-01 10:13
文章核心观点 - 针对Scaling Law(规模定律)的未来,AI领域的顶尖专家们存在观点分歧,但共识在于其发展路径需要演进,而非简单的规模线性扩展 [8][21][49] - 以Geoffrey Hinton和Demis Hassabis为代表的一方认为Scaling Law依然有效,当前面临的数据瓶颈可通过AI自我生成数据等方式解决 [10][15][22] - 以Ilya Sutskever和Yann LeCun为代表的一方认为,单纯依赖扩大模型参数、数据和算力的传统Scaling Law路径已遇到瓶颈,不足以实现根本性突破,未来需要转向新的研究范式 [23][25][41] Scaling Law不死派:Hinton与哈萨比斯的观点 - Geoffrey Hinton明确表示Scaling Laws依然有效,但当前面临数据缺失的最大挑战,因为大部分高价值数据锁在公司内部,免费互联网数据已基本耗尽 [10][11] - Hinton认为数据瓶颈将由AI自行解决,即模型通过推理生成自己的训练数据,他类比了AlphaGo和AlphaZero通过自我对弈生成数据的方式 [12][13][14] - 谷歌DeepMind CEO Demis Hassabis同样支持将当前系统规模化推向极致,认为这将是最终AGI系统的关键组成部分,甚至可能成为整个AGI系统本身 [16][17] - Hassabis倡导一种更系统、广义的规模化,即模型规模、训练范式、环境复杂度及系统架构需作为协同演进整体同步扩展,他强调构建“世界模型”和整合“搜索”与“规划”能力,让模型进入可交互环境以无限扩展数据 [19][20] Scaling Law不够用派:Ilya与LeCun的观点 - OpenAI前首席科学家Ilya Sutskever对继续扩展规模持怀疑态度,质疑当规模已经很大时,再扩大100倍是否就能彻底改变一切,认为仅靠更大规模无法带来根本性转折 [23][24][40] - Ilya指出过去十年深度学习的突破基于一个特定的尺度假设公式,但这个公式会改变,他认为目前主流的“预训练+Scaling”路线已明显遇到瓶颈,需要将注意力放回“研究范式本身”的重构,即“重新回到科研时代” [38][39][41] - Ilya通过一个脑损伤患者丧失情感处理能力导致决策困难的例子,暗示当前预训练模型可能缺失类似情感的关键能力,这使得Scaling Law是否“够用”存疑 [44][45] - Meta首席AI科学家Yann LeCun同样怀疑Scaling Law,认为不能简单假设更多的数据和计算能力就意味着更智能的人工智能,他一直认为大语言模型无法实现AGI [46][47][48] 行业共识与未来方向 - 尽管存在表面分歧,但顶尖研究人员观点有惊人共识:当前范式即便没有进一步突破也可能带来巨大经济社会影响;实现AGI/ASI可能需要更多研究突破(如持续学习、样本效率);分歧主要在于突破的具体内容及到来速度 [51][53] - 争论的本质可能不在于是否要Scaling,而在于“我们到底在Scaling什么”,即规模化对象需要从简单的参数、数据、算力扩展到更复杂的系统能力 [52] - OpenAI的o1模型核心成员Noam Brown提出,o1代表一种以推理计算为代表的全新Scaling,暗示Scaling Law的形式正在演变 [37]
端侧翻译新标杆:腾讯混元1.5开源,1.8B模型离线运行,效果超主流商用API
量子位· 2025-12-31 19:11
文章核心观点 - 腾讯混元推出并开源了轻量级翻译模型HY-MT1.5-1.8B,该模型在参数量极小(1.8B)的情况下,实现了卓越的翻译性能、极高的推理效率以及强大的端侧部署能力,其效果超越大部分主流商用翻译API,并接近顶级闭源大模型水平 [1][5][8] 模型性能与效率 - 模型参数量为1.8B,经过量化后仅需1GB内存即可流畅运行,支持端侧直接部署和离线实时翻译 [1] - 在Flores200、WMT25及民汉语言测试集中,其效果全面超越中等尺寸开源模型和主流商用翻译API,达到Gemini-3.0-Pro这种超大尺寸闭源模型的90分位水平,在WMT25和民汉翻译测试集上效果仅略微差于Gemini-3.0-Pro [1] - 模型推理速度极快,处理50个tokens的平均耗时仅0.18秒,而其他主流商用模型耗时在0.4秒左右,显示出明显的速度优势 [3] - 领先的效率使其高度适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景 [3] 核心技术优化路径 - **集体智慧提纯与协同训练**:早期Hunyuan-7B (MT) 在WMT25竞赛中夺得31个语言对中的30项冠军,其核心技术是Synergy-enhanced policy optimization (Shy) 框架 [6] - 采用集成知识蒸馏,让7B模型作为“观察者”吸收多个前沿开源模型的翻译策略,通过动态权重分配机制内化不同专家的长处 [6] - 首次在翻译任务中大规模落地群体相对策略优化算法,构建复合奖励函数,引入DeepSeek-V3评估流畅度和XCOMET对齐人类偏好,保持多个策略组的竞争和演化,让模型寻找完整性和流畅性的最优平衡点 [6][7] - **小尺寸模型的高效训练**:1.5版本核心在于探索小尺寸模型的极致效能 [8] - 采用在线蒸馏方案,让HY-MT1.5-7B作为教师模型,通过per-token reverse KL loss实时引导1.8B的学生模型,使学生模型从错误中学习,避免死记硬背 [9] - 此方法使1.8B版本的翻译质量在多个维度上追平了7B模型,同时将推理耗时压低至0.18秒 [9] - **更精细的评估与优化**:在强化学习阶段,将复合奖励函数升级为基于评价量规的方案 [10] - 驱使大语言模型扮演裁判,从漏译、错译、流畅度等细分维度进行结构化打分,提供更细颗粒度的奖励信号 [10] - 这使得GRPO算法能驱动模型进行“精准”的自我迭代,显著优化了在语种混杂等细分场景下的表现 [10] 工程化应用与功能特性 - **术语干预**:模型具备强大的术语库自定义能力,用户可针对医学、法律、金融、科技等行业提前构建专属术语对照表,确保关键术语翻译的高度一致与准确性,有效弥补小模型在专业领域的词汇短板 [11] - **上下文感知**:模型具备先进的长文本与对话上下文理解能力,可基于前文语境持续优化后续翻译结果,显著提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性,适用于会议记录、访谈、小说、技术文档等长篇翻译 [12] - **格式保留**:通过精准的指令遵循能力,模型能保持翻译前后的格式信息不变,让翻译结果更加准确实用 [13]
董事长稚晖君发布上纬新材首款机器人!能塞书包还能骑机器狗
量子位· 2025-12-31 19:11
产品发布与核心参数 - 上纬新材董事长彭志辉(稚晖君)于2025年12月31日发布了名为“上纬启元Q1”的机器人产品 [1] - 该产品是全球首款最小尺寸(0.8米)、实现全身力控的人形机器人 [3] - 启元Q1的体积为1.88立方米,设计为可装入背包的尺寸 [10] 产品定位与设计理念 - 启元Q1是一款面向个人用户、开发者,适用于科研、陪伴、创作场景的小尺寸人形机器人 [11] - 产品采用小型化设计,可折叠并放入书包,便于携带 [13] - 小型化设计降低了重量,使机器人更耐用,同时降低了个人和小团队的使用与试错成本 [15] 核心技术:全身力控 - 启元Q1的核心能力关键词是“全身力控” [16] - 全身力控指机器人全身关节都能感知和调节受力,而非传统机器人仅按预设角度执行动作 [17][18] - 该技术使机器人在遇到外力推、拉或与环境接触时,能实时调整动作,避免僵硬对抗,实现更自然的物理交互 [19][21] 应用场景与用户接口 - 在科研与教育场景,产品支持开放的SDK与HDK接口,用于具身智能算法验证、教学实验等 [23] - 小尺寸优势在于无需复杂防护,适合高频实验 [24] - 在个人交互场景,产品接入启元灵心平台,支持自然语言对话、知识问答、英语教学和动作示范 [24] - 针对创作者和极客,产品采用模块化结构,支持3D打印外壳定制,并可通过灵创平台编排动作、语音和行为逻辑,便于二次创作 [24] 关键技术突破:关节系统 - 高性能人形机器人的力控和高动态动作依赖QDD(准直驱)关节,但传统方案难以做小做轻 [26] - 启元Q1对QDD关节进行了系统性重构,将核心关节模块压缩至不到鸡蛋大小,同时保留了力控性能和动态响应能力 [26] 行业趋势与产品战略 - 启元Q1的发布是“机器人即服务(RaaS)”路径在个人机器人市场的延伸 [27] - 当前具身智能厂商的普遍趋势是,在服务科研和生产需求的同时,开始探索面向个人用户的产品形态 [28] - 行业出现体型更小、价格更低、可供个人用户拥有的产品,如松延动力的Bumi人形机器人(售价9998元)和维他动力的大头BoBo机器狗(售价9988元) [29] - 这些产品更关注体积、价格、耐用性和可玩性,标志着具身智能正从“实验工具”走向“可使用的产品” [29][30] - 启元Q1是这一趋势的具体落点,将机器人放入个人与开发者的日常使用场景 [30] 公司治理与发布节奏 - 智元系于2025年11月6日完成对上纬新材的控股权交割,实现绝对控股,彭志辉入选董事候选人 [33] - 2025年11月25日董事会换届,稚晖君出任公司董事长 [33] - 2025年12月31日,公司发布了首款具身智能机器人产品启元Q1 [33]
马斯克买了新厂房上GPU,2GW供电规模,“巨硬”更更硬了
量子位· 2025-12-31 13:28
马斯克xAI“巨硬计划”与算力设施扩张 - 公司已确认启动代号为“MACROHARDRR”的第三栋专属厂房建设,此为“巨硬计划”的一部分[1][16] - 该计划下的第三厂位于美国密西西比州Soso地区,是一栋81万平方英尺的仓库,紧邻第二厂Colossus II[15][16] 第三厂MACROHARDRR的规模与意义 - 新厂房将具备2GW的供电规模,电力规模巨大[2] - 2GW电力按美国标准估算,可满足约150万户家庭的用电需求[3] - 参照200MW支持11万台GB200的架构效率推算,2GW电力可支持约110万台英伟达GB200 NVL72 GPU[4] - 该设施建成后,将使xAI的算力储备达到全球之最[5] 第一厂Colossus I的成就 - 第一厂代号为Colossus I,验证了公司大规模自建超级计算集群的可行性[6] - 从无到有建成所有配套设施仅用了122天,从第一个机架落地到开始训练任务只用了19天,建设速度极快[6] - 目前Colossus I仍是全球规模最大、运行状态最稳定的单一算力集群[7] - 该集群配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72 GPU[7] 第二厂Colossus II的规划与进展 - 第二厂Colossus II项目于2025年3月7日正式启动,公司在孟菲斯收购了一座100万平方英尺的仓库及两块相邻地块,总面积达100英亩[9] - 截至2025年8月,Colossus II已安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU[10] - 按照规划,Colossus II第一阶段部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1GW[11] - Colossus II被确认为“巨硬计划”的一部分[12] 项目历史与选址关联 - “巨硬”项目名称由马斯克早在2021年就已构思好[14] - 第三厂MACROHARDRR选址紧邻Colossus II,仅隔州界,且施工人员已修建了一条连接两厂的新路[16] 设施建设引发的社区问题与应对措施 - 由于选址靠近居民区,Colossus建成时因使用便携式燃气轮机而遭到大量投诉,被指加剧空气污染[17] - 2025年初,公司从Colossus移除了部分燃气轮机,并将更多基础设施项目迁移至密西西比州[18] - 公司通过与德州能源公司Solaris Energy Infrastructure合资(Solaris持股50.1%,xAI持股49.9%),在密西西比州建设一座永久性的燃气轮机发电厂,为Colossus II提供电力[18][19] - Solaris在证券文件中表示,预计到2027年初,通过合资企业向xAI提供超过1GW的电力[20] - 发电厂的建设又因发电机和施工噪音遭到附近居民投诉,公司已在发电厂场地与居民区之间竖立高墙以降噪[20] - 为避免对当地电网造成冲击,公司在Colossus II场址部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力支持,确保当地居民用电稳定[20] 巨额资金需求与融资传闻 - 系列算力设施的建设与扩容需要巨额资金支持[21] - 一个月前,多家外媒报道称,xAI正计划以2300亿美元估值筹集150亿美元资金[22] - 针对融资报道,马斯克回应称“消息不实”,但未给出更多解释[23]
黄仁勋「收购式」抢人继续:20多亿美金“买走”Mobileye创始人AI新团队
量子位· 2025-12-31 13:28
文章核心观点 - 英伟达拟以20~30亿美元收购以色列AI初创公司AI21 Labs,此举主要目的是获取其200多位顶尖AI人才,属于典型的“雇佣式收购”或“收购式招聘” [1][2][5] - 通过一系列战略性收购,英伟达正从一家芯片公司向AI全产业链垂直整合,构建从硬件、软件到应用解决方案的完整生态 [48][50][52] 收购交易概况 - 英伟达拟以20~30亿美元收购以色列AI初创公司AI21 Labs [1] - AI21 Labs在2023年的估值约为14亿美元,2024年初由英伟达和谷歌领投了3亿美元融资,但估值提升不大 [4] - 按交易金额和200多位人才计算,英伟达为每位人才支付的隐性成本约为1000万~1500万美元 [5] - 英伟达目前手握600多亿美元现金,具备进行此类收购的财务实力 [6] 目标公司AI21 Labs背景 - AI21 Labs成立于2017年,是以色列为数不多的自主研发大语言模型的公司 [3][7] - 公司主要业务包括自研基础模型以及为企业提供模型定制化服务 [28] - 自研模型包括Jurassic系列(已迭代至第二代)以及采用“Mamba-Transformer”混合架构的开源大模型Jamba(截至2024年3月已更新至1.6版本) [28][29] - 公司产品包括早期的AI写作工具Wordtune、AI阅读工具Wordtune Read,以及2024年推出的AI智能体编排系统Maestro [31][32][33] 创始团队背景 - 董事长Amnon Shashua:希伯来大学计算机科学系讲席教授,在机器学习和计算机视觉领域发表160多篇论文,拥有140多项专利 [11][13];曾创立自动驾驶公司Mobileye,该公司于2017年被英特尔以153亿美元收购,是以色列历史上规模最大的收购案 [3][17];目前领导并参与5家公司的运营,业务涵盖汽车、辅助可穿戴设备和金融科技等领域 [15][16];2023年获以色列终身成就奖,2024年被评为以色列最富有的前20人之一 [19] - 联合CEO Ori Goshen:连续创业者,在创办AI21 Labs之前曾创办并出售两家公司,分别专注于电信数据分析和即时通讯应用 [20][21] - 联合CEO Yoav Shoham:斯坦福大学计算机科学系荣誉退休教授,曾担任谷歌首席科学家 [24];创业经历丰富,其创办的多家公司(如TradingDynamics, Katango, Timeful)先后被Ariba和谷歌收购 [25] 英伟达的收购战略与整合 - 此次收购主要看中AI21 Labs的200多位顶尖AI人才,正值英伟达在以色列Kiryat Tivon建设大型园区并急需招人之际 [38][39][40] - 这种“收购式招聘”已成为英伟达获取核心人才、规避业务垄断监管的高效策略 [41][42] - 近期类似案例:英伟达与Groq达成的“非排他性技术许可协议”,核心是Groq创始人兼CEO(谷歌前TPU首席设计师)、总裁及约90%员工整体加入英伟达,旨在获取其低能耗AI推理芯片团队以对抗谷歌TPU [43][44] - 收购AI21 Labs可带来“意外之喜”:其企业级大模型与AI应用构建能力,能将英伟达的算力转化为客户可用的商业解决方案,完善英伟达在以色列从硬件、软件到AI应用的战略拼图 [47][49][50] - 英伟达通过全球收购整合上下游,例如:2019年以69亿美元收购Mellanox(高性能网络互联);2024年以约7亿美元收购Run:ai(GPU资源编排与调度);2024年以约3亿美元收购Deci(AI模型优化与部署) [55] 行业趋势与公司定位 - 全球AI人才普遍“身价暴涨”,科技巨头争抢顶尖人才 [6] - 英伟达通过一系列收购,已不满足于仅作为芯片公司,而是将触角延伸至AI产业链的上下游,进行垂直整合 [51][52]
MiniMax作价461亿港元募资46亿,1月9日敲钟代码00100
量子位· 2025-12-31 13:28
公司上市进程 - MiniMax于2025年12月31日启动招股,预计2026年1月9日在港交所挂牌上市,股票代号00100 [2][7] - 本次IPO拟募资超过6亿美元,发行估值将超过461亿港元,发行规模为2538.9万股,定价区间为151-165港元/股 [7][13] - 共有14家基石投资者参与认购,总额约27.23亿港元,包括阿里巴巴、阿布扎比投资局、IDG资本、Perseverance Asset Management及韩国未来资产等 [7][8] - 若成功上市,MiniMax将成为从2022年成立到完成IPO用时最短的公司 [51] 行业背景与竞争格局 - 2025年底AI行业迎来上市窗口期,智谱与MiniMax几乎同时启动招股,共同冲击“全球大模型第一股” [3][6][9] - 2025年12月是自2019年以来香港IPO最繁忙的一个月,共有25家公司完成上市 [9] - 智谱与MiniMax的同时招股点燃了市场情绪,但流量也被一分为二 [10] - 与主营B端业务的智谱(毛利率长期维持在50%以上)相比,MiniMax的商业模式呈现出K型分叉,凸显了AI在B端与C端商业化落地的差异 [39] 公司业务与市场地位 - MiniMax定位为全球化的通用人工智能(AGI)科技公司,服务覆盖全球200多个国家和地区,国际化业务收入占比达70% [12] - 公司采用多模态技术路线,在文本、语音、音乐、视频及智能体等多个领域均有布局 [15][16] - **文本模型**:2024年发布的M2模型在Artificial Analysis榜单上刷新国产文本模型最高成绩,位列全球前五、开源第一,推理速度是Claude 4.5 Sonnet的两倍,API价格仅为后者的8% [20][21] - **语音模型**:Speech模型已迭代至2.6版本,支持40多种语言,累计生成超2.2亿小时(约2.5万年)语音,并为ChatGPT的LiveKit提供底层技术引擎 [24] - **音乐模型**:Music 2.0支持生成长达5分钟、结构完整的专业级歌曲 [25] - **视频模型**:海螺AI(Hailuo)在VBench和Video Arena等国际榜单中位列第一梯队,已帮助全球用户创作超5.9亿个视频 [26][28] - **智能体与平台**:推出国内首款全栈通用智能体MiniMax Agent及交互平台星野(Talkie) [30] B端业务通过MiniMax开放平台销售API,日均处理超万亿Token请求,已为超100个国家及地区的客户提供服务 [31][32] 财务表现 - **营收高速增长**:2023年营收346万美元,2024年飙升至3052万美元,同比暴涨782.2% [35] 2025年前9个月营收达5344万美元,同比增长175%,已超2024年全年 [36] - **收入结构**:截至2025年9月30日,C端收入同比增长181%,B端收入同比增长160% [37] - **毛利率显著改善**:毛利率从2023年的-24.7%转正至2024年的12.2%,并在2025年前9个月提升至23.3% [38] 其中,C端业务毛利率为4.7%,B端业务毛利率高达69.4% [40] 若剔除C端产品星野的影响,整体毛利率将接近50% [41] - **高昂的研发投入**:训练相关的云计算服务开支持续攀升,2022年至2025年前9个月分别为415万美元、4723万美元、1.4亿美元和1.42亿美元 [43] 训练成本占收入的比例从2023年的超1365%降至2025年前9个月的266.5% [43] - **仍处亏损状态**:2022年至2024年经调整净亏损分别为1215万美元、8907万美元和2.44亿美元,2025年前9个月经调整净亏损为1.86亿美元 [45] - **充裕的现金储备**:截至2025年9月30日,公司现金储备合计11.02亿美元,足以支持正常运营53个月以上 [46][47] 公司团队与投资人 - 创始人兼CEO闫俊杰曾任商汤科技副总裁,早期核心团队周彧聪、贠烨祎等均来自商汤,具备成熟的工程化落地能力和算法研究体系 [53][55][56] - 公司全员385人,平均年龄29岁,其中研发人员占比高达73.8% [57][58] - 成立近4年累计融资超15亿美元(约106亿元人民币),投资方包括米哈游、阿里巴巴、腾讯、高瓴、IDG、红杉、经纬等战略投资人与知名机构 [50]
AI终于学会在家“伺候人”!Hey Tuya,我躺了
量子位· 2025-12-31 11:37
文章核心观点 - 涂鸦智能推出名为“Hey Tuya”的AI生活助手,其定位为“操作系统级”AI Agent,旨在通过深度整合软件与硬件,实现跨设备、全场景的智能协同与主动服务,代表了AI从被动响应指令向主动感知与预判的演进方向 [1][6][7][29][46][62] “Hey Tuya”产品功能与体验 - **设备协同与场景DIY**:用户可将家中智能设备接入涂鸦APP,并像搭积木一样自定义智能场景(如回家模式、影院模式),由AI助手协同执行 [13][16][17] - **家庭安防与主动关怀**:AI助手具备7x24小时家庭安防能力,支持通过摄像头进行视觉识别与视频快速检索,并在检测到疑似跌倒等异常时,能协同智能手表数据,主动询问并提供紧急程度评估建议 [23][24][26][28] - **能源管理与健康助理**:提供一键定制能源管理方案及智能化节能策略,并具备AI卡路里功能,可通过拍照识别餐食并分析其热量与营养成分 [30][31][40][42] - **个人事务管理与职场辅助**:具备AI待办功能,可将自然语音自动整理为待办事项并进行情景化主动提醒,同时拥有AI笔记功能,可模拟用户声音接入会议并一键生成结构化会议纪要 [32][33][35][37][38] - **持续进化与多模态交互**:AI助手将持续融入AI播客等新功能,并能作为知识渊博的伙伴进行百科解答与轻松交谈 [43][45] “Hey Tuya”的底层技术架构 - **核心引擎**:由涂鸦自研的Physical AI Engine (PAE) 驱动,这是一套面向真实设备与环境的系统级AI引擎,旨在让AI参与物理世界的感知、理解与执行 [46][47] - **基础设施**:构建于涂鸦全球技术底座之上,包括连接全球AI与设备节点的AI-Device Real-Time Network (AD-RTN) 和提供低延迟实时通信的Tuya Real-Time Communication (T-RTC) [48][49] - **三大协同引擎**:PAE内部并行运行Conversational AI Engine(负责自然语言与多模态交互)、Vision AI Engine(用于基于视觉的意图理解)和IoT Intelligence Engine(直接连接并调度物理设备) [50][51] - **记忆与学习机制**:引入了持续演进的OmniMem长期记忆机制,系统能在多模态交互、设备使用行为等维度学习,逐步建立对用户偏好与习惯的长期认知 [53][54] 涂鸦智能的公司背景与生态优势 - **公司发展历程**:涂鸦智能成立于2014年6月,早期聚焦设备联网与云平台,现已战略升级为AIoT,致力于从“连接赋能”转向“智能赋能” [56][58] - **创始人背景**:创始人兼CEO王学集与联席董事长兼总裁陈燎罕曾共同开发国内知名开源论坛程序PHPWind,并推动其商业化运营 [58] - **平台规模与生态**:截至2025年9月30日,涂鸦AI开发者平台注册开发者数量超过162.2万个,分布于全球超200个国家和地区,其全球AIoT生态涵盖8大品类、3000余个产品系列 [60][61] - **商业化潜力**:“Hey Tuya”的能力未来可被采用涂鸦OEM App的品牌方集成,并自定义专属AI助手,其商业价值有望从单点功能收费演化为连接硬件、服务与用户关系的长期系统 [61][62]
量子位编辑作者招聘
量子位· 2025-12-31 11:37
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招(覆盖编辑、主笔、主编各个层级)和校招(应届毕业生,接受实习且可转正)[4][6] - 所有岗位不同能力层级职位均在开放,工作地点为北京中关村[2][4] AI产业方向岗位详情 - 岗位职责:关注基建层创新,包括芯片、AI Infra、云计算领域新进展及核心玩家动态[5][6] - 岗位职责:对前沿论文、开源社区、技术大会(如Hot Chips、NeurIPS、MLSys)技术报告进行大众化解读[6] - 岗位职责:参与核心采访,对话产业专家、技术大牛,撰写AI云落地案例[7] - 任职要求:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11] - 任职要求:熟悉AI行业的供应链与生态(训练-推理、算力-成本、云-芯片关系)[11] - 任职要求:能把复杂技术内容结构化表达,有技术背景、理工或CS/EE方向优先[11] AI财经商业方向岗位详情 - 岗位职责:聚焦创投、AI创业公司、上市公司、商业模式、产业链资本动向[11] - 岗位职责:产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 岗位职责:访谈对话投资人、创业者、产业分析人士[11] - 任职要求:对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 任职要求:逻辑结构强,对商业叙事敏感,热爱对话采访,社交型人格[11] AI产品方向岗位详情 - 岗位职责:关注AI在终端的落地,包括软件应用产品、硬件方向落地[6][11] - 岗位职责:撰写AI应用产品深度评测,跟踪多终端新品发布(如手机、PC、XR、车机等)[11] - 岗位职责:对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求:对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 任职要求:熟悉各大终端厂商业态、体验方法论,有强逻辑、体验表达和结构化能力[11] 岗位通用职责与任职要求 - 主编需具备选题和带队能力及经验[6] - 主笔需具备原创深度稿件能力[6] - 编辑需热爱表达,喜欢挖掘信息,能够用大白话让所有人看懂AI新进展[6] 加入公司的潜在收获 - 能第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系[6] - 能将各种AI新技术、新工具应用于工作,提升工作效率和创造力[6] - 通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领袖[6] - 与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业视野[6] - 应届新人会由主编级编辑出任mentor,提供一对一指导,帮助更快成长[6] - 加入扁平、简单、开放、多劳多得能者上位的活力团队[6] - 获得行业TOP薪资待遇,五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]
有300亿美元也未必“再造GPT-4”?NUS尤洋最新长文:拆穿AI增长瓶颈的真相
量子位· 2025-12-31 11:37
文章核心观点 - 当前人工智能行业面临的核心瓶颈并非算力增长停滞,而是现有技术范式(以Transformer架构为核心)对持续增长的算力的吸收和转化效率正在下降,即“算力增长与智能增长之间的映射关系开始松动”[2][22] - 智能的本质可被工程化地定义为“对未来状态进行预测,并为预测结果承担实际后果的能力”,这解释了Next-Token Prediction的成功,也揭示了当前许多模型在真实世界应用中的短板[8][10] - 未来智能增长的关键在于寻找“扩展性更强的架构或Loss函数”,以在极端算力投入下(如300亿美元预算)稳定地将新增算力转化为可兑现的能力增量,而非仅仅追求效率优化(如更高的吞吐量)[23][26] 智能的本质与评估 - 智能的核心能力被定义为对未来状态的预测及承担后果的能力,这为评估智能提供了一个工程化、可验证的标准[8] - 这一视角解释了Next-Token Prediction能成为“智能发动机”的原因,也揭示了在封闭评测中表现优异的系统在真实不确定环境中暴露短板的问题[10] - 将智能凝聚为“预测”是为了划定一个工程上可对齐算力投入的核心能力维度,但规划、因果建模等能力是否能完全还原为预测仍是开放议题[10] 当前技术范式的成功与局限 - 过去十年大模型的智能跃迁依赖于三件事同时发生:GPU提供指数级增长的并行算力、Transformer架构能充分“吃下”这些算力、Next-Token Prediction提供了无限且统一的学习信号[15] - Transformer的成功不仅是算法胜利,更是模型架构与硬件体系(英伟达GPU)高度匹配的系统性结果,它是一台“伪装成神经网络的并行计算机”[6][16] - 该范式的有效性部分受益于语言任务本身高度符号化、序列化,且评测体系与训练目标高度一致的特性[17] - 在此范式下,从GPT-1到ChatGPT,算力增长、模型规模扩大与能力提升之间形成了相对稳定的正反馈链路[18][19] 智能增长的瓶颈所在 - 判断智能瓶颈的具体标准是:当一次训练的FLOPS从10^n变成10^{n+3}(即增长1000倍)时,是否还能稳定获得显著更强的模型[20] - 瓶颈的本质是“算力增长与智能增长之间的映射关系开始松动”,即现有范式对新增算力的吸收效率下降,而非算力红利消失[2][22] - FLOPS被视为最底层、最难被包装的算力尺度,比Token数、参数量等指标更能反映本质[21] - 真正的难点在于缺乏一种“扩展性更强的架构或Loss函数”,能把新增算力稳定地转化为能力增量[23] 对行业主流讨论的批判性视角 - 预训练、监督微调(SFT)、强化学习(RL)三者本质都是在计算梯度、更新参数,可被统一视为不同的“算力使用策略”[11][12] - 当前模型的主要智能来源是预训练阶段,根本原因是其消耗了最多的能源与计算[15] - 行业应关注“在算力持续投入的前提下,是否还能稳定地换取能力增长”这一更朴素的问题,而非陷入方法论之争[15] - Mamba等新架构提升了吞吐量,但解决的是“同等智能更便宜”,不自动等价于“同等成本更聪明”[6][23] 未来发展的潜在方向 - 未来AI基础设施的核心目标应是提升“并行计算体系在软硬件层面的整体扩展性”,而不仅仅是单点芯片性能,需维持或提升计算开销与通信开销的比值[24][25] - 探索方向包括:回归高精度计算(如FP32/FP64)、抛弃Adam优化器、采用更高阶优化器、探索更可扩展的架构或Loss函数、进行更多epoch与更深度的超参数探索[6][25] - 预训练所能承载的智能增长空间可能还远未走到尽头,关键在于找到在极端算力条件下持续变强的能力[26] - 只要还能找到更高效组织计算的方式,智能的上限就远未到来[27]
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2025-12-31 11:37
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在全景式检阅中国AI产品发展,深度洞察未来产业格局,寻找代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,要求产品在技术上突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘2025年崭露头角、具备2026年爆发潜力的创新产品,代表AI技术前沿方向 [8] - 十大细分赛道TOP3评选针对热度最高的10个领域,包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]