量子位
搜索文档
200亿上海手机代工巨头冲刺港股IPO,最大客户小米持股4.94%
量子位· 2026-01-12 12:13
公司概况与市场地位 - 公司是上海龙旗科技,是一家智能产品和服务提供商,即消费电子领域的原始设计制造商[1][5] - 公司已构建涵盖方案设计、硬件创新、软件平台开发、制造、供应链整合及质量控制的解决方案矩阵[5] - 公司产品组合包括智能手机、AI PC、汽车电子、平板电脑、智能手表、智能眼镜等,并整合为“1+2+X”业务框架[5] - 公司已于2024年3月在上海证券交易所主板上市,当前最新市值约200亿元,并已通过港股聆讯,即将完成“A+H”股上市布局[2][3] - 以2024年消费电子ODM出货量计,公司是全球第二大消费电子ODM厂商,占据22.4%的市场份额[17] - 在智能手机ODM市场,公司2024年出货量达1.73亿台,市场份额达32.6%,是全球最大的智能手机ODM厂商[4][8][19] 业务结构与客户 - “1+2+X”业务框架中:“1”为核心主业智能手机;“2”为重点发展业务AI PC和汽车电子;“X”为新兴消费电子多品类业务,包括平板、穿戴设备等[10] - 智能手机业务提供从概念设计、硬件软件开发到测试验证及规模化生产的全流程服务,是公司主要收入动力[7] - 2024年,在以出货量计的全球智能手机前十品牌中,公司与其中八家建立了业务合作,平均合作年限在五年以上[9] - 公司客户涵盖小米、三星、联想、荣耀、OPPO、vivo等品牌,其中小米是最大客户[4][15] - 2024年,前五大客户贡献了公司总收入的82.2%[25] - 2022年至2024年及2025年前9个月,来自第一大客户小米的收入分别为133.6亿元、115.2亿元、172.6亿元和89.5亿元,占总收入比例分别为45.5%、42.4%、37.2%及28.6%[26][27] 财务表现 - 2022年至2024年,公司营业收入分别为293.4亿元、271.9亿元和463.8亿元[20] - 2025年前9个月,公司营业收入为313.3亿元,同比下滑10.3%[21] - 2024年收入大幅增长主要由于5G手机放量及AIoT爆发,2025年收入下滑则因公司战略调整,放弃低毛利订单[22] - 按产品划分收入:智能手机是主要收入来源,2022年至2024年及2025年前9个月收入分别为242.7亿元、218.2亿元、361.3亿元及217亿元,占总收入比例分别为82.7%、80.3%、77.9%和69.3%[24] - AIoT及其他产品收入占比增长明显,同期分别为6.5%、9.2%、12.0%和17.9%[24] - 平板电脑收入占比同期分别为9.5%、9.2%、8.0%和9.5%,维持稳定[24] - 2022年至2024年,公司毛利率分别为8.1%、9.5%和5.8%;2025年前9个月毛利率回升至8.3%[28] - 2024年毛利率下滑因原材料采购价上涨及战略性市场拓展,2025年回暖因提升项目品质、放弃低利润项目及原料价格趋稳[29][30] - AIoT及其他产品的毛利率水平相对最高,其营收占比扩大预计将进一步拉动整体毛利水平[31] - 2022年至2024年,公司净利润分别为5.62亿元、6.03亿元和4.93亿元;2025年前9个月净利润为5.14亿元,已超过2024年全年水平[32] 研发与资金 - 公司研发和工程团队由约5200名专业人员组成[35] - 2022年至2024年及2025年前9个月,研发开支分别为15亿元、16.9亿元、20.8亿元和19.5亿元,占总收入比重分别为5.1%、6.2%、4.5%和6.2%[35] - 截至2025年三季度末,公司的现金及现金等价物为68.5亿元[36] 发展历程与战略 - 公司成立于2004年,创始人、董事长为杜军红博士,其在消费电子领域有20多年经验,曾为中兴通讯高管[37][39] - 公司最初以IDH模式起家,后发展为消费电子ODM巨头[42] - 公司于2005年在新加坡证券交易所上市,后于2020年退市并转战A股,最终于2024年3月在上交所成功上市[44][45] - 公司成立同年获得IDG资本和招商局资本的天使轮融资;小米科技、顺为资本和基石资本参与了A轮融资,小米目前持有公司4.94%的股份[48] - 公司冲刺港股IPO募资的主要目的包括:扩大海内外产能、加大AI等核心技术的研发投入、拓展市场、进行战略投资及补充流动资金[54] 新兴业务进展 - AI PC业务:公司于2024年第三季度推出了首款搭载高通骁龙处理器的笔记本电脑产品,以拓展商用和消费领域AI应用[12] - 汽车电子业务:自2022年成立团队以来,已与小米、蔚来等OEM及一级客户建立合作,获得超过十个定点项目[13] - 新兴品类:在AIoT等领域进展迅猛,2024年与互联网头部客户合作推出多款智能眼镜,总出货量已超过200万台;在智能手表/手环、智能眼镜等领域的出货量已跃居行业前二[14]
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2026-01-12 12:13
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在对过去一年中国AI产品发展进行全景式检阅,并深度洞察未来AI产业格局,目标是找到代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,这些产品在技术上实现突破,并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘在2025年崭露头角、具备2026年爆发潜力的创新产品,这些产品代表了AI技术的前沿方向 [8] - 十大细分赛道TOP3评选针对热度最高的10个领域,依次为:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 「AI 100」是量子位智库推出的AI产品风向标系列内容,旨在全维度提供AI技术驱动下产品长期创新和变革的第三方参考,主要由「旗舰 AI 100」和「创新AI 100」构成,按季度发布 [12] - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、用户增长、用户活跃、用户粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;对于硬件产品则考察产品出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;对于硬件产品则考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单计划于2026年1月中下旬发布 [10]
具身智能数据战开打!每个普通人都能上手,边采边筛,只投喂机器人爱吃的丨穹彻
量子位· 2026-01-12 12:13
这套 可搭载手机的数采终端及其配套应用程序,名叫RoboPocket,来自具身智能创企穹彻智能 。 现在,一部手机,加一个"夹爪",就能随时随地完成具身智能数据采集了! 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 采出来的数据不脏也不废,已经在实际模型训练中跑出了效果 。 模型在多步连续任务中动作衔接更稳定; 在真实场景中面对光照变化、环境杂乱、物体遮挡时也更不容易失手,执行鲁棒性显著提升; 而当任务发生小幅变化,比如同类但不同顺序的操作目标出现时,模型也更容易举一反三,做出合理应对。 这套采集系统,模型效果是纯纯地全肯定。 它是新兴采集设备UMI (Universal Manipulation Interface) 的进阶状态。 和传统UMI方案相比,RoboPocket保持便携易用的基础上,更加轻盈:手机+夹爪即是一个节点。 如此一来,每个人——哪怕是普通人,都可以从口袋里掏出RoboPocket,随时随地采集具身数据。 但这还算不上它最出彩的地方。 最妙的是,RoboPocket把模型需求前置到采集一线,让你随时接入模型的训练闭环。 采集行为发生时,系统会同步判断每一段数据的训练价值,并即时给 ...
昔日开源明星被AI逼落斩杀线!收入暴跌80%,75%工程师被裁
量子位· 2026-01-12 12:13
公司核心事件与现状 - 明星开源项目Tailwind CSS的母公司因AI冲击业务,裁撤了75%的工程师团队,公司目前仅剩三位老板、一位工程师和一位兼职员工 [5][21][23] - 公司核心付费服务(如Tailwind UI、Catalyst)的收入因AI冲击出现高达80%的恐怖滑坡 [8] - 公司现金流面临断裂风险,据CEO判断,若趋势无法阻止,六个月后现金流就将断掉 [30] - 公司开源框架Tailwind CSS的官方文档访问量相比2023年初下降约40%,AI导致用户不再通过官网查阅文档 [25] - 尽管经营危机严重,但公司目前仍有一定现金储备,这也是选择此时裁员以支付丰厚遣散费的原因 [36][37][38] 商业模式与AI冲击 - 公司商业模式依赖开源框架Tailwind CSS作为分发渠道,绝大部分付费用户由此转化,但AI直接绕过了该渠道 [24] - AI时代导致底层逻辑转变:Tailwind CSS的实际使用量比以往任何时候都高,但新增流量绝大多数由AI发起,无人查阅文档,导致“使用量不再等于价值获取” [52][53] - AI概括和提取信息的能力,无需引导用户访问官网,这对所有靠流量变现的企业构成威胁 [50] - 基于注意力经济的商业模式正在消亡,文档、模板及高级工具的输出被AI模型吸收,切断了公司的收入来源 [53] 行业影响与启示 - Tailwind的困境是行业缩影,所有依赖引流盈利的开源项目,当其领域被AI覆盖时,都可能面临类似崩溃风险 [49][50] - 开源项目是AI训练的重要数据来源,但其赖以生存的商业模式因AI而瓦解,会给行业带来严重的负外部性 [64] - 行业急需建立健康的付费机制,让开源贡献者获得应得收入,而非仅靠科技公司临时赞助 [66] - 谷歌AI Studio团队宣布赞助Tailwind,帮助维护其开源生态,此举被视为对开源社区释放的积极信号 [55][56][58] 社区反应与公司回应 - CEO以需维持生计为由,拒绝了为LLM优化官方文档的PR请求,认为此举会让公司处境雪上加霜 [18][32] - 在CEO坦诚公司情况后,90%的社群用户平息了怒火,但仍有老用户批评公司以盈利为由拒绝为开源项目做贡献 [42][43] - 有批评指出,公司困境应归咎于管理层的错误决策,而非社区或AI [46][47] - 谷歌赞助后,公司CEO表示有足够时间和空间尝试新想法,不再需要拯救 [60]
量子位编辑作者招聘
量子位· 2026-01-12 12:13
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台被认定为AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招接受应届毕业生及实习生[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层新进展,涵盖芯片、AI Infra、云计算领域及核心玩家动态[6] - 职责还包括对前沿论文、开源社区、技术大会报告进行大众化解读[6] - 需要参与核心采访,对话产业专家、技术大牛,并撰写AI云落地案例[7] - 任职要求对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11] - 要求熟悉AI行业供应链与生态,并能将复杂技术内容结构化表达,有技术背景者优先[11] AI财经商业方向岗位详情 - 岗位职责聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11] - 需要产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 需要访谈对话投资人、创业者、产业分析人士[11] - 任职要求对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 要求逻辑结构强,对商业叙事敏感,并热爱对话采访[11] AI产品方向岗位详情 - 岗位职责关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 需要撰写AI应用产品深度评测,并跟踪多终端新品发布[11] - 需要对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 要求熟悉各大终端厂商业态和体验方法论,并有强逻辑与结构化表达能力[11] 加入公司的潜在收益 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 可将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 可通过撰写独家原创内容建立个人知名度,成为AI领域意见领袖[6] - 可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人可获得主编级编辑的一对一指导[6] - 可加入扁平、简单、开放、多劳多得的团队氛围[6] - 可获得行业TOP薪资待遇及五险一金、餐补、绩效、加班补助等福利[6]
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
量子位· 2026-01-12 08:37
Spirit v1.5模型性能表现 - 千寻智能的具身智能基础模型Spirit v1.5在RoboChallenge真机评测榜上,以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5,登顶榜首[1] - Spirit v1.5是RoboChallenge自上线以来,首个击败基准模型Pi0.5的国产具身模型,同时也是首个在该榜单上成功率超过50%的具身智能模型[3] - 在“寻找绿盒”任务中,Spirit v1.5的成功率达到90%,显著领先于Pi0.5的80%和Pi0的70%[11][12] - 在“水果入篮”任务中,Spirit v1.5以80%的成功率领先Pi0.5(40%)整整一倍[14] - 在“贴胶带”任务中,Spirit v1.5以20%的成功率实现对比Pi0.5(10%)的翻倍领先[20] - 在“插花”任务中,虽然Spirit v1.5与Pi0.5成功率均为50%,但Spirit v1.5的稳定性更高,没有出现极端的失败案例[16] 技术路径与数据策略 - Spirit v1.5的核心创新在于预训练阶段的数据策略,从高度精选、强控制的“干净数据”转向多样化、开放式、弱控制的数据采集范式[33][34] - 开放式采集鼓励数据采集员围绕任务目标自由行动,而非遵循固定流程,使数据连续覆盖抓取、插入、整理、双臂协作等大量原子技能[40][41][43] - 该数据策略带来工程收益:人均有效采集时长提升约200%,对算法专家深度介入的需求降低约60%[45] - 消融实验显示,在预训练数据规模一致的前提下,采用多样化预训练的模型在新任务上达到相同性能时,所需迭代次数减少约40%[47] - 研究表明,对具身模型而言,任务多样性比单一任务的演示数量更为关键,模型学到的是可迁移的通用策略[52] RoboChallenge基准测试平台 - RoboChallenge由Dexmal原力灵机联合Hugging Face发起,是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,被誉为具身智能的“ImageNet”[8][25] - 其Table30任务集通过30个高频桌面及周边日常场景,从视觉语言动作模型难点、机器人形态、任务流程与物体属性等维度考察模型真实世界通用操作能力[25] - 平台采用远程机器人范式,参赛者通过HTTP接口向机器人发送控制指令,显著降低参赛门槛,并使不同算法能在同一套真实硬件条件下接受统一评测[27][29] - 平台区分任务特定与通用型两种训练协议,榜单中带有“/multi”后缀的模型遵循更具挑战性的通用型设定[32] 公司背景与行业影响 - Spirit v1.5的研发团队千寻智能成立于2024年1月,是一家具备AI+机器人全栈技术能力的具身智能公司,常被称为“中国版Figure”[57][58][59] - 公司创始人兼CEO韩峰涛为机器人行业连续创业者,曾主导交付超2万台工业机器人;联合创始人兼首席科学家高阳为清华交叉信息研究院助理教授,其提出的ViLa算法被Figure采用[61] - 2025年,千寻智能完成超15亿元融资,其中PreA+轮由京东领投6亿元[61] - 公司通用人形机器人“小墨”已于2025年底在宁德时代电池产线规模化落地,精细作业成功率突破99%[61] - Spirit v1.5同步开源了模型权重、推理代码及使用样例,其登顶成绩及开源举措意味着技术进展被放入开源体系,旨在与社区共同推动具身智能发展[7][56][68][71]
没人提问了但Stack Overflow赚钱更多!AI没有赶尽杀绝
量子位· 2026-01-11 15:00
核心观点 - 以ChatGPT为首的AI冲击导致Stack Overflow社区流量和用户活跃度大幅下滑,其作为公共论坛的ToC业务面临严峻挑战[1][2][8] - 公司通过将积累的高质量技术问答数据授权给AI公司,并发展ToB的SaaS服务,成功实现商业转型,营收大幅增长并显著减亏[5][6][11] - 当前的盈利模式主要依赖变现历史数据存量,但社区新数据生成乏力、用户流失及AI垃圾内容侵蚀质量等问题,对其长期数据价值构成威胁[25][27][31][33] 社区流量与用户活跃度现状 - 社区流量一路下滑,用户凋零[2][9] - 2024年某月全站新提问仅6866个,数量与2008年刚上线时水平相当[3] - 巅峰时期每月有超过30万个新问题,高光不再[9] 财务与商业转型表现 - 年营收翻倍,达到1.15亿美元的新高[5] - 公司亏损从8400万美元大幅下降至2200万美元[6] - 核心盈利逻辑转变:从依赖社区流量的广告收入,转向向AI公司出售高质量数据以及发展企业SaaS服务[7][11][19] - 2024年通过数据授权方式获得超过2亿美元收入[23] 数据价值与商业模式 - 社区拥有严苛的治理机制,强调答案的可验证与可复用,通过点赞/踩和提问者勾选最佳答案来筛选内容[12][13] - 社区持续编辑旧答案以确保时效性与精简性,并覆盖大量边缘案例和错误修复,保证了数据的高纯净度与高信噪比[15][16] - 这些高质量数据对大模型理解编程逻辑和进行错误诊断极具训练价值[17] - 推出生成式AI插件Stack Internal,以SaaS模式为企业内部提供技术支持,已被全球约25000家公司采用[20][21] - 学习Reddit模式,将历史问答内容进行数据授权和许可[22] 成本控制与运营调整 - 进行大规模裁员,主要集中在市场营销部门[24] - 减少传统广告和一般销售投入,集中资源支持AI产品研发[24] - 探索利用AI工具协助社区版主审核信息[24] - 通过组合拳,公司利润得到大幅改善,并接近现金流平衡[24] 面临的挑战与风险 - 当前盈利本质是变现过去十几年积累的存量数据[25][26] - 社区缺乏吸引新用户的渠道,老用户转向大模型,有关新技术的讨论日渐稀少[27][31][32] - 平台尝试接入AI功能后,反而让社区充斥更多垃圾回答,与“高质量复用”定位相悖,打击用户信赖[33] - 调查显示,80%以上的平台用户尝试使用AI,但只有29%的人信任其输出结果,而这些用户并未回归社区[35][36] - 若无法持续获取新技术问答,数据库将面临技术断代,其数据对AI公司的长期价值存疑[28][29] - 公司已失去数据闭环,依赖“吃老本”的可持续性未知[36]
量子位编辑作者招聘
量子位· 2026-01-11 12:02
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台被认定为AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招接受应届毕业生及实习生[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层新进展,涵盖芯片、AI Infra、云计算领域及核心玩家动态[6] - 职责还包括对前沿论文、开源社区、技术大会报告进行大众化解读,并参与产业专家采访及撰写落地案例[6][7] - 任职要求需对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解,并熟悉AI行业供应链与生态[11] - 要求候选人能将复杂技术内容结构化表达,有技术背景或理工/CS/EE方向优先[11] AI财经商业方向岗位详情 - 岗位职责聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11] - 需产出创投融资、招股书财报解析、公司战略分析等稿件,并访谈投资人、创业者及产业分析人士[11] - 任职要求需对数据敏感,对财报、股权结构、战略规划感兴趣,并具备强逻辑和对商业叙事的敏感度[11] - 要求候选人热爱对话采访,具备社交型人格[11] AI产品方向岗位详情 - 岗位职责关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 需撰写AI应用产品深度评测,跟踪多终端新品发布,并对话AI应用创业者、产品专家及终端技术专家[11] - 任职要求需对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 要求候选人熟悉各大终端厂商业态和体验方法论,具备强逻辑、体验表达和结构化能力[11] 加入公司的优势 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 可将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 通过撰写独家原创内容,可建立个人知名度,成为AI领域意见领袖[6] - 可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人可获得主编级编辑的一对一指导[6] - 团队氛围扁平、简单、开放,奉行多劳多得、能者上位的原则[6] - 提供行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 岗位层级能力要求 - 主编需具备选题和带队能力及经验[6] - 主笔需具备原创深度稿件能力[6] - 编辑需热爱表达,喜欢挖掘信息,能够用通俗语言解读AI新进展[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 需随简历附上科技行业代表作品或能展现个人写作水平和风格的作品[11]
小模型层数好玄学:12/32/64层效果好,16/24/48/层效果糟
量子位· 2026-01-11 12:02
研究背景与作者 - 研究由知名开源项目OpenEvolve的作者Asankhaya Sharma及其团队进行,该作者在AI/ML领域有显著成就,包括率先关注大语言模型的“推理时计算”并发表论文,以及开源了OptiLLM、OpenEvolve、Adaptive Classifier等知名项目 [7][8] 核心发现:模型“形状”比架构更重要 - 对于约70M参数的小模型,架构的重要性远低于普遍想象,相比之下,模型的“形状”(即深度与宽度的比例)更为关键 [1] - 在70M参数模型范围内,测试了包括LLaMA3、Qwen3、Gemma3在内的12种不同现代架构,发现它们的平均性能差异不到2%,表现惊人地相似 [26] - 现代架构的改进(如RMSNorm、RoPE、GQA)是为70亿以上参数的模型设计的,在70M参数规模下无法带来可衡量的优势 [27] - 这意味着对于小模型,精心调整的“深度-宽度配比”比选择具体的架构变体更重要 [27] 层数“玄学”与隐藏维度的关键作用 - 研究发现模型层数存在“玄学”:12层、32层、64层效果良好,而16层、24层、48层效果糟糕,其中最佳层数为32层 [2][15] - 效果“好”的层级(12L、32L、64L)平均得分约38%,效果“糟”的层级(16L、24L、48L)平均得分约32%,两个层级阵营之间的平均差距超过6个百分点 [15][16] - 这一现象背后的关键因素是“隐藏维度”,模型的隐藏维度必须大于或等于512,这是一个基础门槛 [3][18] - 当隐藏维度小于512时,模型性能会显著下降,除非其深度处于特定的“补偿”位置 [20] - 32层是“黄金补偿点”,在隐藏维度为384的情况下,32层配置取得了所有测试配置中的最高平均得分38.50%,甚至略胜于标准的12层设计(隐藏维度512,得分38.15%) [16][20][23] - 64层则属于“暴力补偿”,通过极深的层数来弥补宽度(隐藏维度256)的不足,从而也取得了约38.21%的高分 [20][16] 扩散模型的竞争优势 - 在测试的架构中,扩散模型(如dLLM, Dhara)的平均准确率(约31%-32%)略低于自回归模型(约32%-33%) [28][29] - 但扩散模型在推理速度和事实准确性(幻觉率低)方面具有显著优势 [30] - 扩散模型的推理速度比传统自回归模型快3.8倍,非常适合批量任务处理 [31] - 在所有测试架构中,扩散模型在衡量真实性的TruthfulQA基准上得分最高,dLLM-Canon模型达到了49.27% [33][34] - 通过一种称为“Canon层”(一种精心设计的卷积层)的特殊结构,可以进一步提升模型的事实准确性,为普通模型提升约1%,为扩散模型提升超过2%,而参数开销仅增加0.13% [35][36] 高效模型转换方法与新模型发布 - 利用LLaDA 2.0论文中的Warmup-Stable-Decay方法,可以将现有的自回归模型高效转换为扩散模型,所需数据量、成本和训练时间仅为从头训练的十分之一 [38][39] - 这种转换方法不仅结果与从头训练相当,而且在多项基准测试上超越了后者 [39] - 基于所有研究发现,团队推出了集大成的Dhara-70M模型,该模型参数为71.34M,采用32层(黄金深度)和384隐藏维度的最佳形状配置 [41][44] - Dhara-70M的构建方法是:首先采用最佳的自回归架构,然后使用WSD方法将其转换为扩散模型,从而兼具自回归模型的知识储备和扩散模型的吞吐量与事实性优势 [42][43] 对小模型构建者的实践启示 - 对于资源有限的小语言模型构建者,不应盲目追求最新的架构改进,而应首先关注基础的“深度-宽度配比”,确保模型不落入性能低下的“死亡区域” [45] - 如果应用场景需要高速处理且对事实准确性要求高,那么扩散模型是一个极具竞争力的选择 [45]
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2026-01-11 12:02
2025年中国AI产品市场发展态势 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机实现了系统级AI智能体与操作系统的深度集成,重构人机交互范式 [4] 量子位智库「AI 100」榜单概览 - 榜单旨在对过去一年中国AI产品发展进行全景式检阅,并深度洞察未来AI产业格局,目标是找到代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,这些产品需在技术上实现突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘在2025年崭露头角、具备2026年爆发潜力的创新产品,这些产品代表了AI技术的前沿方向 [8] - 十大细分赛道TOP3评选将聚焦行业核心赛道,包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 「AI 100」榜单评估体系与内容 - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、用户增长、用户活跃、用户粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15]