Workflow
云雀大模型
icon
搜索文档
Mapping|“AI六小龙”高端人才流动史(试读)
36氪· 2026-02-03 11:25
文章核心观点 - 在AI领域,人才密度是资本定价的核心依据之一,市场给予公司数十亿甚至上百亿美元的高估值,本质上是对其未来人才所能创造价值的体现 [2] - 顶尖研究员、核心架构工程师以及商业化负责人的流向,反映了各家模型公司的技术实力、研发效率和未来潜力,人才加速向头部公司聚集预示着市场变化 [2] - 2022年底ChatGPT发布引发了“第二次AI人才大流动”,行业经历“百模大战”,但随着字节跳动等互联网巨头携流量与算力全面压境,以及DeepSeek等开源模型的搅局,市场格局被重画,“AI六小龙”面临高端人才流失和融资不顺的挑战 [3][4][5] 第二次AI人才大流动 - 上一次较大的AI人才流动潮在2016年前后,由AlphaGo事件驱动,2022年ChatGPT重新激活萎靡的AI行业,引发了第二次AI人才大流动 [3][4] - “AI六小龙”(智谱AI、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)在2023至2024年间吸引了超过百亿级资本押注,其中智谱、MiniMax估值率先突破200亿元 [5] - 2025年,随着DeepSeek以开源、低成本、高性能模型强势搅局,以及字节跳动、阿里、腾讯等互联网巨头全面压境,“AI六小龙”的叙事图谱被彻底重画,从2024年上半年开始频传高端人才流失、融资不顺的信号 [5] - 从“AI六小龙”出来的高端人才,做技术的更倾向于回流大厂,做产品、商务的则创业居多 [6] AI六小龙的成立与人才背景 - 智谱AI孵化于清华大学计算机系KEG实验室 [5] - 月之暗面创始人及4位联创曾为清华大学实验室成员 [5] - 百川智能6位联创团队中有4位毕业于清华大学 [5] - MiniMax创始人也毕业于清华大学,核心成员均来自高校 [5] - 阶跃星辰由前微软全球副总裁姜大昕于2023年4月创立,核心团队不乏清华系技术骨干 [5] - 零一万物凭借“大模型+AI Infra+应用”的三层布局迅速跻身独角兽,核心研发成员多来自清华、斯坦福等顶尖高校 [5] 大厂的人才争夺战略 - 字节跳动2023年组建Seed团队,专注AI前沿技术,开启“Top Seed人才计划”招募应届博士生,应届生入职职级能给到4,年薪千万 [10] - 腾讯针对AI顶级人才发起“青云计划”,有传言称其开出一亿年薪挖角OpenAI的姚顺雨 [10] - 阿里国际2026届校招中80%为AI岗位,同时启动了面向全球的头部AI科技人才培养计划——Bravo102 [10] - 京东于2025年成立京东探索研究院,刘强东担任院长,2025年以来从业内挖角了多位AI大佬 [10] - 大厂和“六小龙”之间的人才争夺使得AI人才薪水水涨船高,一位AI算法工程师跳槽大厂可以轻松拿到30%涨幅的薪资,更甚者翻倍 [11] 人才从六小龙回流大厂的趋势 - 智谱AI院AI Infra某负责人冯冠宇加入字节跳动 [11] - 阶跃星辰强化学习负责人邓诗弘回流字节 [11] - 月之暗面端到端语音模型负责人谭旭加入腾讯混元 [11] - 百川智能技术联合创始人谢剑回流百度 [11] 百模大战的兴起与演进 - 2022年底ChatGPT发布被视为AI届的“iPhone时刻”,在国内引发创业和投资地震 [12] - 2023年2月,美团前联合创始人王慧文创立光年之外,立志做“中国版OpenAI” [13] - 2023年,王小川和搜狗旧部创立百川智能,总计融资约50亿元 [13] - 曾在NeurIPS 2019发布XLNet的杨植麟与同学共同成立了月之暗面 [14] - 2023年3月,百度发布“文心一言大模型”,成为国内第一个跟进ChatGPT的大厂,随后360、智谱、商汤、阿里等企业跟进发布各自模型 [16] - 2023年6月后,企业进入模型迅速迭代阶段,各家平均2-3个月发布一次新模型 [16] - 据算法备案数据,2023年6月,10亿级参数规模以上大模型已发布79个 [16] - 至2023年底,智谱AI扩张至400余人规模,其中70%为研发人员 [20] 多模态模型与视频生成的竞争 - 2024年2月,OpenAI发布Sora,能直接生成60秒视频,远超当时行业内平均4秒的水平 [18] - Sora发布后仅一个月,快手迅速重启“噗叽”项目,由万鹏飞带领20人团队自研DiT架构快速研发可灵模型 [18] - 2024年8月,MiniMax CEO闫俊杰主导团队将视频生成模型abab-video-1集成至海螺AI,支持6秒768P视频生成 [19] 字节跳动的AI战略跟进与影响 - 字节跳动的AI战略跟进和模型产品化,被视为“AI六小龙”发展的另一个划时代节点 [21] - 2023年8月,字节旗下AI应用豆包(国内)和Cici(海外)同步开启测试 [21] - 2023年底,字节迅速成立全新独立部门Flow,由技术副总裁洪定坤和原大模型团队负责人朱文佳领导,张一鸣开始频繁约见AI研究者,亲自下场招揽人才 [22] - 豆包大模型面世后,字节推动其在头条、抖音等50+内部业务落地 [24] - 2024年5月,字节跳动宣布豆包APP总下载量达1亿次,豆包大模型将开启商业化模式 [24] - 2024年,“六小龙”们身陷跟进多模态模型、寻找商业化落地场景、争夺C端流量入口等行业焦虑中 [24]
国产AI大模型企业密集上市:资本狂欢下的技术博弈与产业未来
搜狐财经· 2026-01-22 17:54
文章核心观点 - 2025年见证了国产AI大模型企业的密集上市潮,标志着中国在全球人工智能竞赛中进入了全新的资本化阶段[2] - 国产AI大模型企业在技术突破、政策支持、市场需求及国际竞争等多重因素驱动下快速发展,但同时也面临严峻的商业化盈利挑战和成本压力[6][7][8][14][16] - 资本市场对AI企业的估值逻辑正在发生变化,更看重技术壁垒、生态价值和长期潜力,而非短期财务表现[18] - 未来几年,AI大模型行业将经历商业化验证、产业成熟到生态繁荣的演进,技术将持续向多模态融合、边缘计算和具身智能等方向突破,并深刻重塑产业生态与社会结构[22][23][24][26][28][29] 上市潮全景:哪些AI大模型企业正在登陆资本市场? - **头部企业资本化**:2025年第一季度以来,超过十家中国大型语言模型研发企业提交招股书,上半年IPO募集资金总额超过300亿元人民币[2] - **深度求索**:2025年3月向港交所提交上市申请,估值突破120亿美元,2024年研发投入42亿元人民币,占总收入的85%,其下一代模型DeepSeek-V3参数规模达3.2万亿[3] - **智谱AI**:选择科创板上市,其GLM-4 Turbo模型在中文任务上表现超越国际同类产品,采用“B2B2C”轻资产商业模式[3] - **月之暗面**:以支持128K tokens的“长上下文窗口”技术建立壁垒,最新一轮融资获8亿美元,投后估值达65亿美元[4] - **垂直领域先锋**:医疗AI领域的推想科技和科亚医疗、金融AI领域的蚂蚁智科、教育AI领域的作业帮“银河大模型”和好未来“MathGPT”等均寻求上市或独立融资[13] - **地域与政策**:企业上市聚集于北京、上海、深圳,三地政府分别推出“AI大模型创新示范区”、“大模型算力补贴”、“AI芯片与大模型协同发展基金”等扶持政策[5] 资本热度攀升:数据背后的驱动逻辑 - **投资数据**:2024年中国AI领域投资总额达2150亿元人民币,其中大模型及相关应用占比超60%,投资规模较2023年增长75%[6] - **投资结构变化**:Pre-IPO轮平均融资额从2023年的5.2亿元增至2024年的8.7亿元,增幅67% 早期投资占比从2022年的35%降至2024年的18%,而成长期和Pre-IPO投资占比从45%升至62%[6] - **技术突破驱动**:国产大模型在中文理解评估基准CLUE榜单前十中占据八席,部分模型代码生成任务HumanEval通过率超85%,接近GPT-4水平[7] - **政策红利释放**:2024年7月国家发改委等五部门发文支持AI企业上市融资,10月证监会优化了科技企业上市标准[7] - **市场需求增长**:预计2025年中国AI大模型市场规模达147亿美元,2023-2027年复合增长率38.5% 企业端AI技术采纳率从2022年的22%快速提升至2024年的47%[7] - **地缘政治因素**:美国对高端GPU出口限制升级,加速了资本向国产大模型及AI芯片的倾斜,创造了国产替代的战略窗口期[8] 技术博弈:国产大模型的核心竞争力分析 - **架构与算法创新**:百度ERNIE架构将知识图谱与预训练结合 阿里Qwen系列引入“稀疏注意力”机制,将长文本处理效率提高3倍[9] - **训练方法创新**:智源研究院“FlagAttention”技术将万亿参数模型训练成本降低40% 商汤科技“SenseNova”框架支持混合精度与动态弹性计算[9] - **多模态能力融合**:腾讯“混元大模型”在视觉-语言多模态任务突出 字节跳动“云雀大模型”支持长达1小时视频的语义分析[10] - **AI芯片突破**:华为昇腾910B芯片性能达英伟达A100的80% 寒武纪“思元590”芯片针对大模型训练优化[11] - **算力集群建设**:国家超算中心联合企业建立的国产算力训练集群总算力规模达10EFLOPS 上海人工智能实验室“OpenXLab”平台降低中小企业算力门槛[11] - **软件栈生态**:华为MindSpore、百度飞桨、阿里巴巴灵积等框架初步形成全栈国产AI生态[11] - **中文数据与场景优势**:国产模型通过大规模高质量中文语料预训练和文化常识注入,在中文处理上建立优势 普遍采用“通用底座+行业精调”策略深耕金融、法律等垂直领域[12] - **隐私与安全合规**:国产大模型设计符合《网络安全法》、《数据安全法》等中国法规,在政企市场形成重要竞争优势[12] 商业化挑战:盈利之路与可持续发展 - **主流盈利模式**:API服务收费(如智谱AI的GLM-4 Turbo API价格约为GPT-4 Turbo的60%) 企业级定制化解决方案(客单价数百万元至数千万元) 开源基础模型+商业版授权模式[14] - **硬件一体化方案**:将大模型与AI服务器、边缘计算设备结合,在智能制造、智慧医疗等场景具有优势[15] - **高昂的训练成本**:训练一个万亿参数大模型需约5000-8000张高端GPU运行2-3个月,仅电力成本超2000万元人民币,采用英伟达H100集群单次训练成本可能高达1.2亿元[16] - **持续的推理成本**:以月活1亿的对话应用为例,若用户日均交互10次,每次消耗500 tokens,每日推理成本可能超300万元[16] - **攀升的人才成本**:大模型算法工程师平均年薪80-150万元,首席科学家薪酬包普遍在500万元以上[16] - **商业化进度差异**:已提交上市申请的AI大模型企业中,仅15%在最近财年实现盈利,亏损企业平均亏损额达收入的1.8倍[17] 资本市场反应:估值逻辑与投资风险 - **新兴估值框架**:技术壁垒评分法(技术得分权重超40%) 生态价值评估(如GitHub star数) 算力资产重估 商业化潜力折现(通常采用30-50%高折现率)[18] - **二级市场表现**:百度、阿里股价在AI概念推动下,2024年以来分别上涨42%和38% AI芯片企业寒武纪上市首日涨156%,随后三个月回调65% AI算力指数在2024年累计上涨72%[19] - **企业梯队划分**:领先梯队(百度、阿里、腾讯等巨头,年收入10-50亿元,多处于亏损或微利) 成长梯队(智谱AI、深度求索等初创企业,年收入1-10亿元,亏损率30-50%) 早期梯队(垂直领域初创企业,年收入不足1亿元,依赖融资)[20] 未来趋势:技术演进与产业重塑 - **技术发展方向**:模型架构可能向“神经符号AI”和“世界模型”变革 多模态融合向“全感知AI”发展 边缘计算与轻量级大模型结合,“端云协同推理”成主流 “具身智能”将大语言模型与机器人技术结合[22] - **产业生态重构**:算力民主化进程加速,分布式算力网络出现 高质量数据要素市场形成 基于大模型的“AI原生应用”大量涌现 “自然语言编程”降低开发门槛,推动全民开发者时代[23] - **社会影响与挑战**:大模型将替代部分脑力劳动,同时创造提示工程师、AI训练师等新职业 可能扩大数字鸿沟,需确保技术普惠性 AI伦理与治理需求凸显,可解释AI、AI对齐等技术将更重要[24] - **行业阶段展望**:2025-2026年为商业化验证期,行业整合加速 2027-2028年为产业成熟期,AI成为企业基础设施,可能出现千亿美元市值平台企业 2029年及以后为生态繁荣期,AI深度融入经济社会,通用人工智能愿景初步显现[26][28][29]
字节跳动否认与芯原股份联手设计AI芯片,后者股价一度触及涨停
新浪财经· 2025-08-20 18:05
公司股价表现 - 芯原股份8月20日盘中触及涨停 收盘报147.04元 单日涨幅达15.52% 总市值升至773亿元[1] 市场传闻与澄清 - 传闻称字节跳动与芯原股份合作设计先进AI算力芯片 但字节跳动明确否认存在AI芯片相关合作[1] - 此前字节跳动多次被传与芯片厂商合作 包括去年与博通合作开发AI处理器(由台积电制造)以及自研两款AI芯片(计划2026年前量产) 但均被公司否认[3] - 字节跳动表示芯片领域探索处于初期阶段 主要围绕推荐和广告业务成本优化 且符合贸易管制规定[3] 公司业务与技术 - 芯原股份成立于2001年 提供基于自主半导体IP的平台化芯片定制服务和半导体IP授权服务[1] - 公司拥有六类处理器IP 包括图形处理器IP和神经网络处理器IP 提供涵盖端侧到云侧的AI应用芯片定制解决方案[1] 融资历史 - 公司2020年科创板上市 2003-2010年完成A至D轮及战略融资 累计融资5780万美元[2] - 2018年通过股权融资引入英特尔资本和IDG等24名投资人 2019年获小米长江产业基金3.5亿元增资[2] 行业需求与趋势 - AI算力芯片需求呈指数级增长 因需处理海量数据并运行复杂算法 性能直接决定AI系统运算效率[2] - AI应用爆发式增长 涵盖智能语音助手、图像识别和自然语言处理等多领域[2] 相关方技术进展 - 字节跳动基于自研云雀大模型开发豆包平台 为综合性AI助手 涵盖多模型版本满足不同场景需求[2] - 豆包1.6系列模型支持多模态理解与图形界面操作 在复杂推理测试中表现突出[2] 投资计划传闻 - 传闻称字节跳动2025年AI基础设施投入超120亿美元 其中AI芯片采购预算达400亿元(为2024年两倍) 海外投资约68亿美元[3] - 字节跳动否认该预算规划 但强调高度重视人工智能领域投入[3]