Workflow
ChatGLM2
icon
搜索文档
Mapping|“AI六小龙”高端人才流动史(试读)
36氪· 2026-02-03 11:25
文章核心观点 - 在AI领域,人才密度是资本定价的核心依据之一,市场给予公司数十亿甚至上百亿美元的高估值,本质上是对其未来人才所能创造价值的体现 [2] - 顶尖研究员、核心架构工程师以及商业化负责人的流向,反映了各家模型公司的技术实力、研发效率和未来潜力,人才加速向头部公司聚集预示着市场变化 [2] - 2022年底ChatGPT发布引发了“第二次AI人才大流动”,行业经历“百模大战”,但随着字节跳动等互联网巨头携流量与算力全面压境,以及DeepSeek等开源模型的搅局,市场格局被重画,“AI六小龙”面临高端人才流失和融资不顺的挑战 [3][4][5] 第二次AI人才大流动 - 上一次较大的AI人才流动潮在2016年前后,由AlphaGo事件驱动,2022年ChatGPT重新激活萎靡的AI行业,引发了第二次AI人才大流动 [3][4] - “AI六小龙”(智谱AI、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)在2023至2024年间吸引了超过百亿级资本押注,其中智谱、MiniMax估值率先突破200亿元 [5] - 2025年,随着DeepSeek以开源、低成本、高性能模型强势搅局,以及字节跳动、阿里、腾讯等互联网巨头全面压境,“AI六小龙”的叙事图谱被彻底重画,从2024年上半年开始频传高端人才流失、融资不顺的信号 [5] - 从“AI六小龙”出来的高端人才,做技术的更倾向于回流大厂,做产品、商务的则创业居多 [6] AI六小龙的成立与人才背景 - 智谱AI孵化于清华大学计算机系KEG实验室 [5] - 月之暗面创始人及4位联创曾为清华大学实验室成员 [5] - 百川智能6位联创团队中有4位毕业于清华大学 [5] - MiniMax创始人也毕业于清华大学,核心成员均来自高校 [5] - 阶跃星辰由前微软全球副总裁姜大昕于2023年4月创立,核心团队不乏清华系技术骨干 [5] - 零一万物凭借“大模型+AI Infra+应用”的三层布局迅速跻身独角兽,核心研发成员多来自清华、斯坦福等顶尖高校 [5] 大厂的人才争夺战略 - 字节跳动2023年组建Seed团队,专注AI前沿技术,开启“Top Seed人才计划”招募应届博士生,应届生入职职级能给到4,年薪千万 [10] - 腾讯针对AI顶级人才发起“青云计划”,有传言称其开出一亿年薪挖角OpenAI的姚顺雨 [10] - 阿里国际2026届校招中80%为AI岗位,同时启动了面向全球的头部AI科技人才培养计划——Bravo102 [10] - 京东于2025年成立京东探索研究院,刘强东担任院长,2025年以来从业内挖角了多位AI大佬 [10] - 大厂和“六小龙”之间的人才争夺使得AI人才薪水水涨船高,一位AI算法工程师跳槽大厂可以轻松拿到30%涨幅的薪资,更甚者翻倍 [11] 人才从六小龙回流大厂的趋势 - 智谱AI院AI Infra某负责人冯冠宇加入字节跳动 [11] - 阶跃星辰强化学习负责人邓诗弘回流字节 [11] - 月之暗面端到端语音模型负责人谭旭加入腾讯混元 [11] - 百川智能技术联合创始人谢剑回流百度 [11] 百模大战的兴起与演进 - 2022年底ChatGPT发布被视为AI届的“iPhone时刻”,在国内引发创业和投资地震 [12] - 2023年2月,美团前联合创始人王慧文创立光年之外,立志做“中国版OpenAI” [13] - 2023年,王小川和搜狗旧部创立百川智能,总计融资约50亿元 [13] - 曾在NeurIPS 2019发布XLNet的杨植麟与同学共同成立了月之暗面 [14] - 2023年3月,百度发布“文心一言大模型”,成为国内第一个跟进ChatGPT的大厂,随后360、智谱、商汤、阿里等企业跟进发布各自模型 [16] - 2023年6月后,企业进入模型迅速迭代阶段,各家平均2-3个月发布一次新模型 [16] - 据算法备案数据,2023年6月,10亿级参数规模以上大模型已发布79个 [16] - 至2023年底,智谱AI扩张至400余人规模,其中70%为研发人员 [20] 多模态模型与视频生成的竞争 - 2024年2月,OpenAI发布Sora,能直接生成60秒视频,远超当时行业内平均4秒的水平 [18] - Sora发布后仅一个月,快手迅速重启“噗叽”项目,由万鹏飞带领20人团队自研DiT架构快速研发可灵模型 [18] - 2024年8月,MiniMax CEO闫俊杰主导团队将视频生成模型abab-video-1集成至海螺AI,支持6秒768P视频生成 [19] 字节跳动的AI战略跟进与影响 - 字节跳动的AI战略跟进和模型产品化,被视为“AI六小龙”发展的另一个划时代节点 [21] - 2023年8月,字节旗下AI应用豆包(国内)和Cici(海外)同步开启测试 [21] - 2023年底,字节迅速成立全新独立部门Flow,由技术副总裁洪定坤和原大模型团队负责人朱文佳领导,张一鸣开始频繁约见AI研究者,亲自下场招揽人才 [22] - 豆包大模型面世后,字节推动其在头条、抖音等50+内部业务落地 [24] - 2024年5月,字节跳动宣布豆包APP总下载量达1亿次,豆包大模型将开启商业化模式 [24] - 2024年,“六小龙”们身陷跟进多模态模型、寻找商业化落地场景、争夺C端流量入口等行业焦虑中 [24]
证券公司利用大模型技术构建财富业务创新应用体系研究
中国证券报· 2025-11-03 20:12
文章核心观点 - 大模型技术正驱动证券行业财富管理业务进入数智化转型的深水区,通过构建创新应用体系可提升服务效率、优化用户体验并强化风控合规 [1] - 大模型在证券行业的应用已从实验阶段进入商业化落地阶段,行业首个股权激励大模型、债券类应用Bond Copilot及财富助手Wealth Copilot等产品相继推出 [2] - 券商通过分阶段实施路径构建涵盖基础设施、模型、应用技术、能力及应用的创新体系,以应对行业变革并实现降本增效和盈利增长 [3][8][14] 大模型技术应用背景与驱动力 - 居民财富稳步累积推动财富管理需求显著增长,为证券行业提供新利润增长点,同时行业面临国际竞争加剧、客户需求升级及业务效率瓶颈等多重转型压力 [2] - 财富管理业务呈现定制化、全链化、智能化、精准化及结构化五大趋势,从“无差别金融销售”转向围绕客户需求的差异化营销 [4] - 行业面临获客成本高企(线上单个有效户成本增至300元–400元,部分优质渠道超1000元)、数据治理薄弱(数据治理投入仅占IT总投入1%–2%)、投顾能力不足及服务成本高(投顾人均需服务近3000名客户)等挑战 [5] 大模型的应用价值与场景 - 大模型通过智能研报降维、智能内容理解及智能客服问答提升投顾服务专业性和客户服务效率,并通过自动化处理、智能推荐及精准营销优化成本 [6] - 具体应用场景包括智能投顾(客户画像、风险偏好分析、资产配置)、智能客服(7×24小时服务)、智能研报(非结构化数据处理)、智能风控(实时风险识别)及智能工作助手(文档自动化处理) [6][7] - 能力赋能方面,通过知识库增强生成及思维链推理弥补投顾团队专业能力不足,助力券商实现差异化竞争 [3][6] 创新应用体系架构 - 基础设施层依赖算力资源(头部券商采用万卡级GPU集群)及存储资源(高安全、高可靠数据存储系统),中小券商通过共享算力中心或云服务分摊成本 [8] - 模型层采用混合架构,结合通用大模型(如DeepSeek、阿里QWen)与金融垂类模型(如国泰海通证券“灵犀大模型”),并通过开源模型微调(如国金证券ChatGLM2)及轻量化端侧模型(如银河证券Gemma)控制算力成本 [9] - 应用技术层通过RAG技术(结合向量数据库)、Prompt工程及智能体技术实现低代码开发,例如中信证券“超级研究员”可自动生成数万字深度研报 [10] 体系能力与业务实现 - 能力层提供自然语言处理、多模态理解及业务逻辑推理三大能力,通过API接口支持上层应用,例如长城证券智源AI中心纳管AI原子能力与智能体开发能力 [11] - 应用层覆盖智能投顾(如申万宏源证券生成38个客户投资风格标签,覆盖数百万客户)、智能客服及智能办公等场景,每日为3000余名一线客户经理提供服务抓手 [12] - 实施路径分三阶段:基础设施建设(1–2年完成GPU集群、AI中台等)、核心能力开发(2–3年聚焦NLP、视频等)及业务场景渗透(3–5年渗透至投研、投顾等核心场景) [14] 头部与中小券商差异化策略 - 头部券商(如中信证券、华泰证券、招商证券)采用“自研为主、合作为辅”策略,投入大量资金建设自主大模型能力,招商证券月均AI服务量达19亿次 [14][15] - 中小券商主要采用“应用优先”策略,快速接入通用大模型API(如文心一言),结合本地小模型处理敏感数据,并通过行业共享平台获取技术能力,例如广发证券上线DeepSeek客户服务模块 [15] - 技术资源差异导致应用效果不均衡,头部券商与中小券商在技术投入、人才储备等方面存在显著差距 [16]