DeepSeek

搜索文档
全网都在等梁文锋
投中网· 2025-04-29 14:21
中美科技巨头AI模型竞争 - 5月将迎来中美科技巨头AI模型发布高峰,OpenAI发布GPT-4.1 o3、o4 mini系列模型,谷歌推出Gemini 2.5 Flash Preview混合推理模型,豆包发布1.5·深度思考模型[6] - 阿里下一代大模型Qwen3预计本月发布[6] - DeepSeek R2模型发布进入倒计时,Hugging Face首席执行官发布暗示性动态引发行业猜测[7][10] DeepSeek R2模型技术参数传闻 - 传闻DeepSeek-R2拥有1.2万亿参数,活跃参数780亿,采用混合MoE架构[12] - 成本比GPT-4o便宜97.3%(输入每百万次0.07美元,输出每百万次0.27美元)[12] - 使用5.2PB训练数据,在C-Eval2.0测试中取得89.7%得分,COCO测试集视觉能力达92.4%[12] - 公司对传闻不予回应,知情人士称网上消息真实性含量非常低[16] DeepSeek产品迭代与研发策略 - 公司保持每季度重大更新的开发范式,2024年9月推出V2.5,12月发布V3,次年3月升级至V3-0324版本[17] - 路透社披露公司正加快R2研发进程,原计划5月初发布,现希望尽早推出[17] - V3-0324版本在基准测试中力压Google Gemini 2.0 Pro、Anthropic Claude 3.7Sonnet等顶尖模型[17] 创始人梁文锋的战略布局 - 创始人梁文锋志向直指终极AGI,早期优先排除有退出顾虑的机构,主要依托自有资金[20] - 认为Chatbot产品可替代性强,技术优势是关键,DeepSeek R1发布证实这一观点[20] - 表示公司真正挑战是高端芯片出口禁令,而非资金问题[22] - 强调追赶下一代技术是真正的护城河,需要重建团队、付出时间和成本[22] 国产芯片与大模型适配 - 美国对英伟达H20芯片出口禁令倒逼华为昇腾910C、寒武纪MLUarch04等国产芯片加速发展[21] - 公司已推出针对英伟达H卡的算力优化方案[21] - 行业人士透露公司正与国产芯片头部企业合作,但合作进展和R2适配情况尚不明确[25][26] - 行业存在对稳定、便宜的大模型部署需求,公司需要解决这一问题[24]
聚焦科技金融 打造第四张“名片”
每日商报· 2025-04-29 11:05
4月24日,大会创业创新年度颁奖盛典上,兴业银行杭州管理部再次获得"创业服务机构"的称号。数据 显示,截至2025年3月末,杭州管理部辖内科技金融贷款余额达到222亿元,近三年年均复合增长率 20%,是贷款增速的一倍。 4月25日,中国未来独角兽大会上,兴业银行杭州分行副行长赵颎和杭州八大城区母基金共同发布《杭 州AI卧龙图》;当日晚2025中国独角兽之夜上,赵颎上台致辞,并共同启动了"寻龙记"种子独角兽寻访 计划,正式成立"扶摇·独角兽智库"。 商报讯 (记者 苗露 通讯员 许诺) 4月23—25日,由民建浙江省委会、浙江省工商联、中国投资发展促 进会主办的第九届万物生长大会在杭州国际博览中心举行。会上首次推出了《2025浙江独角兽企业榜 单》《浙江未来独角兽企业TOP100榜单》《浙江种子独角兽企业TOP100榜单》三份省级榜单,覆盖了 全省范围内的众多创新型企业。《2025杭州独角兽(准独角兽)企业榜单》也如约而至,其中新晋独角 兽5家,杭州"六小龙"里的DeepSeek、宇树科技和游戏科学赫然在列。 本次大会还首次发布了《2025中国未来独角兽榜单》和《杭州AI卧龙图》。前者聚焦人工智能、具身 智能、 ...
AI浪潮录丨对话刘知远:通往AGI不易,长跑要顶住资本寒冬
贝壳财经· 2025-04-29 09:18
北京AI产业发展现状 - 北京已成为AI大模型领域的战略高地,汇聚了智源研究院、月之暗面、DeepSeek、智谱等人工智能独角兽 [1] - 北京正积极打造"全球开源之都",开源生态已深入汽车、机器人等行业 [1] - 智源研究院发布的"悟道2.0"成为中国第一个万亿大模型 [4] 中国AI技术发展历程 - 2011-2012年科技部973计划项目投入数千万元支持自然语言处理研究,是国内最早的大规模专项支持 [6] - 2013年word2vec方法发布,国内团队立即跟进,与国外领先水平差距约3-4年 [6] - 2018年BERT模型发布,国内团队转向预训练模型研究,同年推出首个知识增强预训练模型ERNIE [7][8] - 2020年GPT-3发布,国内团队训练了CPM(中文预训练模型)第一个版本 [10] - 2024年DeepSeek成功复现OpenAI的o1模型,中美技术差距缩小至半年 [9] 智源研究院的作用 - 采用"投资就是投人"理念,成为顶尖学者的"天使投资人",支持面向未来的科研探索 [11] - 支持机制灵活,2020年拨款数百万元购置10台A100 GPU机器用于大模型训练 [10] - 通过"小同行评议"选拔优秀学者,支持青年科学家3年,理念先进 [11] 企业发展战略 - 面壁智能采取"小而美"的端侧模型战略,避开大厂竞争,从局部优势领域出发 [17][19] - DeepSeek通过算法创新与高效训练克服算力限制,2024年DeepSeek-R1火爆市场 [20] - AI创业者终极目标是奔向AGI,但需要分阶段实现,是一场"持久战" [17][18] 行业竞争格局 - 2023年后国内AI领域明显加速,多个AI"小龙""小虎"涌现,大模型百花齐放 [5][15] - DeepSeek的成功证明中国AI技术已具备国际竞争力,中美差距正在缩小 [5][20] - 行业需要更多耐心,中国可能涌现10个以上类似DeepSeek的企业 [21][22] 技术发展趋势 - AI发展两大主旋律:能效更高(Densing)和能力更强 [20] - 端侧大模型在数据保护、隐私安全方面具有优势,适合汽车座舱等场景 [19] - 未来将通过提高模型能力密度来获得市场竞争力 [20]
4月29日早餐 | 阿里推出Qwen3;欧洲大停电
选股宝· 2025-04-29 08:21
海外市场表现 - 美股涨势消减,科技股打压大盘,标普惊险五连涨,纳指回落,收盘道指涨0.28%,标普500指数涨0.06%,纳斯达克跌0.1% [1] - 英伟达跌超2%止步四连涨,特斯拉盘中跌超4%后转涨,和苹果五连阳;恩智浦公布财报警告关税影响后,盘后一度跌超8% [2] - 中概股总体表现亮眼,中概指数反弹至三周高位,蔚来汽车大涨超7%,理想汽车涨超3%,阿里跌超1% [2] - 美国财政部本季度借款实际预估规模不增反降,美债收益率创近两周新低 [2] - 美元指数回落,离岸人民币一度涨近200点、涨破7.29 [3] - 黄金反弹,期金一度涨近2%;原油回落,盘中转跌超2%,美油收创近两周新低 [3] 国内重大事件 - 外交部重申中美未就关税问题磋商或谈判 [4] - 网传大厂“抢购”算力资源,腾讯今年Q1从字节购入约20亿元GPU、阿里一季度向字节跳动下GPU订单为不实信息 [5] - 工信部发布2025年汽车标准化工作要点,推动制定及发布车用人工智能、固态电池、电动汽车换电等标准子体系 [10] - 国家数据局召开数据资源开发利用和数据产业发展工作座谈会 [10] - 阿里推出Qwen3,与顶级模型相比表现出极具竞争力的结果 [10] - 国内首个利用电厂温排水进行海水淡化的项目投产 [10] - 4月28日全国农产品批发市场猪肉平均价格为20.87元/公斤,比昨天上升1.3% [10] 券商策略前瞻 - 民生证券指出,4月重要会议强调底线思维,短期市场仍将反复,随着定期报告披露临近尾声进入业绩真空期,在经济整体稳定、流动性充裕背景预期下,市场风险偏好有望持续提升,建议从基本面、政策预期差入手,关注扩大工业软件、充电设置等基础领域投资,以及科技自主可控及国产替代和内需方向 [5] 今日题材动态 数据要素 - 4月28日国家数据局在福建福州召开会议,要求围绕构建全国一体化数据资源开发利用体系,推动公共数据开发利用政策加快落地,释放公共数据价值,强化设施互通、价值共创、场景应用,加快可信数据空间创新试点,打造数据规模化流通利用新模式 [6] - 中信建投指出,公共数据是数据要素市场最重要的数据基础资源和关键要素之一,我国公共数据开放潜在价值高达10万亿至15万亿元,随着国家顶层专项政策落地实施,相关环节市场空间有望进一步释放;银河证券测算全国数据市场交易规模超1600亿元,同比增长30% [6] 机器人触觉 - 近日触觉感知与人形机器人公司帕西尼感知科技获比亚迪超亿元战略投资,这是比亚迪本年度首笔重磅股权投资,也是截至目前其在具身智能领域最大单笔投资 [6] - 华西证券认为,人形机器人即将迎来量产加速阶段,核心零部件国产化需求强烈,市场空间广阔,率先突破的国内企业有望深度受益;国泰海通表示,触觉是当前人形机器人落地商用瓶颈,触觉传感技术方案多样,当前优选电容与霍尔效应两类技术,未来触觉传感应用有望从手向其他部位渗透,行业空间持续打开 [7] 人工智能 - 消息人士透露,DeepSeek公司新一代大模型DeepSeek R2预计5月初发布,预计比GPT - 4成本下降97%,在昇腾卡上训练,主打全方位全产业链自主可控,将采用更先进混合专家模型(MoE),总参数量预计达1.2万亿,较DeepSeek - R1提升约1倍 [7] - 中证报指出,DeepSeek - R2将在多个关键领域实现突破,专业人士表示其核心编程能力将推动低代码开发快速发展,权威预测未来五年内全球70%的企业应用将基于低代码开发,人工智能和机器学习将深度融入低代码开发平台,加速亿级新应用生态构建 [8] 卫星互联网 - 近期神舟二十号载人飞船成功对接空间站天和核心舱,4月23 - 26日2025年中国航天大会在上海举行,多家航天领域企业携核心产品亮相,商业航天企业展示等比例火箭模型、火箭发动机真机及1:1无人商业空间站模型 [8] - 银河证券表示,卫星互联网及低空经济领域2024年基本实现从0到1转变,商业模式探索愈发成熟,2025年有望实现规模化发展和高质量商业模式铺开,有望成为新兴支柱产业,促进市场快速健康发展 [9] 上市公司公告 - 威孚高科与博世中国签署战略合作协议,围绕人工智能和具身机器人技术工业应用等领域推进合作 [11] - 南网储能拟80.35亿元投资建设云南西畴抽水蓄能电站 [11] - 新坐标拟7700万元设立控股子公司,研发、生产和销售滚柱丝杠等 [12] - 生益电子一季度净利润2.00亿元,同比增长656.87%,因市场对多层印制电路板需求增长,营业收入实现较大增长 [12] - 中金公司一季度净利润20.42亿元,同比增长64.85%,营业收入增长系金融工具投资收益净额及手续费及佣金净收入增加 [13] - 长电科技一季度净利润2.03亿元,同比增长50.39%,因国内外先进封装市场订单增长及晟碟半导体(上海)有限公司财务并表,带动营收同比增长 [13] - 药明康德一季度净利润36.72亿元,同比增长89.06%,原因包括保持营业收入增长、优化生产工艺和经营效率以及临床后期和商业化项目增长带来产能效率提升 [13] - 泓博医药一季度净利润1197.39万元,同比增长226.47%,因报告期业务收入增加 [14] - 宏景科技一季度净利润2165.12万元,同比扭亏,因算力验收业务增加导致收入增加 [15] - 华安证券一季度净利润5.25亿元,同比增长87.79%,因证券投资、经纪业务、投资银行业务等业务收入同比增幅较大 [16] - 春秋电子一季度净利润4029.73万元,同比增长178.70%,因本报告期公司业务盈利能力增加 [17] - 移远通信一季度净利润同比增长287%,超出业绩预告同比增幅,在LTE模组、5G模组等业务均实现良好增长 [17] - 顺丰控股一季度净利润22.3亿元,同比增长16.9%,拟5亿元 - 10亿元回购股份 [17] - 海天味业一季度净利润22.02亿元,同比增长14.77% [18] - 上海机场一季度净利润5.19亿元,同比增长34.53%,因本期上海两场航空业务量同比增加,经营效益增长及股权投资收益增长 [18] - 太辰光一季度净利润7936.96万元,同比增长149.99%,因AI发展带动市场对公司产品需求增长,部分关键器件自主研发生产替代外购以及销售结构变化带来毛利率提高 [18] - 炬芯科技一季度净利润4144.97万元,同比增长385.67%,因公司产品表现卓越,营业收入大幅增长,产品结构和客户结构持续优化,毛利润和净利润快速增长 [18] - 汇川技术一季度净利润13.23亿元,同比增长63.08%,2025年1 - 3月通用自动化(含工业机器人)业务销售收入约41亿元,同比增长约29% [18] - 锦浪科技一季度净利润1.95亿元,同比增长859.78%,因营业收入增加且毛利率上升 [18] - 兴齐眼药一季度净利润1.46亿元,同比增长319.86%,因报告期内滴眼剂产品销售收入增长 [18] - 君正集团一季度净利润10.07亿元,同比增长41.40%,因产品品类及产量增加,部分主要原材料进价同比下降 [19] - 亚香股份一季度净利润8216.81万元,同比增长361.70%,因本期收入增加及处置子公司股权的投资收益增加 [20] - 北汽蓝谷一季度净亏损9.53亿元,拟定增募资不超60亿元 [21] - ST新潮预计无法按期披露2024年年度报告及2025年第一季度报告 [22] - 福田汽车拟认购北汽蓝谷不超过25亿元股票 [23] - 徐工机械拟3亿元 - 6亿元回购公司股份用于减少注册资本 [23] - 中国核电拟3亿元 - 5亿元回购股份 [23] 历史新高公司(2025.4.28) | 股票代码 | 公司名称 | 核心概念 | 涨幅% | | --- | --- | --- | --- | | 301209 | 联合化学 | 化工 | 20 | | 301225 | 恒勃股份 | 机器人 | 8.03 | | 300652 | 雷迪克 | 机器人 | 6.48 | | 600a19 | 江苏银行 | 银行 | 2.01 | | eola3a | 建设银行 | 银行 | 1.95 | | 201398 | 工商银行 | 银行 | 1.11 | | 600377 | 宁沪高速 | 高速公路 | 1.09 | | 300972 | 万辰集团 | 食品 | 0.62 | | 601838 | 成都银行 | 银行 | 0.28 | [24] 4月29、30日市值解禁 | 名称 | 解禁市值(亿元) | 解禁比例(%) | 解禁日期 | | --- | --- | --- | --- | | 深城交 | 41.66 | 30.00 | 4月29日 | | 景业智能 | 19.25 | 40.48 | 4月29日 | | 川能动力 | 16.33 | 8.27 | 4月29日 | | 拓尔思 | 14.18 | 8.97 | 4月29日 | | 永泰运 | 10.12 | 47.18 | 4月29日 | | 赛微微电 | 7.18 | 18.29 | 4月29日 | | 国能日新 | 5.55 | 8.84 | 4月29日 | | 德龙激光 | 4.93 | 22.97 | 4月29日 | | 京东方A | 3.44 | 0.24 | 4月29日 | | 健之佳 | 2.73 | 8.94 | 4月29日 | | 中微公司 | 1.42 | 0.12 | 4月29日 | | 科力股份 | 1.05 | 4.77 | 4月29日 | | 拉普拉斯 | 0.98 | 0.64 | 4月29日 | | 中科江南 | 0.64 | 0.75 | 4月29日 | | 聚灿光电 | 0.44 | 0.58 | 4月29日 | | 苏盐井神 | 0.35 | 0.41 | 4月29日 | | 索菱股份 | 0.18 | 0.38 | 4月29日 | | 莱绅通灵 | 0.06 | 0.30 | 4月29日 | | 皓元医药 | 1.69 | 2.13 | 4月30日 | | 宝丽迪 | 1.68 | 3.84 | 4月30日 | | 沃尔德 | 1.66 | 4.98 | 4月30日 | | 东方锂业 | 0.67 | 0.88 | 4月30日 | | 汇创达 | 0.64 | 1.53 | 4月30日 | | 德冠新材 | 0.60 | 2.13 | 4月30日 | | 森霸传感 | 0.40 | 1.50 | 4月30日 | | 天娱数枓 | 0.18 | 0.18 | 4月30日 | | 科拜尔 | 0.07 | 0.33 | 4月30日 | [25][26]
【发展之道】 积极看待国产替代
证券时报· 2025-04-29 06:05
国产替代的战略价值 - 国产替代并非"退而求其次"的权宜之选,而是中国制造业从"跟跑"转向"并跑"甚至"领跑"的缩影 [1] - 联影医疗CT设备进入全球高端市场,大疆无人机、宁德时代电池在全球竞争中占据领先地位 [1] - 国产替代是重构产业链、技术标准与市场规则的系统工程,如新能源汽车领域建立从锂矿到整车的完整生态 [2] 技术突破与全球竞争 - 中国新能源汽车通过电池、电机、电控三大核心技术自主突破,推动全球汽车产业向"中国标准"倾斜 [2] - 工业软件在航天、军工等关键领域实现自主可控,降低对外部供应链依赖 [2] - DeepSeek在AI领域与OpenAI对标,华为鸿蒙系统搭载设备超10亿台,外部压力成为技术创新的催化剂 [2] 研发投入与创新积累 - 2024年中国全社会研发经费达36130亿元,同比增长8.3%,总量居世界第二 [3] - 科创板公司平均研发强度保持在10%以上,570多家中国企业入围全球研发投入2500强,占比近四分之一 [3] - 产学研一体化模式加速技术转化,国产替代土壤日益肥沃 [3] 现实挑战与未来方向 - 部分领域基础研究薄弱、高端人才短缺仍需解决 [3] - 国产替代正从"性价比替代"向"技术超越"跃升,需积极看待这一变化 [3]
Alibaba unveils Qwen 3, a family of ‘hybrid' AI reasoning models
TechCrunch· 2025-04-29 05:37
Chinese tech company Alibaba on Monday released Qwen 3, a family of AI models the company claims matches and in some cases outperforms the best models available from Google and OpenAI. Most of the models are — or soon will be — available for download under an “open” license from AI dev platform Hugging Face and GitHub. They range in size from 0.6 billion parameters to 235 billion parameters. Parameters roughly correspond to a model’s problem-solving skills, and models with more parameters generally perform ...
DeepSeek新一代大模型即将发布,推动低代码开发成主流
选股宝· 2025-04-28 23:09
DeepSeek R2大模型技术突破 - DeepSeek公司新一代大模型DeepSeek R2预计5月初发布,采用昇腾卡训练,实现全产业链自主可控 [1] - DeepSeek R2成本比GPT-4下降97%,采用混合专家模型(MoE),总参数量达1.2万亿,较上一代DeepSeek-R1(6710亿参数)提升约1倍 [1] - 模型在编程能力、多语言推理能力和成本效益方面实现突破,将推动低代码开发快速发展 [1] 低代码开发行业前景 - 权威预测未来五年内全球70%企业应用将基于低代码开发,AI和机器学习将深度融入低代码平台,增强智能推荐、代码自动生成等功能 [1] - 技术融合或推动低代码平台成为主流开发模式,加速亿级新应用生态构建 [1] 相关公司布局 - 金现代积极拓展AI低代码开发平台业务,已开发轻骑兵低代码开发平台、知识图谱可视化开发平台等标准化产品 [2] - 浩云科技持续投入低代码技术研发,其"浩易搭"平台与AI、物联网深度融合,可为企业定制AI智能体 [2]
全网都在等梁文锋
虎嗅APP· 2025-04-28 21:35
中美科技巨头AI模型竞争 - 4月中旬OpenAI发布GPT-4.1 o3/o4 mini系列模型 谷歌推出Gemini 2.5 Flash Preview混合推理模型 同日豆包发布1.5·深度思考多模态模型 阿里Qwen3大模型预计本月发布 [5] - Hugging Face CEO发布神秘动态 附DeepSeek官方资源库入口 引发科技圈对DeepSeek R2模型发布倒计时猜测 [6][8] DeepSeek R2模型技术参数与市场预期 - 传闻技术参数:1.2万亿总参数/780亿活跃参数 混合MoE架构 成本比GPT-4o低97.3%(输入0.07美元/百万次 输出0.27美元/百万次) 使用5.2PB训练数据 C-Eval2.0测试得分89.7% COCO视觉测试达92.4% [10] - 公司保持季度迭代节奏:2024年9月V2.5→12月V3→2025年3月V3-0324 路透社披露R2原计划5月初发布 可能提前推出 [10] - V3-0324版本已超越Google Gemini 2.0 Pro/Anthropic Claude 3.7Sonnet/Meta Llama 3.3 70B 业界预期R2将强化代码生成与多语种推理能力 [11] 创始人梁文锋的战略布局 - 创始人梁文锋聚焦AGI本质探索 早期拒绝有退出顾虑的资方 主要依托自有资金 认为Chatbot产品可替代性强 技术实力是用户争夺关键 [13] - 提出"中国需成为创新贡献者" 芯片禁令是核心挑战 但强调"重建团队追赶下一代技术才是护城河" 公司已与国产头部芯片厂商展开合作 [15][18] 国产算力生态与行业需求 - 英伟达H20芯片禁令促使华为昇腾910C/寒武纪MLUarch04等国产芯片加速替代 DeepSeek曾推出针对英伟达H卡的算力优化方案 [14][16] - 行业存在旺盛的大模型部署需求 但当前面临稳定性与成本挑战 公司可能在新模型中深度适配国产算力 [17][18]
混沌李善友:每一个创业者,都是普罗米修斯
36氪· 2025-04-28 19:34
行业趋势与AI发展 - AI技术革命已成为全球商业竞争的核心战场,创业者需从"技术跟随者"升级为"使命驱动者" [4][12] - OpenAI从开源先锋转向商业封闭化,2024年融资额达600亿美元但删除"Open"标识,反映技术垄断与初心背离的行业矛盾 [7][8] - DeepSeek以1/10成本实现技术突破,V3模型训练成本仅557万美元,R1推理模型通过MLA和MoE架构激活37亿参数完成6700亿参数任务 [10][11] - 中国AI企业打破"美国人做原创、中国人做应用"的行业潜规则,DeepSeek通过开源策略和极致务实证明技术原创可能性 [12][31] 企业创新与战略 - DeepSeek采用"涌现式组织"模式,150人无KPI团队通过开放协作实现突破,体现未来组织竞争力在于交互模式而非顶尖人才 [16][29] - 混沌AI创新院提出"机上人"理论,强调创业者应成为AI工具的使用者而非被替代者,通过"探索流2.0"实现AI辅助的社群共创 [22] - 实战方法论强调"10-3-1"原则:看十年趋势、谋三年路径、干一年落地,案例显示AI优化包装设计使电商复购率提升40% [18][20] - 企业需从"工具焦虑"转向"价值定义",如教育行业用AI放大教师个性化教学能力而非替代,锚定AI无法替代的差异化价值 [25] 技术突破与商业模式 - OpenAI技术演进呈现指数级加速,GPT-3的1750亿参数实现专业领域涌现,O1模型将数学题准确率从13%提升至83% [7] - DeepSeek的"有限游戏"策略通过MLA多头潜在注意力机制和MoE混合专家架构,在算力受限下实现高效能突破 [10] - AI产品设计需从"技术加法"转向"价值重构",如JobBright代求职工具通过分析隐性需求生成100份定制简历,让用户忘记技术存在 [20] - 混沌自研"Deep Innovation"智能助手可生成竞品分析报告,未来半年将为学员提供可落地的AI战略及2300人创业者网络 [22][24] 创业者生态与使命 - 混沌AI创新院构建"创业者共生生态",汇聚2300位学员和74位来自微软、字节等企业的实战教练,形成AI创新生态共建模式 [25] - 创业者需具备"定义趋势"能力,如马斯克通过"质疑行业惯例"颠覆航天领域,SpaceX可回收火箭实现商业与文明备份的双重价值 [14] - 人类"心流"状态成为对抗AI替代的核心优势,脑科学研究显示创造性体验如艺术创作是AI无法复制的智性跃迁 [15] - 中国创业者正消除"技术自卑",三天课程产生576个创新方案,体现从跟随者到定义者的角色转变 [31][33]
细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!
AI前线· 2025-04-28 19:10
字节跳动Top Seed招聘计划 - 公司启动2026届Top Seed大模型顶尖人才校招计划,覆盖大语言模型、机器学习算法、多模态生成/理解、语音等方向,计划招募约30位顶尖应届博士[2] - 招聘不限专业背景,注重研究潜力,要求候选人具备技术信仰、出色研究能力、好奇心与驱动力[5][6] - 提供一流科研环境、充分研究自由度,并依托公司丰富应用场景实现技术落地[7] - 该计划去年5月首次推出,同年7月增设研究实习生专项,为豆包大模型团队筛选人才[9] - 目标招聘人群为最顶尖的5%人才,要求其完成95%人群难以实现的技术突破[10] 已入职人才案例 - 昝道广(中科院博士)构建并开源首个多语言代码修复基准Multi-SWE-bench,覆盖7种编程语言1632个真实修复任务,提升大模型高阶编程能力[12][14][16] - 秦禹嘉(清华博士)主导开源多模态智能体项目UI-TARS-1.5,在7个GUI评测基准中取得SOTA表现,GitHub Star破万[22][24][26] - Zihao Huang(南开硕士)提出超稀疏模型架构UltraMem,推理速度较MoE提升2-6倍,成本降低83%[28][31][33] 人才待遇与资源 - 提供行业顶级薪资,实习生月薪可达4万元(按2000元/天×20天计算)[37] - 配备充足算力与数据资源,支持技术快速落地至视觉数据处理等产品场景[38][39] - 免除PPT制作与会议流程,聚焦核心研究工作[43] - 导师团队包括豆包大模型各方向负责人(王明轩、项亮等)及DeepMind前研究副总裁吴永辉[44][46][48][52] 行业人才竞争态势 - 人工智能工程师春招求职增速达69.6%,平均月薪超2万元[55] - 大模型算法等岗位连续2年位列人才紧缺度前十[56] - 阿里国际2026届校招80%为AI岗位,腾讯计划三年新增28000个实习岗位,技术类占比超60%[59][60][62] - 行业偏好年轻人才因20-30岁阶段创造力与学习能力更强,适合AI领域快速迭代特性[63][64]