字节豆包大模型2.0
搜索文档
都在等梁文锋
虎嗅APP· 2026-02-18 11:38
中国AI大模型行业竞争态势 - 互联网巨头正通过巨额现金红包激励用户,争夺AI大模型应用的流量入口,例如腾讯元宝发放10亿元现金红包,百度投入5亿元推广文心助手,阿里千问投入30亿元红包,字节豆包APP提供最高8888元现金红包抽奖 [7] - 在产品层面,各大公司密集发布新模型,例如字节跳动在2月14日发布豆包大模型2.0,并在2月7日推出刷爆全网的视频模型Seedance 2.0,阿里则发布了新一代图像生成基础模型Qwen-Image 2.0,智谱和MiniMax也同期发布新模型 [9] - 行业竞争已进入白热化阶段,头部AI大模型公司正通过“烧钱”补贴和快速产品迭代进行未来命运的博弈,旨在培育用户心智并抢占AI时代的超级入口 [7][8][22][24] DeepSeek公司的动态与市场地位 - DeepSeek在2025年春节前一周发布推理大模型R1,以约几十万美元的低成本实现了与世界顶级模型同台竞技的性能,颠覆了顶级模型需要千万美元级别投入的认知,此举被称为“DeepSeek时刻” [4][17][18] - 在2026年春节前后,当竞争对手动作频频时,DeepSeek显得相对冷静,仅于2月11日悄悄将上下文窗口长度从128K token升级至1M token,并未高调发布此前传闻中代号为V4的新一代旗舰模型 [4][9][10] - 公司创始人梁文锋极少露面,公司保持神秘,但其技术实力和过往成就(如低成本推出高性能模型)使其在行业内被视为一匹“神秘黑马”和潜在的颠覆者 [4][11] DeepSeek创始人梁文锋的背景与理念 - 梁文锋出生于1985年,来自广东湛江,曾是当地高考状元,毕业于浙江大学电子信息工程专业,后继续在浙大攻读信息与通信工程研究生,师从项志宇进行机器视觉研究 [13][15] - 在2008年金融危机期间,梁文锋与同学开始探索全自动量化交易,并于2015年共同创立幻方量化,该公司早期几乎所有量化策略都采用AI模型计算,并在2019年及2021年投入超过10亿元建设“萤火一号”及“萤火二号”深度学习训练平台 [16] - 幻方量化在2021年跻身千亿量化私募行列,其AI集群搭载的英伟达A100显卡达到“万卡级别”,当时国内拥有此规模GPU的企业屈指可数 [16] - 梁文锋在38岁时决定创办DeepSeek,旨在做通用人工智能,其理念不止于复刻GPT,而是深度求索,进行真正的大模型研究以引领行业生态,他被认为是“难得拥有纯粹技术理想的人” [14][17] AI大模型应用的C端转向与竞争本质 - 行业竞争焦点正转向C端应用,旨在解决用户真实需求,例如字节跳动的豆包大模型已渗透到生活多个场景(如穿搭指导、宠物拍照、作业辅导),其月活跃用户已突破2亿 [22] - 互联网巨头通过补贴和场景化应用培育用户心智,其根本目标是定义下一个十年的互联网秩序,成为AI时代的超级入口 [22][24] - 即使是向来注重研究和效能的DeepSeek,也开始通过招聘产品经理等举措,关注C端用户需求、使用成本、增长及产品体验优化,显示出对C端市场的重视 [20][21]
AI战事正酣,都在等梁文锋
36氪· 2026-02-15 11:45
中国AI大模型行业竞争格局 - 互联网巨头正投入巨额资金进行市场推广和用户补贴 腾讯元宝撒出10亿元现金红包 百度投入5亿现金红包 阿里千问带着30亿元红包 字节豆包APP上参与新春抽奖最高可领8888元现金红包 [4] - 主要厂商在2025年2月密集发布新一代模型产品 字节豆包大模型2.0官宣发布 字节视频模型Seedance 2.0刷爆全网 阿里发布新一代图像生成基础模型Qwen-Image 2.0 智谱、MiniMax也齐发新模型 [5] - AI大模型竞争正从技术研发转向C端应用和商业化 通过补贴吸引用户使用并培育心智 在生活场景中寻找立足点 例如字节豆包月活已突破2亿 [15][16] - 行业竞争的核心在于解决用户真实需求 成为AI时代的超级入口 这关乎定义下一个十年互联网秩序的机会 [17] DeepSeek公司动态与战略 - DeepSeek在2025年春节前一周发布推理大模型R1 以意想不到的低成本实现与世界顶级模型同台竞技的性能 成本仅约几十万美元 颠覆了顶级模型需要千万美元级别投入的认知 [2][12] - 2026年2月11日 DeepSeek悄悄进行技术升级 将上下文窗口长度从此前的128K token提升至1M(百万)token [6] - 公司计划于2026年2月中旬发布代号为V4的新一代旗舰级人工智能模型 剑指Coding AI王座 但内部对发布时间保持沉默 [6] - 2026年1月 DeepSeek团队密集发布两篇由创始人梁文锋署名的论文 涉及mHC(流形约束超连接)及Engram(条件记忆)技术 市场推测可能与V4核心技术相关 [7] - 公司在年关期间仍在持续招聘 更新了产品经理、客户端研发工程师等多个岗位 [7] - DeepSeek近期开始加强C端产品规划 招聘产品经理以主导C端产品的功能规划与体验设计 关注用户增长和使用深度 [14] 创始人梁文锋背景与公司历史 - 创始人梁文锋是来自广东湛江的85后 极少露面 身家上百亿 [2] - 梁文锋少年时期成绩优异 17岁作为当地高考状元考入浙江大学电子信息工程专业 后继续在浙大读研 师从项志宇 主攻机器视觉研究 [8][9] - 2008年金融危机期间 梁文锋与同学组队使用机器学习技术探索全自动量化交易 [10] - 2015年 梁文锋与浙大同学徐进正式创立杭州幻方科技有限公司 即后来的幻方量化 [10] - 幻方量化早期几乎所有量化策略都采用AI模型计算 2019年及2021年投入逾10亿元建设自主研发深度学习训练平台“萤火一号”及“萤火二号” [10] - 到2021年 幻方量化成功跻身千亿量化私募之列 其AI集群搭载的英伟达A100显卡达到“万卡级别” 当时国内超过1万枚GPU的企业屈指可数 [10] - 2023年(38岁) 梁文锋决定创办DeepSeek 目标是做通用人工智能 旨在深度求索并引领行业生态 而非简单复刻GPT [11][12]
都在等梁文锋
投资界· 2026-02-14 15:08
中国AI大模型行业竞争态势 - 互联网巨头正投入巨额资金进行用户补贴和推广以争夺AI流量入口 腾讯投入10亿元现金红包 百度投入5亿元现金红包 阿里投入30亿元红包 字节跳动提供最高8888元现金红包抽奖[4] - 头部公司在产品侧密集发布新模型 字节跳动在2025年2月发布豆包大模型2.0和视频模型Seedance 2.0 阿里发布新一代图像生成基础模型Qwen-Image 2.0 智谱和MiniMax也同期发布新模型[5] - 行业竞争焦点正从技术研发转向C端应用和用户心智培育 通过生活化场景(如点奶茶、穿搭指导、辅导作业)吸引用户 目标是成为AI时代的超级入口并定义未来十年互联网秩序[11] DeepSeek公司动态与战略 - 公司创始人梁文锋背景独特 1985年出生于广东湛江 曾是当地高考状元 毕业于浙江大学 在2008年金融危机期间即开始探索机器学习与量化交易 于2015年共同创立幻方量化[7][8] - 幻方量化在2021年跻身千亿量化私募行列 其AI集群搭载的GPU数量达到“万卡级别” 当时国内拥有此规模的企业屈指可数 主要为互联网大厂[9] - 梁文锋于38岁时(约2023年)决定创立DeepSeek 旨在做通用人工智能并进行深度研究 而非简单复刻GPT[9] - 公司在2025年1月(春节前一周)发布DeepSeek R1推理大模型 以约几十万美元的低成本实现了与世界顶级模型比肩的性能 颠覆了千万美元级别投入的行业认知 该版本被慷慨开源[2][9] - 近期公司动态显得低调 在2026年2月行业混战之际 公司仅于2月11日将模型上下文窗口长度从128K token升级到1M token 对于外界猜测的新版本V4发布时间保持沉默[2][6] - 公司近期招聘显示战略可能向C端产品倾斜 正在招聘产品经理以主导C端产品功能规划与体验设计 关注用户增长与使用深度 而此前其C端产品因界面简单被用户调侃“好像不需要赚钱一样”[10] DeepSeek核心技术储备与创始人理念 - 公司在2026年1月由梁文锋署名密集发布了两篇论文 涉及mHC(流形约束超连接)及Engram(条件记忆)技术 市场猜测这可能与新一代旗舰模型V4的核心技术相关[6] - 梁文锋的成长环境与理念强调解决问题而非考试排名 这与其在AI圈内被视作“拥有纯粹技术理想的人”的形象相符[7] - 创始人曾表示“我们大部分公司习惯follow,而不是创新” 在行业“诸神混战”之际 外界期待其能再次带来颠覆性创新[6]