中国AI大模型行业竞争态势 - 互联网巨头正通过巨额现金红包激励用户,争夺AI大模型应用的流量入口,例如腾讯元宝发放10亿元现金红包,百度投入5亿元推广文心助手,阿里千问投入30亿元红包,字节豆包APP提供最高8888元现金红包抽奖 [7] - 在产品层面,各大公司密集发布新模型,例如字节跳动在2月14日发布豆包大模型2.0,并在2月7日推出刷爆全网的视频模型Seedance 2.0,阿里则发布了新一代图像生成基础模型Qwen-Image 2.0,智谱和MiniMax也同期发布新模型 [9] - 行业竞争已进入白热化阶段,头部AI大模型公司正通过“烧钱”补贴和快速产品迭代进行未来命运的博弈,旨在培育用户心智并抢占AI时代的超级入口 [7][8][22][24] DeepSeek公司的动态与市场地位 - DeepSeek在2025年春节前一周发布推理大模型R1,以约几十万美元的低成本实现了与世界顶级模型同台竞技的性能,颠覆了顶级模型需要千万美元级别投入的认知,此举被称为“DeepSeek时刻” [4][17][18] - 在2026年春节前后,当竞争对手动作频频时,DeepSeek显得相对冷静,仅于2月11日悄悄将上下文窗口长度从128K token升级至1M token,并未高调发布此前传闻中代号为V4的新一代旗舰模型 [4][9][10] - 公司创始人梁文锋极少露面,公司保持神秘,但其技术实力和过往成就(如低成本推出高性能模型)使其在行业内被视为一匹“神秘黑马”和潜在的颠覆者 [4][11] DeepSeek创始人梁文锋的背景与理念 - 梁文锋出生于1985年,来自广东湛江,曾是当地高考状元,毕业于浙江大学电子信息工程专业,后继续在浙大攻读信息与通信工程研究生,师从项志宇进行机器视觉研究 [13][15] - 在2008年金融危机期间,梁文锋与同学开始探索全自动量化交易,并于2015年共同创立幻方量化,该公司早期几乎所有量化策略都采用AI模型计算,并在2019年及2021年投入超过10亿元建设“萤火一号”及“萤火二号”深度学习训练平台 [16] - 幻方量化在2021年跻身千亿量化私募行列,其AI集群搭载的英伟达A100显卡达到“万卡级别”,当时国内拥有此规模GPU的企业屈指可数 [16] - 梁文锋在38岁时决定创办DeepSeek,旨在做通用人工智能,其理念不止于复刻GPT,而是深度求索,进行真正的大模型研究以引领行业生态,他被认为是“难得拥有纯粹技术理想的人” [14][17] AI大模型应用的C端转向与竞争本质 - 行业竞争焦点正转向C端应用,旨在解决用户真实需求,例如字节跳动的豆包大模型已渗透到生活多个场景(如穿搭指导、宠物拍照、作业辅导),其月活跃用户已突破2亿 [22] - 互联网巨头通过补贴和场景化应用培育用户心智,其根本目标是定义下一个十年的互联网秩序,成为AI时代的超级入口 [22][24] - 即使是向来注重研究和效能的DeepSeek,也开始通过招聘产品经理等举措,关注C端用户需求、使用成本、增长及产品体验优化,显示出对C端市场的重视 [20][21]
都在等梁文锋
虎嗅APP·2026-02-18 11:38