Workflow
字节视频模型Seedance 2.0
icon
搜索文档
都在等梁文锋
虎嗅APP· 2026-02-18 11:38
中国AI大模型行业竞争态势 - 互联网巨头正通过巨额现金红包激励用户,争夺AI大模型应用的流量入口,例如腾讯元宝发放10亿元现金红包,百度投入5亿元推广文心助手,阿里千问投入30亿元红包,字节豆包APP提供最高8888元现金红包抽奖 [7] - 在产品层面,各大公司密集发布新模型,例如字节跳动在2月14日发布豆包大模型2.0,并在2月7日推出刷爆全网的视频模型Seedance 2.0,阿里则发布了新一代图像生成基础模型Qwen-Image 2.0,智谱和MiniMax也同期发布新模型 [9] - 行业竞争已进入白热化阶段,头部AI大模型公司正通过“烧钱”补贴和快速产品迭代进行未来命运的博弈,旨在培育用户心智并抢占AI时代的超级入口 [7][8][22][24] DeepSeek公司的动态与市场地位 - DeepSeek在2025年春节前一周发布推理大模型R1,以约几十万美元的低成本实现了与世界顶级模型同台竞技的性能,颠覆了顶级模型需要千万美元级别投入的认知,此举被称为“DeepSeek时刻” [4][17][18] - 在2026年春节前后,当竞争对手动作频频时,DeepSeek显得相对冷静,仅于2月11日悄悄将上下文窗口长度从128K token升级至1M token,并未高调发布此前传闻中代号为V4的新一代旗舰模型 [4][9][10] - 公司创始人梁文锋极少露面,公司保持神秘,但其技术实力和过往成就(如低成本推出高性能模型)使其在行业内被视为一匹“神秘黑马”和潜在的颠覆者 [4][11] DeepSeek创始人梁文锋的背景与理念 - 梁文锋出生于1985年,来自广东湛江,曾是当地高考状元,毕业于浙江大学电子信息工程专业,后继续在浙大攻读信息与通信工程研究生,师从项志宇进行机器视觉研究 [13][15] - 在2008年金融危机期间,梁文锋与同学开始探索全自动量化交易,并于2015年共同创立幻方量化,该公司早期几乎所有量化策略都采用AI模型计算,并在2019年及2021年投入超过10亿元建设“萤火一号”及“萤火二号”深度学习训练平台 [16] - 幻方量化在2021年跻身千亿量化私募行列,其AI集群搭载的英伟达A100显卡达到“万卡级别”,当时国内拥有此规模GPU的企业屈指可数 [16] - 梁文锋在38岁时决定创办DeepSeek,旨在做通用人工智能,其理念不止于复刻GPT,而是深度求索,进行真正的大模型研究以引领行业生态,他被认为是“难得拥有纯粹技术理想的人” [14][17] AI大模型应用的C端转向与竞争本质 - 行业竞争焦点正转向C端应用,旨在解决用户真实需求,例如字节跳动的豆包大模型已渗透到生活多个场景(如穿搭指导、宠物拍照、作业辅导),其月活跃用户已突破2亿 [22] - 互联网巨头通过补贴和场景化应用培育用户心智,其根本目标是定义下一个十年的互联网秩序,成为AI时代的超级入口 [22][24] - 即使是向来注重研究和效能的DeepSeek,也开始通过招聘产品经理等举措,关注C端用户需求、使用成本、增长及产品体验优化,显示出对C端市场的重视 [20][21]
AI战事正酣,都在等梁文锋
36氪· 2026-02-15 11:45
中国AI大模型行业竞争格局 - 互联网巨头正投入巨额资金进行市场推广和用户补贴 腾讯元宝撒出10亿元现金红包 百度投入5亿现金红包 阿里千问带着30亿元红包 字节豆包APP上参与新春抽奖最高可领8888元现金红包 [4] - 主要厂商在2025年2月密集发布新一代模型产品 字节豆包大模型2.0官宣发布 字节视频模型Seedance 2.0刷爆全网 阿里发布新一代图像生成基础模型Qwen-Image 2.0 智谱、MiniMax也齐发新模型 [5] - AI大模型竞争正从技术研发转向C端应用和商业化 通过补贴吸引用户使用并培育心智 在生活场景中寻找立足点 例如字节豆包月活已突破2亿 [15][16] - 行业竞争的核心在于解决用户真实需求 成为AI时代的超级入口 这关乎定义下一个十年互联网秩序的机会 [17] DeepSeek公司动态与战略 - DeepSeek在2025年春节前一周发布推理大模型R1 以意想不到的低成本实现与世界顶级模型同台竞技的性能 成本仅约几十万美元 颠覆了顶级模型需要千万美元级别投入的认知 [2][12] - 2026年2月11日 DeepSeek悄悄进行技术升级 将上下文窗口长度从此前的128K token提升至1M(百万)token [6] - 公司计划于2026年2月中旬发布代号为V4的新一代旗舰级人工智能模型 剑指Coding AI王座 但内部对发布时间保持沉默 [6] - 2026年1月 DeepSeek团队密集发布两篇由创始人梁文锋署名的论文 涉及mHC(流形约束超连接)及Engram(条件记忆)技术 市场推测可能与V4核心技术相关 [7] - 公司在年关期间仍在持续招聘 更新了产品经理、客户端研发工程师等多个岗位 [7] - DeepSeek近期开始加强C端产品规划 招聘产品经理以主导C端产品的功能规划与体验设计 关注用户增长和使用深度 [14] 创始人梁文锋背景与公司历史 - 创始人梁文锋是来自广东湛江的85后 极少露面 身家上百亿 [2] - 梁文锋少年时期成绩优异 17岁作为当地高考状元考入浙江大学电子信息工程专业 后继续在浙大读研 师从项志宇 主攻机器视觉研究 [8][9] - 2008年金融危机期间 梁文锋与同学组队使用机器学习技术探索全自动量化交易 [10] - 2015年 梁文锋与浙大同学徐进正式创立杭州幻方科技有限公司 即后来的幻方量化 [10] - 幻方量化早期几乎所有量化策略都采用AI模型计算 2019年及2021年投入逾10亿元建设自主研发深度学习训练平台“萤火一号”及“萤火二号” [10] - 到2021年 幻方量化成功跻身千亿量化私募之列 其AI集群搭载的英伟达A100显卡达到“万卡级别” 当时国内超过1万枚GPU的企业屈指可数 [10] - 2023年(38岁) 梁文锋决定创办DeepSeek 目标是做通用人工智能 旨在深度求索并引领行业生态 而非简单复刻GPT [11][12]
智谱GLM-5引爆行情!国产大模型再获突破!科创人工智能ETF(589520)猛拉4%,马斯克:模型发展速度太快!
新浪财经· 2026-02-12 19:37
核心观点 - 临近春节,国产AI大模型密集发布取得重大技术突破,带动资本市场对国产AI产业链的投资热情,相关ETF及个股表现强劲 [1][7] - 智谱AI发布新一代旗舰模型GLM-5,其技术能力获得海外技术圈高度评价,标志着中国在稀疏架构、代码能力与智能体领域正式跻身全球第一梯队 [3][8] - 国产算力生态日趋成熟,GLM-5已完成与主流国产芯片平台的深度适配,验证了国产芯片集群对大规模生成式模型的承载能力 [3][10] - 机构看好国产算力发展前景,认为其业绩弹性与投资确定性兼备,国产化替代趋势明确,产业链存在较大投资机遇 [3][10] 市场表现 - 2025年2月12日,科创人工智能ETF华宝(589520)场内价格大幅上涨4.02%,一举收复20日均线 [1][7] - 该ETF当日成交数据:最新价0.700元,上涨0.028元(涨幅4.17%),开盘价0.67元,最高价0.806元,最低价0.538元,成交额5631.3275万元,流通市值6.9亿元 [9] - 成份股表现亮眼:优刻得20CM涨停,晶晨股份涨逾15%,芯原股份涨超12%,威胜信息、星环科技、凌云光等个股跟涨,权重股寒武纪涨超3% [1][8] 技术突破与行业动态 - 字节跳动视频模型Seedance 2.0火到海外,马斯克评论称“模型发展速度太快” [1][7] - 智谱AI于2月12日凌晨发布新一代旗舰模型GLM-5,此前以匿名代号“PonyAlpha”在海外平台引爆技术圈 [3][8] - GLM-5被海外热议为“最强开源代码模型”,其推理深度与工程化能力被评价为逼近闭源顶级水准 [3][8] - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化 [3][10] 产业链与投资工具 - 科创人工智能ETF(589520)及其联接基金重点布局国产AI产业链 [3][10] - 该ETF成份股囊括国产GPU龙头(如寒武纪)、国产ASIC龙头(如芯原股份)、AI应用龙头(如金山办公) [3][10] - 该ETF行业配置:半导体行业权重占比近一半,软件行业权重占比超三成 [3][10] - 该ETF是融资融券标的,被视为一键布局国产算力的高效工具 [3][10] 机构观点与后市展望 - 中信证券认为,国产算力方兴未艾,业绩弹性及投资确定性兼备,有望复刻美股2023年以来的长牛行情 [3][10] - 半导体设备、AI芯片等在海外管制下发展紧迫性增强,国产化是大势所趋 [3][10] - 国内芯片厂已初步探索出超节点等解决方案,以多卡数量优势补足单卡性能劣势,实现算力突围,并为产业链上下游带来更大的投资机遇 [3][10]