Workflow
Seedream 5.0 Preview
icon
搜索文档
豆包正式加入AI红包大战,有人抽中88.8元、66.6元,最高可领8888元!千问“请客”第二轮今晚开启,有重头戏
新浪财经· 2026-02-14 10:16
春节AI红包营销活动 - 字节跳动旗下“豆包”于2月13日晚启动“豆包过年”新春活动第一阶段,相关话题冲上热搜 [2][34] - 活动第一阶段用户红包金额多在0.1元至8.88元之间,以1.66元、1.88元较常见,少数用户获得66.6元或88.8元,最高8888元红包概率极低 [3][35] - 用户通过打开豆包App,进入活动页面体验AI生成拜年祝福、新春写真、头像、祝福卡片、拜年视频等玩法即可参与抽奖赢取红包,中奖后可提现 [7][39] - 活动第二阶段将于2月16日除夕夜春晚直播期间进行,豆包将设置三轮互动抽奖,向全国观众送出超过10万份科技好礼及最高8888元现金红包 [9][41] - 阿里巴巴旗下“千问”的“春节请客 瓜分30亿”活动第二轮于2月14日晚开启 [14][46] - 千问第一波免单卡活动已于2月12日24点结束,该活动提供25元无门槛抵扣券,多位网友反馈21张免单卡不够 [18][50] - 千问活动设有邀请新用户开奖机制,每天邀请满3人可于次日12点开奖,中奖者可在“千问AI生活卡”与“5000元现金红包”中二选一,最后一次开奖在2月13日中午12点 [18][50] 主要AI产品技术升级与战略 - 豆包大模型2.0于2月14日正式发布,由字节跳动旗下火山引擎推出 [11][43] - 豆包大模型2.0同步升级了Seedance 2.0(音视频)和Seedream 5.0 Preview(图像),旨在构建全模态AI矩阵 [9][11][41][43] - 豆包大模型2.0核心升级包括:基础能力跃升,采用MoE混合专家架构,实现推理提速约60%、计算量降低40%;企业级Agent重构,支持自主规划与工具调用;全模态融合,增强文本、图像、音视频协同能力 [13][45] - 创作模型同步升级,Seedance 2.0提升了视频生成的可用率与可控性,Seedream 5.0 Preview增强了实时检索与多语种能力 [13][45] - 阿里巴巴战略聚焦“消费入口”,将千问全面接入淘宝闪购、支付宝、高德等核心生态,引导用户养成“一句话完成消费全流程”的习惯 [29][61] - 腾讯依托社交根基,通过“元宝”借助微信、QQ关系链实现AI与社交场景衔接 [29][61] - 百度选择将红包活动和AI互动内嵌于百度App中,以更短路径触达用户 [29][61] - 字节跳动豆包则借助春晚顶级流量入口发放礼品,与其他三家的“真金白银”补贴策略形成差异 [31][63] 行业背景与竞争态势 - 春节是互联网产品获客的黄金窗口,2025年春节营销中,阿里、腾讯、百度三家头部企业投入超45亿元,字节跳动豆包也宣布送出科技好礼及现金红包 [23][55] - 2025年以来,以DeepSeek等为标志,国产大模型在对话理解、逻辑推理、多模态生成及复杂指令执行等方面持续突破 [25][57] - 据机构测算,2025年中国人工智能企业数量超过6000家,核心产业规模预计突破1.2万亿元 [27][59] - 产品形态从单一工具拓展为覆盖算法、平台与行业解决方案的全链条生态 [27][59] - 随着主流模型进入“可用”与“好用”阶段,头部企业竞争焦点从比拼模型能力转向争夺用户使用习惯和产品普及度 [27][59] - 各企业目标一致:在技术成熟基础上,留住用户、构建生态,为未来商业生态奠定智能化根基 [31][63]
焦点复盘沪指低开低走失守4100点,军工、半导体设备板块逆势活跃
搜狐财经· 2026-02-13 21:29
市场整体表现 - 蛇年收官日A股三大指数全天低开低走,上证指数跌1.26%,深成指跌1.28%,创业板指跌1.57% [1] - 全市场超3800股下跌,沪深两市成交额1.98万亿元,较上一日缩量1591亿元 [1] - 今日32股涨停,11股炸板,封板率为74% [1] - 连板晋级率降至23.53%,高位股亏钱效应高企 [3][7] 行业板块涨跌 - 涨幅靠前的板块:军工、影视、造纸、半导体设备 [1] - 跌幅靠前的板块:光伏、有色、油气、航运 [1] - 算力硬件、有色、油气等权重抱团方向展开深幅调整 [3] 主线热点:人工智能(AI)相关 - AI审核概念早盘逆势活跃,汉邦高科涨停(20.00%),国安股份涨停(10.06%),视声智能一度涨超20% [4][11] - 火山引擎定于2月14日发布豆包大模型2.0、Seedance 2.0、Seedream 5.0 Preview [4] - 影视、文化传媒板块受益版权价值重估回暖,掌阅科技晋级5连板(10.00%),光线传媒强势反包午后一度逼近涨停(涨15.39%) [4][11] - 宇树科技CEO王兴兴表示,若具身智能AI模型和机器人技术突破,热度可能比现在高至少100倍甚至1000倍 [5] - 机器人概念近期表现不俗,天奇股份、百达精工、克来机电涨停 [5][19] - 光通信领域,东方证券表示云厂商持续加码AI算力投资,算力需求有望保持强劲 [20] - 华胜天成涨停(10.01%),逻辑为华为+算力+AI [11] 主线热点:半导体与存储芯片 - Counterpoint数据显示,截至2026年第一季度,内存价格环比上涨80%至90%,通用服务器DRAM价格大幅攀升是主要推动力 [5] - 铠侠预计当前财年归属母公司净利润将达到4537亿至5137亿日元,对应同比增速66.6%-88.7% [5] - 存储芯片产业链全天逆势活跃,设备端表现突出,洁净室龙头圣晖集成反包涨停(10.00%),纳米级薄膜沉积设备龙头微导纳-米盘中一度涨超18%并创历史新高(收涨14.57%) [5][13] - 深科技(10.02%)、德明利、江波龙等存储芯片概念股午后逆势活跃 [5] - 招商证券指出,AI服务器需求爆发正驱动DRAM与逻辑芯片资本开支高增,预计2026年全球晶圆前道制造设备(WFE)市场规模将突破1300亿美元并创历史新高,增长率有望达20%以上 [12] 主线热点:商业航天与军工 - 我国首次在海上实施运载火箭搜索回收任务,并首次通过海上发射为巴基斯坦成功发射PRSC-EO2卫星 [6] - 商业航天概念回暖,带动船舶、大飞机等细分轮动活跃,安达维尔涨停(19.99%)、亚星锚链涨停(10.04%)、航发动力涨停(10.01%) [6][17] - 中信建投研报指出,在2027年建军百年背景下,2025至2027年行业向好趋势确定性强 [17] - 中航证券指出,多款新一代火箭成功首飞,2026年发射次数有望破百 [20] - 泰嘉股份(10.03%)、天汽模(9.96%)因商业航天逻辑涨停 [21] 其他活跃板块与个股 - 智能驾驶概念活跃,工信部组织对《智能网联汽车 自动驾驶系统安全要求》等五项强制性国家标准形成征求意见稿 [14] - 浙江世宝(10.02%)、兴民智通(10.01%)、千里科技(10.05%)等智能驾驶概念股涨停 [16] - 光通信板块,金时科技晋级3连板(9.99%),逻辑为光纤光缆 [20] - 造纸板块五洲特纸涨停(9.97%) [23] - 智光电气涨停(9.99%),逻辑为签订2.1亿元大合同 [23] - 其他涨停个股包括:豫能控股(3连板,10.01%,并购重组/对先天算力增资)、美邦股份(3连板,10.02%,农药)、汉缆股份(2连板,10.08%,电网设备)等 [8][21]
“发展速度太快了”!马斯克点赞Seedance 2.0,字节称“还远不完美”
硬AI· 2026-02-12 23:44
核心观点 - 字节跳动发布视频生成模型Seedance 2.0,凭借其多模态、长叙事等专业级能力引发全球高度关注,并已快速集成至旗下产品及开放企业试用,标志着生成式视频模型正加速进入大众化产品与企业工具链 [2][3][7] 马斯克转发,将热度推向海外 - 马斯克在X平台转发Seedance 2.0相关内容并评论“It‘s happening fast”,将模型热度从技术圈层扩散至更广泛的科技投资与产品关注人群 [9][10] - 马斯克的公开评价强化了市场关于AI视频生成“发展速度”的叙事,可能提升外界对字节跳动多模态能力的关注度,并对相关产业链估值预期产生边际影响 [10] 从内测到全面接入:豆包、即梦与火山方舟同步推进 - Seedance 2.0已正式发布,全面接入豆包App、电脑端、网页版以及即梦产品,并上线火山方舟体验中心供用户试用 [7][12][13] - 面向企业端,预计在2月中下旬,Seedance 2.0的API服务将上线火山方舟,为企业客户提供标准化调用服务,表明其定位不仅是创作工具,也面向B端商用 [13] 多模态、长叙事与音画同步,瞄准“专业生产场景” - 模型主打能力包括:1)多模态输入,支持文字、图片、音频、视频四种模态混合输入,可参考构图、动作、运镜等元素 [15][16];2)原声音画同步与多轨并行输出,强调音频与画面节奏的对齐 [17];3)多镜头长叙事与“编导思维”,可自动解析叙事逻辑并保持角色、光影等一致性 [17];4)新增视频编辑与视频延长能力,强化工作流属性 [18] - 公司表示,Seedance 2.0较好解决了物理规律遵循及长效一致性等难题,在运动场景下的生成可用率达到业界SOTA水平 [18] “还远不完美”:短板与限制被明确写入产品介绍 - 公司承认模型在细节稳定性、多人口型匹配、多主体一致性、文字还原精度和复杂编辑效果等方面仍有优化空间,将持续探索大模型与人类反馈的深度对齐 [8][19][20] - 合规方面,目前Seedance 2.0限制使用真人图像或视频作为主体参考,如需使用须经本人验证或取得授权,这将直接影响部分商业素材的生产与投放链路 [23] 2月14日发布在即,升级节奏成为新变量 - 字节跳动火山引擎初步确定于2026年2月14日发布一系列重要升级,包括豆包大模型2.0、Seedance 2.0、图像创作模型Seedream 5.0 Preview,基础模型能力和企业级Agent能力将有大幅提升 [24][25] - 在市场关注发展速度的背景下,后续焦点将集中在Seedance 2.0的API上线与企业采用速度,以及模型在一致性、口型等短板上的改进节奏,能否支撑其从“爆款演示”走向“稳定生产力” [26]
“发展速度太快了”!马斯克点赞Seedance 2.0,字节:还远不完美
搜狐财经· 2026-02-12 19:52
行业动态与市场关注 - 生成式视频模型正加速进入大众化产品与企业工具链,市场对视频生成能力跃迁的关注度提升 [1] - 马斯克在X平台评论字节跳动视频创作模型Seedance 2.0并感叹"It's happening fast",将模型热度从技术圈层扩散至更广泛的科技投资与产品关注人群,放大了市场叙事 [1][7] - 公司“高曝光+快速产品化+持续迭代”的组合,强化了市场对视频生成赛道竞争节奏加快的预期 [6] 产品发布与接入 - 字节跳动正式发布视频创作模型Seedance 2.0,并全面接入其豆包App、电脑端、网页版以及即梦产品 [5][8] - 模型同时上线火山方舟体验中心,面向用户开放试用 [5] - 面向企业端,预计在2月中下旬,Seedance 2.0的API服务将上线火山方舟,为标准化B端调用做准备 [8] 核心功能与技术能力 - 模型主打原声音画同步、多镜头长叙事、多模态可控生成等能力,瞄准更广泛的创作者与商业内容场景 [5] - 支持文字、图片、音频、视频四种模态混合输入,可参考构图、动作、运镜等元素 [8] - 具备原声音画同步与多轨并行输出能力,支持背景音乐、环境音效等多轨音频并与画面节奏对齐 [9] - 模型可自动解析叙事逻辑,生成镜头序列并保持角色、光影、风格与氛围的统一,体现“编导思维” [10] - 新增视频编辑与视频延长能力,强化“导演级操控”的工作流属性 [11] - 公司称模型较好解决了物理规律遵循及长效一致性等难题,在运动场景下的生成可用率达到业界SOTA水平 [11] 产品定位与未来规划 - 公司对Seedance 2.0的定位强调其质量与可控性已达到专业生产场景要求 [8] - 公司同时保持克制,官方称模型“还远不完美”,生成结果在细节稳定性、多人口型匹配等多方面仍有瑕疵,将持续探索大模型与人类反馈的深度对齐 [6][12] - 火山引擎初步确定于2026年2月14日发布一系列重要升级,包括豆包大模型2.0、Seedance 2.0、图像创作模型Seedream 5.0 Preview,基础模型和企业级Agent能力将有大幅提升 [15] 合规与使用限制 - 目前Seedance 2.0限制使用真人图像或视频作为主体参考,如需使用须经本人验证或取得授权,这将影响部分商业素材的生产与投放链路 [15]
Seedance 2.0全量上线,字节正式加入春节模型大战
36氪· 2026-02-12 17:53
核心观点 - 字节跳动提前发布其多模态视频生成模型Seedance 2.0,正式加入春节期间的AI模型竞争,该模型在多项基准测试中表现领先,并增强了在影视、广告等领域的应用潜力 [1][2][16] 产品发布与规划 - 公司原计划于2月14日发布Seedance 2.0、图像创作模型Seedream 5.0 Preview及豆包大模型2.0,但Seedance 2.0已提前亮相 [2] - 模型已整合至即梦APP端和PC端,但两端功能存在差异,移动端“出镜”功能默认采用Seedance 2.0,而PC端用户可在“全能参考”和“首尾帧”入口使用该模型 [10][11][14] 技术架构与核心能力 - Seedance 2.0采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入 [2] - 模型支持混合模态输入,允许用户同时输入多达9张图片、3段视频、3段音频以及自然语言指令 [3] - 核心能力包括解决物理规律遵循和长效一致性难题,依靠海量世界知识、稀疏架构效能优势及多模态联合训练的泛化能力 [6] - 模型具备视频编辑能力,支持对指定片段、角色、动作或剧情进行定向修改 [8] 性能表现与行业对比 - 在文生视频和图生视频覆盖的运动稳定性、指令遵循、音画同步等基准测试维度上,大幅领先于OpenAI的Sora 2 Pro、快手可灵3.0等产品 [16] - 在多模态任务方面,与生数的Vidu Q2 Pro、快手的可灵3.0相比,Seedance 2.0在提示词指令遵循、多模态遵循两个维度表现最为突出,在编辑一致性、参考对齐和动态质量上也处于行业第一梯队 [17] - 模型在多模态任务处理上指令响应更完整,生成画面更真实,在主体形象与声音还原方面表现较好 [18] 产品功能与应用 - 模型集成了业界最全面的多模态内容参考和编辑能力,用户可在交互界面选择“全能参考”生成模式,并使用@符号在提示词中标记参考图以保证生成一致性 [2][4] - 模型最长支持15秒的多镜头视频生成,旨在增加在影视、广告等领域的可用性,以降低内容制作成本 [9] - 移动端创作功能提供了Seedance 2.0 fast以及之前的模型,其中S2.0 Fast被描述为高性价比,支持音、视、文、图参考(暂不支持真人人脸) [11][12] 用户体验与现状 - 根据实测,生成一段5秒钟的视频需要扣除40个点数,由于大量用户排队,预计生成时间为2小时,系统提供免费加速2次的机会 [4] - 受限于版权等原因,一些名人相关的图片已无法用于生成内容 [4] - 公司承认模型仍需持续改善细节稳定性、拟真度以及多人口型匹配等问题,并在多主体一致性、文字还原精度及复杂编辑效果上有优化空间 [16][18]
多款国产大模型将重磅落地,光模块、CPO等算力硬件股回调,通信ETF华夏(515050)跌超1.5%
新浪财经· 2026-02-11 13:40
市场表现与板块动态 - 2月11日AI产业链表现分化,光模块CPO等算力硬件冲高回落,算力租赁、云计算等概念逆势走强 [1] - 热门个股中,华策影视跌超10%,中文在线、蓝色光标、中际旭创、新易盛、昆仑万维等纷纷调整 [1] - 截至13:27,通信ETF(515050)下跌1.88%,创业板人工智能ETF华夏(159381)下跌1.83%,云计算ETF华夏(516000)小幅上涨 [1] - AI板块短期调整,被视为提供更具性价比的布局窗口 [1] 产品与技术进展 - 春节期间国产AI行业将有几款重磅产品推出 [1] - DeepSeek即将发布新一代大模型V4,可能通过创新架构进一步降低训练和推理成本 [1] - 代号"Pony Alpha"的高性能模型被广泛推测为智谱AI新一代旗舰产品GLM-5,其展现的高端编程与智能体水平被视为国产大模型在关键领域的重要突破 [1] - 字节同步推出Seedream 5.0 Preview,对标谷歌Nano Banana Pro,力求在抽象语义处理和多步图文生成上更稳 [1] - 若DeepSeek V4能显著降低训练与推理成本,可能帮助大模型及应用开发商更快地将技术转化为收入,缓解盈利压力 [2] 投资逻辑与关注方向 - 需要关注那些能率先利用新一代大模型能力,打造出颠覆性AI原生应用或智能体的软件公司,其增长天花板可能因模型能力的飞跃而被再次推高 [2] - 全球主要云服务商正全力追逐通用人工智能,资本开支的竞赛远未停歇 [2] - 全球大模型及应用开发商正背负着日益沉重的资本开支负担 [2] 相关ETF产品信息 - 通信ETF华夏(515050)深度聚焦电子(芯片、PCB、消费电子)+通信(光模块、服务器)算力硬件,前五大持仓股为中际旭创、新易盛、立讯精密、工业富联、兆易创新 [2] - 创业板人工智能ETF华夏(159381)跟踪指数CPO权重近50%,同时覆盖国产软件+AI应用企业,具备较高弹性,前三大权重股为中际旭创(15.64%)、新易盛(15.57%)、天孚通信(6.85%),场内综合费率仅0.20% [2] - 云计算ETF华夏(516630)聚焦国产AI软硬件算力,计算机软件+云服务+计算机设备合计权重高达83.7%,deep seek、AI应用含量均超40%,场内综合费率仅0.20% [3]
字节发完阿里发,Qwen-Image 2.0火线出击
36氪· 2026-02-10 20:52
阿里巴巴发布Qwen-Image 2.0模型 - 阿里巴巴发布新一代图像生成基础模型Qwen-Image 2.0,该模型支持长达一千个token的超长指令和2k分辨率,并采用更轻量的模型架构 [2] - 模型尺寸远小于Qwen-Image 2.0的20B,带来更快的推理速度 [2] - 该模型将图像生成与图像编辑两个能力整合到了一个模型中 [12] 模型核心能力与特点 - 模型升级重点是文字渲染,能够用超长提示词精确定义文字的字体、排版、格式,并做到不错的还原 [2] - 能够用毛笔字渲染《兰亭集序》全文,确保文字与画面协调,文字渲染失败的比例很低 [4] - 针对AI生图常见的“油腻感”问题进行了优化,色彩不会过于饱和,观感更像实拍 [5] - 支持一次性渲染数十个子图(例如24个画面),并能保持其中主体(如人物、画风)的一致性 [9] - 模型尺寸比1.0版本(约200亿参数)显著减小,但能力更强,且生成速度更快 [37] 模型性能基准测试表现 - 在AI Arena平台的文生图基准测试中,Qwen-Image 2.0的ELO得分为1029,排名第三,胜率为47.29% [8] - 在图生图(单图编辑)基准测试中,Qwen-Image 2.0的ELO得分为1034,排名第二,胜率为35.97% [12] - 在文生图基准中,排名第一的是谷歌的Gemini-3-Pro-Image-Preview(ELO 1050),排名第二的是OpenAI的GPT Image 1.5(ELO 1043)[8] - 在图生图基准中,排名第一的是谷歌的Gemini-3-Pro-Image-Preview(ELO 1042),排名第三的是字节跳动的Seedream 4.5(ELO 1011)[12] 与竞品的横向体验比较 - 在长指令遵循、长文本渲染方面具有优势,但在图像生成的真实感上仍稍逊于谷歌的Nano Banana Pro [2] - 在超长提示词文字渲染任务中,能准确还原图片布局、字体颜色和内容,而字节跳动的Seedream 5.0 Preview在还原文字内容上出现偏差,谷歌的Nano Banana Pro则存在部分文字模糊的问题 [15][17][19][22] - 在多子图生成任务(生成20个分镜的漫画)中,Qwen-Image 2.0未能完全按要求生成,画面存在不符合常理的现象;而谷歌Nano Banana Pro和字节Seedream 5.0 Preview均未能成功生成 [24][28] - 在超现实场景图像生成任务中,Qwen-Image 2.0生成的画面与提示词存在差距,而谷歌Nano Banana Pro的生成结果更符合提示词的关键描述 [30][32] - 字节跳动的Seedream 5.0 Preview在超现实场景生成中未遵循“像水晶般透明”的要求,但其余内容基本得到还原,画风更具科幻感 [36] 技术路径与未来规划 - 项目负责人表示,Qwen-Image 2.0升级的核心是“信息图”,未来一年团队将继续研究如PPT、多图海报、漫画等复杂“父图”的生成,进一步减少幻觉和错误 [14] - 计划在分层模型基础上,进一步强化模型的分层编辑能力,目标是让生成模型真正成为生产力工具,实现“分而治之”的复杂编辑流程 [14] - 通过提升VAE(变分自编码器)的重构能力和增强对密集细小文字的建模,解决了小文字信息密集导致压缩难度大、容易崩坏的问题 [39] - 采用生成与编辑融合的“二合一”模型,实现了能力相互促进,达到1+1>2的效果,编辑任务训练能反哺文生图,使其对提示词更敏感、遵循更精确 [32][34][35] 市场定位与商业化落地 - 模型能力的提升,尤其是在可控性和稳定性方面,使其能真正渗透到各行各业 [39] - 在电商领域,可用于海量商品的主图、详情图、广告素材图生成,如服装行业的模特换装、商品属性修改以及利用“信息图”能力生成商品详情长图 [39] - 在医疗等专业领域,可将复杂的流程通过信息图、流程图等形式可视化 [39] - 中国AIGC市场在应用落地和产业迭代速度上具有优势,丰富的应用场景能催生新的产业链并快速反哺模型迭代 [39] - Qwen-Image系列将与WPS等国民级应用合作,获取真实用户反馈和需求,形成从应用到技术的闭环迭代 [40] 行业趋势观察 - 图像生成领域的头部厂商已达成共识,模型不仅追求生成逼真画面,更要满足现实场景中对提示词精准遵循、文字准确渲染等关键需求,这些是决定模型生产力的核心要素 [41] - 随着模型不断优化迭代,图像生成有潜力成为企业和个人在信息处理、创作表达及决策支持等方面的强大助手 [41]