Seedream 5.0 Lite
搜索文档
从Gemini到豆包:全球两大AI巨头为何走上同一条路?
第一财经资讯· 2026-02-14 23:27
产品发布与定位 - 字节跳动于2月14日正式推出豆包大模型2.0系列,这是自2023年初始测试版上线、2024年正式发布后,近一年半时间内的代际版本更新 [1] - 豆包2.0版本具备全栈模型矩阵、多模态理解、企业级Agent和极致成本四大差异化优势,已跻身全球第一梯队,在多项公开测试集上表现突出,接近Google Gemini3,且具备更高性价比 [1] - 公司官方明确表示,旗舰版豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro [2] 模型能力与技术参数 - 豆包2.0系列提供Pro、Lite、Mini三款不同尺寸的通用Agent模型,其多模态理解能力全面升级,并强化了LLM与Agent能力,使模型在真实长链路任务中能够稳定推进 [3] - 在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,数学和推理能力达到世界顶尖水平 [3] - 在科学领域知识测试中,豆包2.0在SuperGPQA等多项公开测试集上表现突出,成绩与Gemini 3 Pro和GPT 5.2相当,跨学科知识应用排名前列 [3] - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中取得业界最佳表现 [3] - 豆包2.0 Pro在视觉推理、空间感知、运动理解、长视频理解等维度的大多数相关基准测试中取得最高分 [7] - 豆包2.0可以处理复杂视觉输入并完成实时交互和应用生成,无论是从图像中提取结构化信息,还是通过视觉输入生成交互式内容,都能高效稳定地完成任务 [7] Agent与任务执行能力 - 豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶尖水平,在HLE-Text(人类的最后考试)上获得54.2的最高分,大幅领先于其他模型 [4] - 此次豆包2.0全面升级的核心落点在“真实世界复杂任务的执行力”,旨在让模型从“答题者”进化为“执行者” [6] - 公司强化了模型对时间序列与运动感知的理解能力,例如在健身场景中,接入豆包2.0的智能健身App可实时分析用户动作视频并语音纠正姿势偏移,该能力已延伸至穿搭建议、老人看护等领域 [4] 成本与定价策略 - 豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [4] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元 [4] - 在提升能力的同时,豆包2.0进一步降低了推理成本,其模型效果与业界顶尖大模型相当,同时token定价降低了约一个数量级 [6] 行业趋势与战略共识 - 豆包2.0与Google Gemini的相似性从“对标”走向“一致”,这本质上是全球顶尖AI实验室在通往通用人工智能路径上达成的战略共识,即AI最终需要为人类完成任务执行,这需要对真实世界物理运行规律的理解 [2] - 豆包2.0与Gemini在基础模型层面均选择深耕多模态,是在进行一场“世界模型”的军备竞赛,目标是让AI成为能看懂、听懂、理解物理世界复杂性的“数字人类” [8]
字节越来越像 Google:字节跳动距离 Google 这样的头部公司,大概只差六个月
新浪财经· 2026-02-14 19:08
行业格局与公司定位 - DeepMind CEO Demis Hassabis 曾判断字节跳动在AI模型领域距离Google这样的头部公司只差六个月 [2][60] - 随着Seedance 2.0等产品的发布,市场认为字节跳动与Google的模型差距可能已缩小至一两个月,公司正站在世界第一梯队 [4][62][66] - 字节跳动的模型战略与Google相似,其优势在于模型与应用(如抖音、即梦、豆包)深度协同,形成从场景反馈到模型迭代的闭环系统 [47][48][49][101][102][103] Seedance 2.0(视频生成模型) - 模型在指令遵循能力上表现突出,能够理解并完美执行复杂、冗长的提示词,基本解决了幻觉问题 [12][13][72] - 生成视频的质量(包括运镜、画面、声音、物理逻辑细节)远超预期,让AI视频生成能力“越过了临界点”,达到完全可用的水平 [11][13][16][70][73] - 其表现引发了行业领袖(如导演贾樟柯、游戏制作人冯骥)的强烈关注和积极评价,认为“AI的童年时代结束了” [7][15][65][73] Seedream 5.0 Lite(图像生成模型) - 模型能力主要提升在主体一致性和指令遵循两方面,解决了旧版本生成多张图片时人物神态、细节不一致的“出戏感” [21][78] - 指令遵循能力强大,能够精准完成复杂的图片编辑指令(如修改物体颜色、修复破损部分),满足了用户“改图”这一核心场景需求 [23][25][80][82] 豆包大模型 2.0 - 模型在复杂的深度推理和Agent任务上相比1.8版本有“一个数量级”的明显进步 [26][83] - 具备原生多模态能力,模型本身能一体化理解文本、图片、视频,其视觉理解能力在通用模型中表现优异,优于包括Opus 4.6在内的竞品 [30][31][33][34][86][87][88] - 具备原生Agent能力,能自主规划并执行长链路复杂任务(如研究、写作、编程),在相关评测中取得高分 [35][36][40][41][89][93][94] - 推理成本大幅下降,模型效果与业界顶尖模型基本打平,但Token定价降低了大约一个数量级,使Agent等耗Token大户场景的商业化落地成为可能 [45][46][98][99] 商业模式与战略协同 - 公司构建了“模型能力、应用反馈、云服务变现、反哺算力”的自循环系统 [56][57][110][111] - 火山引擎作为云服务出口,其逻辑与拥有自研模型的Google Cloud相似,公司模型能力越强,火山引擎的云服务就越有竞争力 [54][55][108][109] - 内部海量应用(抖音、即梦、豆包)是模型的“压力测试场”,为模型迭代提供直接的场景反馈和方向指引 [48][49][102][103]
豆包,重大升级!
中国证券报· 2026-02-14 17:49
公司产品发布与战略 - 字节跳动于2月14日发布豆包大模型2.0,这是其AI“全家桶”的全面出击,也是AI面向现实世界复杂任务的新起点 [1] - 豆包大模型2.0是自2024年5月正式发布以来的首次大版本跨代升级,在多模态理解、企业级Agent能力以及推理代码能力三个维度实现质的飞跃 [2] - 公司通过春节“红包”营销活动持续扩大豆包影响力,活动在2月13日和2月16日分阶段启动,用户可参与红包抽奖 [3] 产品系列与技术规格 - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和专为编程场景打造的Code模型,可灵活适配各类业务场景 [1] - 豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT-5.2与Gemini 3 Pro [1] - 豆包2.0 Lite兼顾性能与成本,综合能力超越上一代主力模型豆包1.8;豆包2.0 Mini面向低时延、高并发与成本敏感场景 [1] 核心能力升级 - 在多模态理解方面,豆包2.0全面升级,在各类视觉理解任务上达到世界顶尖水平,视觉推理、感知能力、空间推理与长上下文理解能力表现突出 [2] - 在长程任务执行能力方面,豆包2.0在推理、多轮指令遵循、搜索、工具调用、输出格式稳定性等方面大幅增强,并系统性加强了长尾领域知识 [2] - 豆包2.0重点强化了指令遵循能力,可在长链路、多步骤任务中严格按约束条件执行,擅长连续完成“找资料、做归纳、写结论”等工作流 [3] 性能表现与基准测试 - 豆包2.0 Pro在大多数相关多模态基准测试中取得最高分 [2] - 豆包2.0 Pro在科学领域评测集SuperGPQA上分数超过GPT-5.2,并在HealthBench上拿到第一名,其整体成绩与Gemini 3 Pro和GPT-5.2相当 [2] - 在推理和Agent能力评测中,豆包2.0 Pro在HLE-text上取得54.2的高分,领跑全球;在国际数学奥赛(IMO)测评集上超越Gemini 3 pro [2] 成本优势与市场采用 - 豆包2.0在提升能力的同时进一步降低了推理成本,其模型效果与业界顶尖大模型相当,但Token定价降低了约一个数量级 [3] - 通过火山引擎对外提供服务的豆包大模型,截至2025年底,日均Tokens使用量达63万亿,上百万家企业通过火山引擎使用其服务 [3]
AI大战持续升级!Seedance 2.0之后,字节跳动又发布豆包大模型2.0
广州日报· 2026-02-14 17:06
豆包大模型2.0发布与核心能力 - 字节跳动于2月14日宣布推出豆包大模型2.0系列,针对大规模生产环境进行系统性优化,旨在更好地完成真实世界的复杂任务 [1] - 豆包2.0 Pro旗舰版在语言模型基础能力上表现突出,在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,并超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平 [1] - 模型加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上排名前列 [1] 1. 豆包2.0 Pro在HLE-Text评测中获得54.2的最高分,大幅领先于其他模型 [3] - 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择「专家」模式即可体验,火山引擎也已上线该系列模型的API服务 [3] 多模态与Agent能力升级 - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现 [3] - 模型增强了对时间序列与运动感知的理解能力,可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景 [3] - 在Agent能力方面,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平 [3] 定价策略与成本优势 - 豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [4] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元 [4] 行业竞争格局与战略意义 - 2026年春节成为AI大厂的核心竞技场,字节、阿里、腾讯、百度豪掷超45亿展开角逐,竞争已从技术参数比拼转向真实场景落地的较量 [5] - 各大厂依托自身生态发力,字节跳动凭借豆包大模型2.0的顶尖推理能力、多模态理解能力和成本优势,持续强化其AI在用户生活场景中的应用能力 [5] - 春节大战的核心是抢占用户心智和AI生态入口,关键在于将硬核技术转化为用户可感知的实用价值,从而在AI全民普及浪潮中占据先机 [5]
整整21个月,豆包大模型正式进入2.0时代!
量子位· 2026-02-14 16:13
豆包大模型2.0发布 - 公司发布了豆包大模型2.0,这是时隔21个月以来的最大版本更新 [1][2][8] 模型能力提升 - 模型在多模态理解、企业级Agent、推理和代码能力上均有显著提升 [9] - 在MathVista、MathVision、MathKangaroo、MathCanvas等数学推理基准上达到业界最优水平 [9] - 在LogicVista、VisuLogic等视觉解谜与逻辑推理基准上,Seed2.0 Pro得分较Seed1.8显著提升 [9] - 在VLMsAreBiased、VLMsAreBlind、BabyVision等基准中,取得了业界最高分 [11] 多模态与企业级能力 - 多模态理解能力出色,涵盖多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面 [10] - 企业级Agent能力增强,能更好支持对技能的理解和应用,Function Call、多轮指令遵循、搜索和工具调用能力显著增强,格式输出更稳定,支持灵活的上下文管理,更好地支持企业级复杂、长程任务 [10] 数学与代码推理 - 模型具备更强推理能力,支持思考长度可调节,且各思考长度下,Tokens效率都有大幅提升 [10] - 在ICPC、IMO、CMO测试中均获得金牌成绩 [10] - 实测显示,模型能很好地理解并生成复杂的代码,例如基于群论的魔方解决算法前端页面、3D版大富翁游戏,甚至《我的世界》游戏 [13][16][17][20] - 能处理复杂的数学公式图解问题和数学问题 [22][23][25] 性能与成本优势 - 虽然能力变强,但推理速度没有明显延迟 [35] - Seed-2.0系列通过架构优化,在同等性能下大幅提升了Tokens效率,意味着企业应用成本可能更低 [35][36] 行业与战略意义 - 此次发布可能意味着公司在数据质量、训练效率及应用效果上突破了一个新的临界点 [33] - 模型展现出的工具调用和长程任务规划能力,显示其战略方向是面向ToB市场和生产力工具 [34] - 模型不再局限于聊天,而是致力于帮助用户完成项目、解决难题、生成商用级内容 [30]
Agent、图像、视频全是大版本升级:春晚还没开,豆包AI就火了
机器之心· 2026-02-14 15:32
行业背景与竞争格局 - 2026年被行业人士视为人类历史上最忙碌、最具决定性的一年,AI领域发布活动密集[1] - 2026年初,Anthropic推出Agent工具Claude Cowork及11个插件,随后与OpenAI几乎同时发布新基础模型Claude Opus 4.6与GPT-5.3-Codex[2] - 海外巨头密集发布导致市场剧烈波动,甲骨文、Adobe、Salesforce、汤森路透、NEC等知名公司股票遭抛售,近万亿美元市值蒸发[2] - 国内AI竞争激烈,腾讯、阿里、字节等公司投入大量真金白银进行春节营销,字节豆包将深度参与2026年春晚互动并送出高额现金红包及超10万份科技礼包[2] - 字节跳动最新上线的视频创作模型Seedance 2.0在未发红包、仍处内测阶段时已火遍全网,成为现象级产品[2] 字节跳动AI产品全面升级 - 2026年2月14日,火山引擎宣布豆包系列模型全面升级,标志着公司在AI领域开始全面出击[3] - 升级涵盖基座模型、图像到视频生成,均为大版本更新,包括豆包大模型2.0、图像创作模型Seedream 5.0 Lite以及视频创作模型Seedance 2.0[3] - 豆包大模型2.0是自2024年5月正式发布以来的首次大版本跨代升级,定位为多模态Agent模型[5] - 豆包大模型2.0在多模态理解、企业级Agent能力以及推理代码能力三个维度实现质的飞跃[6] - 模型针对大规模在线部署环境下的用户体验进行优化,着重加强视觉和多模态查询、推理延迟与复杂指令可靠性[8] - 模型提供多种体量型号以应对不同部署场景,包括Pro、Lite、Mini三款通用Agent模型和Code模型[12] - 模型API已在火山引擎上线[15] 豆包大模型2.0技术能力详述 - **数学与视觉推理能力**:豆包2.0 Pro在MathVista、MathVision、MathKangaroo、MathCanvas等数学推理基准上达到业界最优水平,在科学领域的整体成绩与Gemini 3 Pro和GPT 5.2相当[8] - **视觉感知能力**:在VLMsAreBiased、VLMsAreBlind、BabyVision等视觉感知能力基准中,豆包2.0取得了业界最高分[9] - **推理与Agent能力**:豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam Bench上的表现[10] - **复杂指令与搜索能力**:在HLE-text评测中,豆包2.0 Pro取得最高分54.2分[13] - **指令遵循能力**:豆包2.0重点强化了指令遵循能力,可保持较强的一致性与可控性,为执行长链路、多步骤任务奠定基础[14] - **多模态理解能力**:豆包2.0具备精准的文字提取、深度图表理解、出色的空间感知、运动捕捉和长视频解析能力[18] - **实际应用示例**:模型能识别潦草字迹并结合业务场景进行语义推理,能准确处理表格数据并完成计算、排序等任务[19][22][23][28][29] - **图像识别能力**:能准确识别图片内容,如数出卡通小狗数量并介绍品种,同时标注空间方位和外观特征[32] 豆包大模型2.0的推理与代码能力 - 推理能力大幅跃升,支持思考长度灵活调节,且各思考长度下Token效率全面提升[35] - 在代码生成特别是前端开发领域表现亮眼,能根据提示词生成功能完整的Python可视化代码、HTML Canvas交互效果及可玩的小游戏[35][37][39][40][42] - 在企业级应用场景中,模型能更好支持对Skills的理解和应用,Function Call、多轮指令遵循、搜索和工具调用能力显著增强,格式输出更稳定,并能灵活管理上下文[43] 视频创作模型Seedance 2.0 - Seedance 2.0火爆程度无需多言,在推特、B站等平台引发大量用户创作[44] - 行业普遍认为其在视频创作领域达到了改变业界走向的水平,对复杂场景、多人互动和真实运动逻辑的把控能力让人难辨真假[45] - 获得国内外好评,有网友用它模拟1670年的新阿姆斯特丹获得惊艳效果,连马斯克都评论“It's happening fast”[46] - 知名导演贾樟柯公开表示将用该技术创作短片,成为首位宣布使用该模型的知名导演[48] - 《黑神话:悟空》制作人冯骥评论“AIGC童年时代结束”[50] - 模型支持将任意小说文本生成视频,预计将催生大量AI短剧[51] - **实际应用示例**:仅凭世界上最短科幻小说《最后一个人》的十七个单词提示词,Seedance 2.0就生成了一段10秒高质量短片,具备电影级镜头语言和叙事[53][54] - **图生视频能力**:支持基于参考图生成视频,在角色一致性、动作连贯性和氛围渲染方面表现出色[55] - **技术特性**:支持混合模态输入,允许用户同时输入多达9张图片、3段视频、3段音频以及自然语言指令[56] - 生成视频最长15秒,带双声道音频[56] - 采用统一的多模态音视频联合生成架构,集成业界最全面的多模态内容参考和编辑能力[56] - 相比1.5版本,生成质量大幅提升,在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性均显著增强[56] - 在评测表现上处于业内领先水平,可精准呈现高张力大动作与精细微表情,支持专业级组合运镜与叙事节奏控制[57] - 音频维度上,针对中文方言、戏曲及演唱场景的指令响应准确度明显提升[57] - 该模型的出现标志着视频生成AI已经走到了生产力的门槛上[60] 图像创作模型Seedream 5.0 Lite - 在AI生成图像这个竞争最激烈的赛道,字节跳动已位列领先梯队[61] - Seedream 5.0 Lite是通向统一多模态模型的全新探索,相比4.5版本,在理解、推理和生成能力上实现全面跃升[62] - 模型采用多模态理解生成统一架构,能像人类设计师一样洞察用户意图,在主体一致性和图文对齐等方面表现显著提升[62] - 内置的世界知识体系覆盖科技与人文多个垂类领域,生成结果更符合物理规律,信息可视化能力大幅增强[63] - 首次引入实时检索增强能力,可通过联网获取最新知识和资讯,精准响应时效性创作需求[64] 字节跳动的全方位AI技术布局 - 在语音领域,发布豆包实时语音大模型,实现端到端语音对话,具备低时延、可随时打断等特性,在语音表现力、控制力、情绪承接方面表现惊艳[70] - 在具身智能领域,Seed-Robotics团队推出Seed GR-RL强化学习框架,让机器人在真实场景中稳定完成多步骤、高精度的操作任务[72] - 在AI for Science领域,已耐心投入5年,Seed-AI for Science团队围绕生物领域基础模型、量子化学、分子动力学等方向,发布了SeedFold、SeedProteo等有影响力的学术成果[72] - 这种全方位的技术储备,是公司敢于与OpenAI、谷歌、Anthropic等海外巨头正面交锋的底气[73] 行业影响与展望 - 随着豆包系列新模型的发布,2026年春节档已从“流量高峰”演变成纯粹的“技术战场”[68] - 全模态的豆包系列技术让AI能力又上了一个台阶[69] - 2026年的春节,或许会成为AI应用爆发的分水岭[74] - 行业正在见证首个真・国民级AI入口的诞生[75]
Seedance 2.0后字节又发布豆包大模型2.0,推理能力更强
新京报· 2026-02-14 15:29
行业动态 - 春节前夕国产大模型进入密集发布期 2月11日至14日期间 千问、Seedance、混元、星火、百灵、智谱GLM、MiniMax等模型放出新版本 [1] - 2月14日大模型发布潮达到高峰 字节跳动连续发布Seedance 2.0视频模型和Seedream 5.0 Lite图像模型后 官宣推出豆包大模型2.0系列 [1] 公司产品发布 - 豆包大模型2.0是字节跳动最新推出的多模态Agent模型 也是该模型自2024年5月正式发布以来首次大版本跨代升级 [1] - 模型针对大规模生产环境使用需求进行系统性优化 旨在更好地完成真实世界的复杂任务 并着重优化了推理、代码以及企业级Agent能力 [1] 产品性能与定价 - 在推理方面 模型支持思考长度可调节 且各思考长度下Tokens效率都有大幅提升 代码能力特别是前端开发领域有显著提升 [2] - 在Agent方面 模型能更好地支持对技能的理解和应用 多轮指令遵循、搜索和工具调用能力显著增强 格式输出更稳定 支持灵活的上下文管理 更好地支持企业级复杂、长程任务 在数据分析和客服Agent等企业场景中表现出色 [2] - 豆包2.0 Pro按“输入长度”区间定价 32k以内的输入定价为3.2元/百万tokens 输出定价为16元/百万tokens 低于Gemini 3 Pro和GPT 5.2 [2] - 豆包2.0 Lite的综合性能超越两个月前发布的上一代主力模型豆包1.8 百万tokens输入价格为0.6元 [2] 多模态技术进展 - 字节官方公布了豆包图像创作模型 Seedream 5.0 Lite和豆包视频生成模型Seedance 2.0的基准成绩榜单 [2] - Seedance 2.0的“六维能力图”指标大幅超越了Sora2 Pro、Veo3.1等模型 [2] - 有观点认为 三大模型的跨代升级 实现多模态 Agent、AI 图像 / 视频创作全维度技术突破 彰显了字节在多模态 AI 领域的技术领跑与全链路布局优势 [3] 产品上线与可用性 - 目前 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线 用户选择“专家”模式即可对话体验 [3] - 火山引擎也已上线豆包2.0系列模型API服务 [3]
小红书:对未主动标识的AI生成合成内容限制分发;智能图像创作模型Seedream 5.0 Lite发布丨AIGC日报
创业邦· 2026-02-14 08:16
AI模型与工具的重大升级 - 美图旗下口播视频制作工具“开拍”将首批接入Seedance 2.0,预计2月底上线,接入后生成能力将直接嵌入产品工作流,用户无需单独使用大模型或跳转 [2] - 字节跳动Seed团队发布Seedream 5.0 Lite智能图像创作模型,相比4.0版本在理解、推理和生成方面全面提升,并引入实时检索增强能力以获取最新知识 [2] - 蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平 [2] - 蚂蚁集团的Ring-2.5-1T模型在32K以上长文本生成场景中,访存规模降低10倍以上,生成吞吐提升3倍以上,并在国际数学奥林匹克竞赛自测中达到金牌水平(IMO 35分) [2] - 蚂蚁集团的Ring-2.5-1T模型可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用 [2] 内容平台对AI生成内容的监管加强 - 小红书表示将依据《人工智能生成合成内容标识办法》加强AI生成内容的识别检测,对未主动标识的内容将添加标识并限制分发 [2] - 小红书平台将对借由AI生产虚假仿冒信息、魔改经典、宣扬不良价值观的内容,以及发布教唆祛除AI标识的教程予以严厉打击 [2]
AI进化速递丨智元机器人远征A3计划2026年量产
第一财经· 2026-02-13 20:54
上海市人工智能产业政策与规划 - 上海市以人工智能技术创新为突破口,旨在赋能住房和城乡建设行业实现高质量发展 [1] 人工智能公司产品与技术进展 - 智元机器人公司计划在2026年实现其“远征A3”机器人的量产 [1] - 蚂蚁集团开源了采用混合线性架构的“Ring-2.5-1T”思考模型,该模型参数量达到万亿级别 [1] - 字节跳动公司上线了图像创作模型“Seedream 5.0 Lite”,该版本首次增加了联网检索功能 [1] - 地平线公司正式开源了其“HoloBrain VLA”基座模型 [1]
大模型国产化与智能化双轮驱动,工业软件行业有望迎来高速发展期,工业软件ETF广发(159145)盘中涨近3%
新浪财经· 2026-02-12 15:27
AI技术产品进展 - 2026年2月12日盘中,互联网服务、软件开发等板块表现强势,市场分析认为春节前后是国内大厂密集发布AI应用的关键窗口 [1] - 字节跳动旗下即梦AI发布新一代视频生成模型Seedance 2.0,实现多镜头叙事与导演级控制、精准音画同步与口型匹配,并增强角色与场景一致性,使AI视频具备长篇叙事能力,正朝影视工业级别迈进 [1] - 即梦AI于2月12日正式接入最新视频生成模型Seedance 2.0与图片生成模型Seedream 5.0 Lite [1] - MiniMax于2月12日正式上线最新旗舰编程模型MiniMax M2.5,该模型是全球首个为智能体(Agent)场景原生设计的生产级模型,其编程与智能体性能比肩国际顶尖模型,直接对标Claude Opus 4.6 [1] - MiniMax M2.5模型支持PC、App、跨端应用的全栈编程开发,在Excel高阶处理、深度调研、PPT等Office核心生产力场景中均处于行业领先(SOTA)地位 [1] 政策与行业动态 - 广东省政策提出壮大数字技术应用服务新业态,加快人工智能技术应用服务,培育一批深入行业应用的人工智能应用服务商,支持培育垂直领域“人工智能+工业软件”与智能机器人服务商 [2] - 广东省政策支持开源鸿蒙社区建设,培育优质开源项目,拓展开源鸿蒙应用,并培育为数字化转型提供合规、安全、技术评测等服务的第三方专业服务机构 [2] - 工业和信息化部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》,提出加快培育流程自动化助手、智慧巡检数字人、具身智能装备等自决策、自执行、自演进的工业场景智能体 [2] - 上述方案提到实施工业互联网与人工智能融合赋能行动,推动人工智能技术在工业全链条渗透 [2] - 国泰君安指出,大模型产业正从“技术探索”迈入“商业化验证”新阶段,行业竞争焦点已从参数规模转向真实场景的任务执行效率和商业闭环能力 [2] - 模型能力提升与推理成本下降正推动AI应用从“工具可用”加速迈向“价值可兑付”,2026年有望成为智能体(Agent)在金融、工业等高价值领域规模化落地的关键拐点 [2] - 国海证券认为,随着政策持续推进,国内头部企业将加快布局工业大模型/工业智能体,有望快速推动人工智能赋能工业软件创新升级,促进新型工业化发展 [3] - 国产化与智能化双轮驱动叠加政策加码,我国工业软件行业有望迎来高速发展期 [3] 市场表现与相关标的 - 截至2026年2月12日14:10,国证工业软件主题指数(980034)强势上涨2.99% [3] - 工业软件ETF广发(159145)上涨2.83% [3] - 指数成分股宏景科技、罗博特科涨超10%,中恒电气、四方股份10cm涨停 [3] - 指数前十大权重股合计占比56.17%,权重股广立微上涨10.10%,中颖电子上涨8.62%,东土科技、华大九天等跟涨 [3] - 工业软件ETF广发(159145)紧密跟踪国证工业软件主题指数,该指数聚焦工业软件及相关数字化底座领域,其底层逻辑与制造业智能化、AI算力基础设施升级及高端制造国产化替代深度关联 [3] - 根据Wind数据,按申万二级行业分类,该指数前三大权重行业分别为软件开发(39.61%)、自动化设备(18.20%)、IT服务(15.29%)[3]