Workflow
火山引擎方舟平台
icon
搜索文档
0224早知道
2026-02-25 12:08
电话会议纪要研读分析 一、 行业与公司 * **核心行业**:人形机器人、AI应用(多模态生成)、半导体/芯片、算力 [3][4][5][11][13][16] * **涉及公司**: * **机器人产业链**:万向钱潮、五洲新春、绿的谐波、协创数据、百达精工、田中精机、博杰股份、风语筑 [3][4][13][18][20] * **AI应用产业链**:字节跳动(Seedance 2.0)、完美世界、凡拓数创、风语筑 [4][5][20] * **半导体/芯片**:欧莱新材、盛科通信、微导纳米、耐科装备、圣晖集成、鸿日达、芯原股份、华峰测控、江丰电子、新洁能、燕东微、四维图新 [13][16][18] * **其他**:高德红外、宗申动力、大族激光等 [18] 二、 核心观点与论据 1. 人形机器人行业进入规模化量产新阶段 * **事件催化**:2026年春晚成为机器人“超级带货平台”,松延动力、宇树科技、魔法原子和银河通用等公司机器人表演引爆社交网络,带动电商平台机器人搜索咨询量倍数增长 [3] * **市场前景**:机构预计到2029年,中国人形机器人市场规模将达**750亿元**,份额超过**30%**,成为全球第一 [3] * **产业阶段**:2021-2025年产业链完成从0到1的发展;2026年特斯拉及国内头部企业将同时开启大规模量产,进入从1到10的新篇章 [3] * **关键节点**:2026年是人形机器人“量产元年”,特斯拉Optimus、宇树、优必选等企业开始小批量交付 [11] * **产业链机会**:机器人核心能力进步是走向工厂的关键,核心部件如行星滚柱丝杠、灵巧手微型丝杠、线性执行器、精密轴承等是研发重点 [3][4] 2. AI应用(多模态)有望重塑下游产业格局 * **技术进展**:字节跳动Seedance 2.0为春晚节目深度定制,通过全方位多模态参考与精细化镜头控制解决视频生成一致性痛点,与豆包、Seedream构成全模态矩阵 [4][5] * **产业影响**:原生多模态与世界模型技术演进,有望大幅降低内容制作成本并加速商业化落地,重塑营销、影视、游戏等下游产业格局 [5] * **企业应用**: * 完美世界已将AI工具全面融入研发管线,涵盖AI绘画、AI剧情、AI配音等,并开发了D+、剧情生成等AI开发工具 [5] * 凡拓数创利用AI、大数据技术为多个产业领域提供数字孪生解决方案,并接入智谱等多款国产大模型 [5] 3. 半导体/芯片行业景气度持续,迎来全面涨价潮 * **市场表现**:在2月13日成交额大于10亿的个股中,芯片概念股数量最多,达**163**只;在创一年新高个股中,芯片概念也以**33**家居首 [9][15][16] * **行业趋势**:半导体行业持续景气,涨价已从存储蔓延至产业链各环节,迎来全面涨价潮 [16] * **投资方向**:建议关注晶圆代工、封测、功率器件、服务器CPU、存储器等领域机会 [16] 4. 节前市场高速轮动,关注节后量能变化 * **市场概况**:节前最后一个交易日(2月13日)市场缩量**1591亿元**,两市成交额大于10亿个股减少**28**家至**447**家,资金在春节可能发酵的方向进行博弈 [11] * **热点轮动**:早盘最强方向为AI安全(Seedance 2.0细分),随后算力、军工、机器人、芯片等均有异动,但日内整体情绪低迷 [11] * **节后展望**:假日期间外围市场上涨,AI应用、机器人等有较大消息刺激,节后重点观察市场量能是否能有效放大 [11] 三、 其他重要信息 1. 具体公司业务动态 * **万向钱潮**:在机器人业务上布局滚柱丝杠、行星滚柱丝杠产品,并针对机器人关节核心精密轴承组建专班队伍攻关 [4] * **五洲新春**:将具身智能机器人行星滚柱丝杆列为重点研发产品,已开发出灵巧手微型丝杠等新产品 [4] * **风语筑**:与字节跳动即梦AI、Rokid、强脑科技、松延机器人等达成战略合作,强化AI+3D战略布局,探索智能终端在文旅场景的应用 [20] * **四维图新**:依托智驾解决方案、车规级芯片等能力,为出海车企提供数据合规、芯片设计等支撑,车规级MCU芯片业务快速拓展 [18] * **高德红外**:签订**18.51亿元**某型号完整装备系统总体产品订货合同,占2024年度经审计营业收入的**69%** [18] * **博杰股份**:在机器人零部件领域有技术储备,参股子公司产品包括多关节协作机器人、关节模组等 [18] 2. 市场热点与资金动向 * **节前热点题材**:算力、AI应用、半导体、机器人、商业航天等是近期热点 [7] * **历史新高个股**:集中在芯片、算力、机器人、有色、液冷、CPO、商业航天等多个板块 [13] * **资金布局案例**:风语筑在上一交易日获多家营业部及北上资金大额买入,如国泰君安南京太平南路买入**4222.76万** [20]
不上台表演的豆包,或许是春晚最忙的那个
经济观察网· 2026-02-17 17:08
豆包AI模型在春晚的技术应用与突破 - 豆包AI互动总数在除夕当天高达19亿次 [3] - 豆包面向全国观众送出10万份科技好礼,并帮助用户生成了超过5000万张新春主题头像和超过1亿条新春祝福 [16] 视频生成技术的创新与优化 - 豆包Seedance 2.0团队通过输入大量中国传统文化语料,使模型理解水墨笔触,解决了海外模型无法处理中国水墨画留白与晕染逻辑的问题 [3] - Seedance 2.0生成的《驭风歌》背景视频中,马匹奔跑时保留了墨色晕染的动态变化,且四肢关节运动符合生物学结构,避免了滑步、肢体扭曲等违反物理规律的现象 [3][5] - 在节目《快乐小马》中,Seedance 2.0通过对骨架结构的智能匹配,让四足卡通形象直接模仿了双足真人的舞蹈动作,大幅减少了传统动画制作所需的时间 [7] - Seedance 2.0在节目《贺花神》中很好地执行了展现植物缓慢绽放及复杂光影变化的复杂视觉指令,画面没有出现噪点和抖动 [8] 图像生成与数字分身技术 - 豆包图像创作模型Seedream 5.0 Lite承担了关键帧设计工作,根据导演草图生成了兼具原画神韵与新构图的静态图像,为视频生成提供蓝本 [5] - 在节目《梦底》中,技术团队利用字节Seed3D模型生成数字分身的几何外壳,并借助字节DA3模型提供的深度信息,实现了虚拟灯光与现场物理灯光的毫秒级同步,使数字分身拥有真实的立体结构和符合透视规律的光影 [11][12] 算力基础设施与实时处理能力 - 直播期间,算力服务器集群需在毫秒级内完成数千万亿次浮点运算,以确保用户手机上的图片在数秒内生成 [3] - 面对AI互动(如生成头像、祝福语)这类计算密集型任务,火山引擎方舟平台采用集群联邦技术,打通物理隔离的数十个机房,通过实时监控和亲和性装箱算法,将任务分配给最合适的芯片,并能实现秒级跨机房资源平移 [16] - 为将Seedance 2.0的原生720P/24帧输出提升至春晚8K/50帧的播出标准,技术团队利用火山引擎MIPP多维度智能画质增强框架,通过超分算法和插帧服务提升画质 [16] 具身智能与机器人交互 - 马年春晚的机器人接入了豆包语音合成模型2.0,该模型具备深度语义理解能力,能根据文本内容自动调整语气和停顿,使交互体验接近真实人际沟通 [17][19] - 结合豆包模型的视觉理解能力,机器人能够实时识别前方人员的衣着颜色并进行避障决策,实现了眼、脑、口的协同 [19]
首届AI春晚刷屏!从水墨奔马到具身智能详解背后黑科技
新浪财经· 2026-02-17 16:24
2026年央视春晚AI技术应用核心观点 - 2026年央视春晚是首届AI春晚,AI技术从幕后走向台前,实现了人文情怀与前沿科技的深度融合,展示了中国AI大模型技术规模化商用的实力 [1][16] - 豆包系列AI模型(包括视频生成模型Seedance2.0、大语言模型、语音合成模型等)是本届春晚多项创意节目和互动环节的核心技术支撑 [2][7][22] - 火山引擎方舟平台为春晚期间海量的AI实时互动请求提供了底层算力保障,成功应对了峰值每分钟633亿Tokens的流量洪峰,完成了一次“国家级大考” [12][13][27] AI视频生成技术(Seedance2.0)的应用与突破 - 豆包视频生成模型Seedance2.0参与了多个高难度创意节目制作,例如《驭风歌》中生成徐悲鸿水墨奔马动态影像,《贺花神》中为每位花神生成定制化特写镜头 [2][5][21] - Seedance2.0展现出强大的多模态理解与泛化能力,能够参考草图、风格和真实视频,在训练语料不足的情况下,精准生成符合水墨风格且运动流畅的骏马,并遵循“轻轻地”等细节指令 [3][18] - 该模型显著提升了视频内容制作效率,在《快乐小马》节目中,可将真人舞蹈动作自动迁移至卡通形象,替代传统繁琐的3D骨骼绑定和手动K帧流程,将节目制作周期从数月缩短至50天以内 [4][17][19] - 为满足春晚8K/50FPS的超高清播出标准,Seedance2.0结合火山引擎的画质增强服务,通过超分和插帧技术将生成的1080P/24FPS视频提升至播出规格 [6][21] 具身智能机器人的演进与技术支持 - 2026年春晚机器人阵容实现全面国产化,银河通用、宇树科技、魔法原子、松延动力四家本土企业携最新产品登台表演 [7][22] - 机器人能力实现从预设程序到“具身智能”的进化,具备视觉感知、语义理解、智能对话和情感化语音交互能力,能与人类演员自然互动,例如完成武术表演和喜剧小品 [7][22][23] - 豆包大模型系列为机器人提供了核心技术:视觉理解模型(VLM)赋予环境感知与交互能力,大语言模型(LLM)提供语义理解与对话能力,语音合成模型2.0则实现带情感和语气的自然语音输出 [8][9][22] 大规模AI实时互动的算力挑战与保障 - 本届春晚首次实现由大语言模型驱动的全民AI实时创作互动,除夕当天豆包AI互动总数达19亿次,并创造了每分钟633亿Tokens的峰值吞吐量 [1][11][16] - AI互动(如生成祝福语、图片)的算力需求远超传统互动(如抢红包),单个请求的算力消耗相差超过100万倍(约10 TOPS vs. 十万分之一TOPS以内) [11][25] - 火山引擎方舟平台通过极致的资源调度和推理优化,成功保障了海量并发下的稳定体验,实现了分钟级调度几十万核CPU和上万卡GPU,让异构计算资源像“同一个大脑”一样协同工作 [12][13][26][27] - “豆包过年”活动在除夕当天生成了超过5000万张新春主题头像和超过1亿条新春祝福,验证了其大规模AI服务的能力 [11][25]
春晚张杰《驭风歌》背后的马,是Seedance 2.0做的!
量子位· 2026-02-17 11:58
豆包大模型及火山引擎技术在春晚的应用与展示 - 豆包大模型家族的多项技术(包括豆包Seedance 2.0、Seedream、豆包语音识别模型、豆包TTS 2.0、字节Seed 3D模型、DA3模型等)在2025年央视春晚的多个节目中成功落地应用,从舞台视觉特效、机器人表演到直播互动与无障碍字幕,实现了全面覆盖 [6][38][43] - 火山引擎的视频云团队与方舟平台为春晚提供了关键的画质增强、高并发支持与空间视频技术,确保了8K高清、50FPS高帧率等超高规格节目的稳定呈现与流畅互动 [15][29][31] 视频生成与动态控制技术(Seedance 2.0) - **核心能力突破**:豆包Seedance 2.0视频生成模型实现了从“能生成”到“能控制”的进化,具备精细的微观控制能力、超强的指令遵循能力和多模态素材参考能力 [8][10][11] - **国风美学理解**:该模型成功处理了极具挑战的“中国水墨风”,在张杰《驭风歌》节目中生成了气势磅礴、奔腾的骏马动态水墨画卷,通过了春晚超级严格的审核 [4] - **复杂场景应用**:在《贺花神》节目中,为十几位明星定制了“一人一景”的中式视觉奇观,精准控制了植物缓慢绽放及纹理、层次、光影的细微变化 [7] - **视频动作迁移**:在《快乐小马》节目中,利用该技术将真人舞蹈动作一键迁移至卡通小马形象上,解决了不同拓扑结构间的适配难题,并保持了原图在剧烈运动时的稳定性 [13][14] 画质增强与空间视频技术(火山引擎) - **智能画质增强框架(MIPP)**:针对AIGC内容,火山引擎利用超分算法将720P视频提升至8K,并通过插帧技术将24帧补至50帧,同时结合视频理解技术进行针对性去噪、锐化等处理,抹平微小瑕疵 [16][17] - **空间视频技术(4D高斯泼溅/4DGS)**:在《梦底》节目中,通过70台工业级相机阵列采集演员数据,重建为4D数字资产,实现了与现场灯光实时互动的多个高精度虚拟分身同台表演,创造了虚实难辨的沉浸感 [18][20][21][23] - **性能与细节优化**:技术团队利用字节Seed 3D模型预制“影子几何”提升渲染效率,并引入DA3模型从单图推断高精度深度信息,确保了近景皮肤质感等细节的逼真度 [25] 机器人赋能与具身智能 - **多模态模型赋能**:豆包大模型全家桶为宇树机器人等春晚登台机器人提供了“眼”(视觉理解模型用于环境识别与避障)、“脑”(大语言模型用于理解自然语言指令)、“嘴”(TTS 2.0用于富有情感的语音合成)的能力,使机器人能看懂环境、听懂人话并带感情说话 [24][27][30] - **行业应用广泛**:豆包大模型在具身智能圈已服务宇树、银河通用、智元机器人等40多家公司 [40] 高并发AI互动与平台支撑(火山引擎方舟平台) - **首次AI互动**:今年春晚首次实现由大模型驱动的AI互动(如生成新春头像、定制祝福语),其本质是计算密集型的Agent过程,相比以往事务型互动算力消耗巨大 [28] - **抗洪峰解决方案**:火山引擎方舟平台通过跨机房联邦集群弹性伸缩、推理层硬件极限优化(如算子手写优化、Prefill/Decode分离)以及秒级权重复制加载等技术,成功顶住了亿万流量瞬间涌入的挑战 [29][31] 语音识别与无障碍字幕 - **复杂场景识别**:豆包语音识别模型在春晚直播的复杂噪声环境(含快语速、多梗、方言、掌声、背景音乐)下,展现了多方言鲁棒性、上下文感知(召回率提升15%以上)和低时延流式识别的能力,为抖音直播间提供了AI无障碍直播字幕 [36][37][39] 行业生态与合作伙伴 - **广泛的朋友圈**:豆包大模型通过火山引擎已渗透至多个行业,在车圈服务了超9成主流车企(包括奔驰、特斯拉、比亚迪、蔚小理等),在手机/PC圈与全球Top10手机厂商中的9家(如小米、OPPO、vivo、荣耀、三星)及联想等公司合作 [40] - **技术整合价值**:春晚作为一次大型“买家秀”,证明了豆包大模型及相关技术能够扛住顶级压力、真正落地并创造价值,其对中国文化的深刻理解与强大的工程化能力是关键 [41][42][45]
陆家嘴财经早餐2026年2月17日星期二
Wind万得· 2026-02-17 08:17
人工智能与机器人 - 2026年央视春晚成为机器人技术的重要展示舞台,魔法原子、宇树科技、松延动力、银河通用等公司的人形机器人参与多个节目表演,技能进化程度令人瞩目[3] - OpenAI确认开源智能体OpenClaw创始人Peter Steinberger正式加盟,其战略重心从大模型参数竞赛转向智能体协同与生态构建,目标是打造“连妈妈都能用”的个人智能体[4] - 阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型,实现了从纯文本到原生多模态的代际跃迁,部署显存占用降低60%,最大推理吞吐量可提升至19倍,API价格低至每百万Token 0.8元[4][6] - 字节跳动为2026年春晚提供技术支持,豆包大模型在舞台艺术创作、具身智能(让机器人表达更流畅)、支持豆包APP互动峰值算力需求、以及为抖音直播间提供无障碍字幕服务四个方面发挥作用[10] - 全球范围内对智谱AI的GLM-5模型需求激增,公司宣布启动“算力合伙人”招募计划,寻求与芯片厂商、算力伙伴及推理服务商合作,以优化底层、共建推理网络[6][11] - 黑石集团领衔的投资者计划向印度AI云初创公司Neysa进行最高6亿美元的股权投资,该公司还将寻求额外6亿美元债务融资,计划部署超过2万个GPU用于AI训练[11] - 美国银行报告警示,2026年AI超大规模企业资本支出预计将达7400亿美元,可能导致自由现金流枯竭,巨头削减开支可能成为引发美股从科技股向其他板块“大轮动”的关键信号[16] 半导体与硬件 - 存储芯片涨价潮愈演愈烈,日本存储巨头铠侠预计从2026年第一季度开始,针对北美客户的平均销售价格(ASP)预计环比提升约50%[6][11] - Adobe数字价格指数发现,在电子产品、电脑等类别价格上涨推动下,1月份在线价格创下十二年来最大单月涨幅[13] - 支撑AI运行的数据中心正给美国电网带来压力并推高消费者电费,特朗普贸易顾问纳瓦罗表示,白宫可能强制数据中心建设商自行承担公用事业成本[12] 资本市场与股市表现 - 港股蛇年最后一个交易日(2月16日)半日交易,恒生指数收涨0.52%,恒生科技指数涨0.13%,AI应用概念股大涨,海致科技集团涨近30%,MINIMAX涨近25%,上市以来累计涨幅超413%[3] - 欧洲三大股指2月17日收盘涨跌不一,德国DAX指数跌0.46%,法国CAC40指数涨0.06%,英国富时100指数涨0.26%,市场缺乏宏观数据指引,避险情绪主导[15] - 日本股市2月17日高开低走,日经225指数收盘跌0.24%,日本GDP低于预期、金融股重挫施压大盘,软银集团逆势大涨近7%[15] - 印度SENSEX30指数2月17日收盘涨0.79%,印度央行收紧对证券经纪商提供贷款的规则,禁止向用于自营交易或投资的贷款提供信贷[15] - 印尼股市1月下旬暴跌,总统对金融监管机构表示不满,随后印尼金融服务管理局与证交所负责人辞职,MSCI和富时罗素正加大对印尼市场股权集中度和透明度的审查力度[16] - SpaceX有望进行史上规模最大的IPO,银行家和机构投资者正在讨论预留多少股份供个人投资者以发行价认购[16] - 亚洲航空公司品牌业务部门正接近敲定一家纳斯达克上市公司标的,计划于2026年晚些时候借壳上市,新成立实体估值约15亿美元[17] - 瑞穗金融集团旗下证券部门正因员工涉嫌股票内幕交易接受日本金融监管机构调查[17] 宏观经济与政策 - 日本2025年第四季度GDP初值环比增长0.1%,同比增长0.2%,增速远不及经济学家预期,令日本央行的加息路径面临考验[13] - 欧元区2025年12月工业产出环比下降1.4%,创2025年4月以来最大降幅[13] - 高盛策略师预测,受英国央行降息推动,2026年英国国债将上涨,基准10年期英国国债收益率预计到年底达到4%[18] - 浙江出台指导意见,提出在2026年遴选50家条件成熟的专业市场先行开展转型升级试点[7] - 多地金融监管局迎来“85后”副局长,包括河北、陕西、宁波、青岛等地[7] - 英国首相斯塔默宣布将寻求扩大政府权力,对社交媒体使用实施限制,如设定最低使用年龄,并尝试限制未成年人使用VPN[14] - 新加坡将从2026年起对进出该国的航班征收可持续航空燃料税,每张机票税额从75美分至32美元不等[14] 大宗商品与外汇 - 2026年人民币对美元汇率强势升值,即期汇率和中间价均升值超过1%,境外投资者总体增持人民币相关资产[21] - 纽约汇市尾盘,美元指数涨0.23%报97.08,离岸人民币对美元上涨176.0个基点报6.8835[21] - 香港特区行政长官李家超提出拓展黄金交易中心,目标是3年内建立超过2000吨的黄金仓储,以配合未来黄金交易结算系统建设[19] - 中信建投证券研究所所长黄文涛认为,2026年大宗商品方面仍是黄金的机会,黄金与白银是较长期的投资机遇[19] - 国际贵金属期货普遍收跌,COMEX黄金期货跌0.66%报5013.1美元/盎司,COMEX白银期货跌1.81%报76.555美元/盎司,美元走强施压[19] - 美油主力合约涨1.34%报63.73美元/桶,布油主力合约涨1.24%报68.59美元/桶,交易员密切关注美国与伊朗谈判前的地缘政治风险[19] - 伦敦基本金属多数下跌,LME期锡跌3.12%报45245.0美元/吨,LME期铝跌1.12%报3043.0美元/吨[20] 消费、能源与地产 - 2026年春节档新片预售总票房达5.89亿,《飞驰人生3》成为预售票房冠军[8] - 春节假期首日(2月15日)全国高速公路充电量达1528.05万千瓦时,同比增长116.32%[8] - 香港美联楼价指数蛇年上涨7.33%,创近八个农历年最大涨幅,其中九龙区表现最好,涨约9.36%,信心指数涨约26.4%[8] - 大众汽车集团计划到2028年底将所有品牌的成本削减20%,关闭工厂等激进选项也在考虑范围内[11] 地缘政治与安全 - 美国与伊朗将于2月17日在瑞士日内瓦举行新一轮间接谈判[12] - 伊朗革命卫队海军在霍尔木兹海峡举行名为“智能管控霍尔木兹海峡”的军事演习[12]
字节提供四项春晚技术支持 Seedance2.0为《贺花神》等多节目深度定制
新浪财经· 2026-02-17 02:20
字节跳动春晚技术支持 - 公司为2024年央视春晚提供了四个方面的技术支持 [1] - 技术支持一:豆包大模型助力春晚舞台艺术创作,例如为《贺花神》等多个节目进行深度定制 [1] - 技术支持二:在具身智能方面,豆包大模型使机器人表达更流畅和聪明 [1] - 技术支持三:火山引擎方舟平台作为技术底座,支持春晚期间用户在豆包APP的互动,核心挑战是应对峰值算力需求 [1] - 技术支持四:火山引擎通过语音识别模型,在抖音春晚直播间提供全程无障碍字幕服务 [1] - 火山引擎智能视频云画质增强服务保障了春晚4K、50fps的高规格视频上屏要求 [1]
行业观察 | Token市场占据半壁江山,火山引擎在打什么牌?
搜狐财经· 2025-09-22 23:16
中国AI云市场竞争格局 - 2025年中国AI云市场竞争激烈 阿里云 火山引擎 百度智能云均公开宣称自身优势[2] - 火山引擎2024年营收超110亿元 增速超60% 2025年营收目标超200亿元[2] - 火山引擎在IDC五份报告中的四份跻身前列 两份报告位居首位[2] 火山引擎市场地位 - 2025上半年火山引擎在大模型公有云服务市场份额达49.2% 接近半壁江山[3] - 2024年全年火山引擎在大模型公有云服务市场份额为46.4%[3] - 2024年AI基础设施市场份额9%居国内第三 生成式AI基础设施市场份额14.2%居国内第二[3] Token调用量核心指标 - 火山引擎更关注Tokens调用量而非GPU算力规模 认为这更能反映大模型产业落地真实水温[6] - 2024年中国云厂商Token调用收入总和不超过10亿元 但正以10倍以上速度成长[7] - IDC数据显示2024年6-12月中国大模型调用量增长近10倍[7] Token市场增长数据 - 2025上半年中国大模型公有云Tokens调用总量达537万亿次[7] - 火山引擎方舟平台Token调用量同比增长3.98倍[7] - 字节跳动内部产品Tokens消耗量未被统计 若计入市场份额会更大[7] Token经济模式优势 - Token收入可能在未来1-2年增长至百亿元规模 年增速可达3-10倍[8][9] - 相比低价销售GPU资源的"一锤子买卖" Token模式带来经常性收入[9][10] - 按Token计费降低开发门槛 使算力计费更清晰 ROI更易衡量[11] 行业发展趋势 - AI算力消耗从训练转向推理 "卖Token"模式正变得越来越流行[12] - 2024年初中国日均Token消耗量1000亿 2025年6月底突破30万亿 一年半增长300多倍[12] - 2024年7月火山引擎率先降价90% 引发行业跟进 2025年2月DeepSeek模型走红推动爆发[13] 未来增长预测 - 2025年底-2026年初多模态模型和Agent成熟将推动新一轮Token消耗增长[17] - 单次视觉任务消耗算力可能超10万Tokens 是文本对话的成千上万倍[17] - 预计2027年豆包大模型日Tokens消耗量超100万亿 较2024年增长至少100倍[18] 字节跳动生态优势 - 字节跳动内部AI需求领先外部市场约4-5个月[19] - 豆包大模型2025年5月日均Tokens调用量16.4万亿 较2024年5月1200亿增长137倍[29] - 月均Tokens调用量超500万亿 超过谷歌2025年5月的480万亿[23][29] 技术实力表现 - 字节跳动Seedream 4.0图像模型文字转图像能力全球第一 图像分析能力全球第二[30][33] - 豆包App月活跃用户1.41亿 居国内AI原生App第二[34] - 火山引擎AI基础设施吞吐效率更高 每秒Token输出量达其他厂商2.6倍[35] 国际对标与战略目标 - 谷歌Gemini模型2025年7月月处理Tokens达980万亿 带动谷歌云营收增速提升10个百分点[23] - 火山引擎目标在MaaS市场保持份额第一 2030年前成为千亿级云和AI公司[35] - Token模式成为AI时代改变云计算竞争格局的新武器[36]
从多模态融合到行业深扎,国内 AI 大模型三大发展方向解析
搜狐财经· 2025-07-07 11:36
技术深化方向 - 多模态融合成为大模型发展重点 科大讯飞的星火认知大模型通过综合判断语音、手势、行为、情绪等提供更自然交互 并首发汽车端侧星火大模型赋能汽车产业 字节跳动的豆包强化多模态能力 其视频生成模型Seedance 1.0 pro在国际评测中表现优异 未来大模型将更精准融合文本、图像、语音等多模态信息 [2] - 推理能力持续提升 字节跳动的豆包1.6-thinking在复杂推理、竞赛级数学等测试中跻身全球前列 多轮对话能力达企业级应用标准 百度文心一言通过引入外部知识源提升知识水平和回答准确性 [2] 应用拓展方向 - 行业深度赋能趋势明显 科大讯飞计划将星火大模型从通用走向行业 覆盖汽车、教育、医疗、智慧城市等领域 百度、阿里等公司也在金融、工业、政府、科研、电商领域探索定制化应用 [3] - 智能应用创新加速 字节跳动提出"互联网从APP时代进入Agents时代" 火山引擎方舟平台构建了服务Agent开发完整体系 催生他她它、推氪AI等创新产品 未来大模型将与新兴技术结合创造智能助手、创作工具等应用 [3] 生态建设方向 - 开源共享成为重要趋势 2025年以来字节豆包、百度文心、阿里通义千问等推出开源模型 商汤科技发布LazyLLM开源框架 MiniMax开源新一代MiniMax-01系列模型 通过开源吸引开发者提升模型性能 [4] - 产业生态构建持续推进 国内出台政策支持AI产业发展 上海模速空间覆盖算力层、数据层、基础大模型层和应用层全产业链 未来研发机构将加强与上下游合作构建完整产业生态 [4]