Workflow
AI云原生
icon
搜索文档
科技周报|国内最大DRAM存储芯片厂商冲刺科创板;智能眼镜首次进入国补范围
第一财经· 2026-01-04 11:39
火山引擎成为总台春晚独家AI云合作伙伴 - 火山引擎正式成为中央广播电视总台《2026年春节联欢晚会》独家AI云合作伙伴 [1][2] - 公司将基于多模态大模型和云计算技术,深度参与春晚节目、线上互动和视频直播 [2] - 火山引擎为字节跳动旗下云和AI服务平台,过去五年为抖音春晚直播提供技术支撑,并曾保障2021年总台春晚703亿次红包互动 [2] - 此举旨在巩固公司在AI云领域的领先位势,并加速To B业务的规模化落地 [2] 长鑫科技冲刺科创板IPO - 国内最大DRAM存储芯片厂商长鑫科技科创板IPO申请获受理,拟首发募资295亿元 [3] - 公司2022年至2024年及2025年上半年分别亏损83.28亿元、163.4亿元、71.45亿元、23.32亿元,近三年累计亏损超300亿元 [3] - 按2025年第二季度DRAM销售额计算,长鑫科技全球市场份额为3.97% [3] - 按产能和出货量统计,公司为中国第一、全球第四的DRAM厂商,但与全球前三大厂商(三星电子、SK海力士、美光科技)合计94.27%的市场份额仍有较大差距 [3] 蓝箭航天冲刺科创板IPO - 蓝箭航天空间科技股份有限公司科创板IPO申请获受理,拟募资75亿元 [4] - 募集资金中,27.77亿元用于可重复使用火箭产能提升项目,47.3亿元用于可重复使用火箭技术提升项目 [4] - 公司2022年至2024年营收分别为78.29万元、395.21万元和427.83万元,净亏损分别为8.21亿、12.16亿、9.16亿元 [4] - 2025年上半年,公司营收3643.19万元,净亏损为6.35亿元 [4] - 商业火箭行业当前普遍面临技术验证优先、盈利滞后的共性问题 [5] - 2026年,随着中国星网等大型星座建设进入集中发射窗口期,具备中大型可重复使用火箭能力的企业将迎来工程能力与资本市场的双重检验 [5] 2026年消费品国家补贴政策更新 - 2026年消费品国家补贴政策发布,智能眼镜首次被纳入国家补贴范围 [7][8] - 家电以旧换新补贴聚焦冰箱、洗衣机、电视、空调、电脑、热水器6类产品,家用灶具和吸油烟机不再列入补贴范围 [7] - 数码产品购新补贴拓展为数码和智能产品购新补贴,支持范围包括手机、平板、智能手表(手环)、智能眼镜和智能家居产品 [7] - 家电以旧换新补贴调整为仅针对1级能效或水效产品,补贴产品售价的15%,单件补贴上限1500元 [7] - 数码和智能产品补贴按产品售价(每件不超6000元)的15%计算,即每件补贴不超过500元 [7] - 据洛图科技数据,2025年中国AR设备(带显示)销量预计达45.2万台,同比增长近70% [8] - 2025年中国AI眼镜(不带显示)销量预计达137万副,同比增长215.7% [8] - 京东宣布,2025年已投入近300亿元支持国补进乡村,2026年将继续加大投入力度 [9]
盘点2025:模型服务,成为基础设施
第一财经资讯· 2025-12-30 19:11
全球MaaS市场格局 - 截至2025年10月,全球MaaS市场前三名为OpenAI(31%)、谷歌云(19%)、火山引擎(15%),三家合计占据65%的市场份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[4] - 在Gartner发布的2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑全球“挑战者”象限,其“执行能力”位列全球第五、中国第一[12] 火山引擎的增长与市场地位 - 2025年,火山引擎营收同比增长100%,超过200亿元人民币[6] - 由于MaaS商业化和模型迭代超预期,公司将其2030年营收目标从1000亿元上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场的份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[12] - 豆包大模型的最新日均调用量已达63万亿Tokens,持续高速增长[4] 战略与商业模式演变 - 公司将MaaS(模型即服务)作为第一战略优先级目标,体现在全员会议、员工OKR及具体的销售激励和产品研发上[7] - 2024年5月,公司通过技术创新将主力模型定价从行业“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[7] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠,并在MaaS层之上发展Agent(智能体)开发和运营服务[22] 技术发展与产品迭代 - 2024年5月首次推出豆包大模型家族API服务,2025年2月DeepSeek-R1登陆火山方舟平台,这两大事件成为中国MaaS市场增长的关键拐点[7] - 2025年6月以来,公司密集发布了豆包大模型1.6、视频生成模型Seedance 1.5 pro、图像创作模型Seedream4.0等系列模型,每次模型能力提升都解锁了更多应用场景并带动调用量每3个月迎来一次更陡峭的增长[9] - 公司推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建底层设施[22] - 豆包助手API、即梦API等Agent封装服务已通过火山引擎对外提供[24] 核心竞争优势与协同效应 - 公司认为,大的模型调用量能打磨出更好的模型和基础设施(Infra),通过海量B端场景反馈优化模型路线图,并通过规模效应迭代出更极致的Infra与优化毛利率[13][15] - 公司受益于字节跳动的技术溢出与协同效应,字节跳动C端产品(如豆包App日活1亿)的大规模调用帮助火山引擎打磨服务,同时其产品体验为ToB业务带来品牌和认知上的协同优势[16][17][19] - 云计算是规模体系的比拼,头部云厂商的崛起均有庞大业务体系托举,火山引擎作为字节跳动旗下云与AI服务平台,放大了字节在数据增长方法论、推荐算法及服务器规模优势上的技术溢出[20] 行业趋势与未来方向 - 2025年,大模型API基础设施化趋势明显,越来越多的头部云厂商将MaaS视为业务长期成功的首要指标[9] - 行业正从简单的模型API调用,迈向以Agent为技术主体的AI云原生架构,模型成为软件核心,MaaS是使用模型的最佳方式[22] - Agent市场潜力巨大,其商业逻辑从tokens调用的IT预算转向类似BPO(业务外包)的角度,有望将原有市场扩大很多倍[24] - 当前模型服务主要集中于互联网、智能制造、消费电子及汽车行业,未来将随模型应用深入而进入更广领域[21]
盘点2025:模型服务,成为基础设施
第一财经· 2025-12-30 18:15
全球MaaS市场格局与火山引擎的崛起 - 截至2025年10月,全球MaaS市场前三名为OpenAI、谷歌云、火山引擎,市场份额分别为31%、19%、15%,三家合计占据全球市场65%的份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[3] - 火山引擎是前三名中唯一的中国厂商,正凭借MaaS服务在AI云市场快速突围[3] 火山引擎的增长与市场地位 - 2025年,火山引擎实现100%的同比增长,营收超过200亿人民币[6] - 由于MaaS商业化和模型迭代超预期,公司原计划于2030年实现的1000亿营收目标被上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[14] - 在Gartner 2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑“挑战者”象限,其“执行能力”位列全球第五、中国第一[14] 关键增长驱动与战略举措 - 2024年5月15日,火山引擎推出豆包大模型API服务,通过技术创新将主力模型定价从“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[6] - 2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发,火山引擎成为市场上吃到最多DeepSeek推理服务红利的云厂商[7] - 豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场,IDC报告显示2024年7月和2025年2月是中国公有云大模型调用量月度环比增长率最高的两个拐点[8][10] - 豆包大模型调用量呈指数增长,推出不到600天,其最新日均调用量已达63万亿Tokens[3][4] 产品迭代与调用量增长的正循环 - 2025年6月以来,豆包大模型家族密集发布了1.6、1.8版本以及视频生成、图像编辑、语音、图像创作等多个模型,每次模型能力提升都解锁了更多应用场景并带动调用量增长[10] - 伴随模型发布节奏,几乎每3个月模型调用就会迎来一次更陡峭的增长[11] - 公司认为,大的模型调用量能打磨出更好的模型和基础设施,来自B端场景的真实反馈可以指导下一代模型的训练路线图[15][16][18] - 大规模调用量能迭代出更极致的基础设施,优化推理成本,例如通过PD分离、xLLM推理框架等方式在2024年5月大幅降低模型推理价格[18] - MaaS服务已成为火山引擎增长最快、毛利最高的AI云计算产品,参照DeepSeek公布的推理服务最高成本利润率可达545%[18] 字节跳动的技术溢出与协同优势 - 火山引擎63万亿日均Tokens调用量的用户基础,部分来源于字节跳动的溢出效应[20] - 公司受益于B端和C端的极致协同,字节跳动的C端产品(如豆包App)拥有大量用户并大规模调用模型,这帮助火山引擎优化服务,同时豆包App也成为向企业客户展示能力的窗口[20][21] - 字节跳动内部50多个业务线在AI实践上走得更靠前,尝试了众多Agent,这为火山引擎提供了宝贵的认知和know-how[23] - 云计算是规模体系的比拼,火山引擎的崛起得益于字节跳动庞大的业务体系托举和技术外溢,这与AWS、谷歌、阿里等头部云厂商的路径类似[24] - 字节跳动通过火山引擎持续把新模型、新技术开放给企业客户,以在更大市场经受检验[24][25] 未来战略:从MaaS到AI云原生 - 在取得MaaS份额第一后,火山引擎的战略目标依旧是MaaS优先[27] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠[27] - 在基础MaaS层,追求模型效果更好、成本更低、易用性更高,并推出了Prompt Pilot、Model Router和Responses API等工具[27] - 在更底层,推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建基础设施[27] - 随着应用迈向以Agent为技术主体,公司正构建以模型为中心的AI云原生架构,MaaS是使用模型的最佳方式,云平台和中间件进一步把Tokens组装成Agents[28] - 作为国内率先推出Agent开发、运营全套产品的云厂商,火山引擎已将豆包助手API、即梦API对外提供服务[30] - Agent的商业逻辑从tokens调用的IT预算,转向类似BPO(人力外包)的角度,市场天花板有望扩大很多倍[30]
打造全球首个强化学习云平台,九章云极是如何做到的?
机器之心· 2025-07-16 12:21
AI范式转变与强化学习崛起 - AI正经历从被动响应的语言模型向具备自主决策能力的智能体转变,进入"经验时代"或"软件3.0时代"[1] - 强化学习(RL)成为实现AGI的关键技术,被诺贝尔奖得主Demis Hassabis和图灵奖得主Richard Sutton视为哺乳动物智能的基础[2] - 强化学习面临高频数据交互、动态算力需求等挑战,传统云计算平台难以适配其动态多阶段特性[2] 九章云极AgentiCTRL平台突破 - 公司发布全球首个工业级强化学习云平台AgentiCTRL,支持万卡级异构算力调度[3] - 基于MoE架构实现端到端训练效率提升500%,综合成本下降60%[4] - 平台采用Serverless架构实现弹性资源调度,GPU利用率提升25%,人工介入次数减少90%[16][19] - 在OSWorld基准测试中,训练后的Alaya-UI智能体任务完成率从6.87%跃升至24.8%[21] 技术架构创新 - 重构强化学习训练流程,用户仅需极少代码即可完成训推闭环[12] - 自研异构算力操作系统突破"秒级生成百万级token"性能瓶颈,GPU利用率超95%[31] - 实现全异步解耦、多环境异构引擎等核心技术,支持智能体即服务模式[10] - 环境模拟、策略执行等复杂机制深度封装,开发效率提升数倍[14] 智能基础设施战略 - 构建三层能力体系:软件定义AI基础设施、Alaya NeW OS操作系统、Alaya NeW Cloud工具链系统[29] - 提出"1度算力"普惠化标准,采用按使用量计价模式降低AI使用门槛[28][30] - 已在政务、金融等七大行业实现部署,强化学习云领域稳居第一梯队[31] - 成立AI-STAR生态联盟及1.8亿元生态基金,加速产业落地[33] 行业竞争与未来展望 - 公司通过系统级重构实现范式跃迁,而非简单算力堆叠[37] - 开发门槛降低使RL训练如调用API般简单,端到端性能提升5倍[38] - 定位为"智能体运行的操作系统级云平台",非传统工具链供应商[40] - 预计强化学习将从实验室特权转变为AI系统常规组件[41]
字节打响Agent基建之战
华尔街见闻· 2025-06-16 20:56
字节跳动AI战略布局 - 公司正押注AI Agent作为新一代技术范式,试图通过换道超车实现技术突破 [1] - 火山引擎发布豆包大模型1.6系列,综合成本降低63%,支持256K上下文处理能力 [8][10] - 公司CEO梁汝波明确表态将长期投入AI技术研发,追求智能突破与产业应用结合 [1] AI Agent行业趋势 - AI Agent被视为继PC时代的Web、移动时代的APP后的下一代技术主体 [1][5] - IDC预测2025年将成为中国Agent落地元年,图像/视频类大模型调用量将显著增长 [6] - Agent技术将重构互联网入口格局,传统超级App可能面临边缘化风险 [3] 字节技术产品进展 - 豆包1.6系列包含三个版本,其中thinking模型在GPQA测评集达81.5分,达到国际第一梯队水平 [8][9] - 视频生成模型Seedance 1.0 pro价格低至3.67元/5秒视频,性能登顶全球榜单 [10] - 实时语音模型全量开放,AI云原生服务新增MCP、PromptPilot等工具链 [10][11] 云计算市场竞争格局 - 火山引擎在大模型调用量市场占比46.4%,但整体云计算市场尚未进入第一梯队 [4] - 公司通过价格战策略将大模型成本降至"厘时代",日均tokens调用量达16.4万亿 [13][14] - 2024年火山引擎收入增速三位数,目标规模超百亿并实现翻倍 [16] 行业生态与挑战 - 公司发起V-START加速器计划,扶持AI初创企业弥补B端生态短板 [17] - Agent落地面临基础设施成本、多平台验证等瓶颈 [17] - 竞争对手包括阿里/腾讯等全栈布局大厂及智谱AI等创新公司 [18]
AI云原生革新AI架构拆除AI落地之墙
环球网资讯· 2025-06-15 13:47
AI行业发展趋势 - 2025年AI模型、AI算力、AI应用相互推动,呈现螺旋上升趋势,传统云架构向AI云原生方向演进 [1] - 2024下半年中国公有云市场增速达17.7%,涵盖IaaS、PaaS、SaaS领域 [1] - 2024年12月中国公有云大模型日均token调用量达9522亿,较2024年6月的963亿增长近10倍 [1] 火山引擎市场表现 - 2024年5月火山引擎将大模型推理成本降低90%以上,推动行业降价并带动市场扩容 [1] - 2024年火山引擎在大模型调用总量中市场份额达46.4% [2] - 截至2025年5月,豆包大模型日均tokens调用量达16.4万亿,较2024年5月的1200亿增长137倍 [2] 云计算架构变革 - AI时代传统云计算分层结构(IaaS/PaaS/SaaS)被消解,转向以Agent为核心的AI云原生架构 [2] - AI云原生架构重新优化计算、存储与网络,目标是提升单位时间内token生成效率,加速AI应用响应 [2] - 复杂Agent任务需模型优化、服务优化及调优环境支持,强调基础设施的重要性 [3] 行业技术转型 - 技术主体从网页、App转向AI智能体,标志PC时代到移动时代再到AI时代的演进 [2] - 火山引擎原动力大会提出AI云原生架构更关注业务架构而非技术分工 [2]
梁汝波首次公开站台,为什么给了豆包?
虎嗅· 2025-06-14 06:29
核心观点 - 字节跳动CEO梁汝波首次公开为豆包站台,凸显公司对AI大模型及火山引擎业务的战略重视 [1][6][29] - 火山引擎通过技术优化实现大模型成本大幅下降(降幅达99%),推动行业价格战并加速AI普及 [9][22] - 公司提出"AI云原生"概念,构建从开发范式到基础设施的完整解决方案,聚焦Agent技术落地 [17][19][20] - 火山引擎营收呈现爆发式增长:2021年超10亿元→2022年20亿元→2023年50亿元→2024年110亿元,2025年目标230亿元 [12][14][15] - 字节跳动坚持大模型自研路线,豆包在中国公有云大模型市场份额达46.4%,日均Token使用量16.4万亿(较首发增长137倍) [34][38] 产品与技术突破 - 豆包1.6-thinking在复杂推理、数学竞赛等测试集跻身全球前列,视频生成模型Seedance 1.0 pro在Artificial Analysis评测中超越Veo3等竞品 [5] - 工程优化实现企业成本下降63%(同任务成本从7元降至2.6元),关键技术包括Serve key方案和方舟调度系统 [22][24] - 编程能力显著提升:豆包1.6接入TRAE编程产品,超80%字节工程师使用,月活突破100万 [28] 战略布局 - 公司定位从娱乐平台向科技公司转型,火山引擎承载构建完整自研体系(服务器/操作系统/芯片/SaaS)的使命 [40][43][44] - 采用差异化竞争策略:不参与大模型投资并购,通过Top Seed计划全球招募顶尖人才 [33][37][41] - 依托抖音生态优势:10亿用户日均2小时使用时长为云计算提供规模效应和算力调优空间 [31] 行业影响 - 价格战改变行业格局:2024年豆包1.0降价99%触发连锁反应,加速中国大模型发展 [9] - Agent技术被视为下一代开发范式,将重构互联网入口(PC→移动→AI对应Web→APP→Agents) [17][25] - 安全需求升级:推出大模型防火墙、模型投毒防护等新产品,应对多模态数据安全挑战 [18]
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 18:23
火山引擎发展历程与战略 - 火山引擎成立5年,从最初不被看好到目前国内大模型调用量占比46.4%,远超二三名总和[4] - 公司2021年定下1000亿元年收入目标,当时阿里云年收入仅600亿,目前火山引擎去年收入100亿,今年目标200多亿[14] - 公司采用"内外技术同源"原则,复用字节跳动内部技术资源,如推荐系统GPU训练经验直接对外服务[10] 技术优势与市场表现 - 豆包大模型日均Token处理量从去年12月4万亿增长至16.4万亿,半年翻两番[4][26] - 公司TPM(每分钟处理Token数)达500万,远超同行默认水平,并通过技术优化将大模型价格降至行业1/3[19][22] - 深度思考模型和多模态模型带动AI工具类应用增长10倍,如AI搜索、AI编程和线下巡店等场景[26] Agent战略布局 - 公司认为Agent将突破App时代天花板,能创造更大经济价值,正在加码开发全链路Agent工具[4][25] - 推出MCP服务、Prompt Pilot等Agent定制开发套件,采用按输入长度区间定价的创新模式[5][24] - 开源强化学习框架veRL,并打通Trae开发者工具与云组件服务,构建完整Agent开发环境[24] 商业模式与竞争策略 - MaaS(模型即服务)毛利率较高,公司通过C端(豆包App)与B端协同获客,客户常参考C端效果提出需求[17][19] - 资源调度能力突出,将不同context长度混合推理,实现256K上下文窗口,国内首家[24] - 按整个集团计算资源规模不输阿里云,内部基础设施复用大团队保证体系协调[21][29] 行业趋势判断 - 预计云计算市场空间将扩大100倍,GPU为基础的AI云服务将占收入大头[14][25] - 模型能力提升带动行业爆发,如DeepSeek破圈后客户热情明显提升[26] - 提示词工程价值被低估,模型越好时明确的需求描述越能发挥性能[28]
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 17:57
火山引擎发展现状与战略 - 火山引擎国内云端大模型调用量占比达46.4%,超二三名总和[3] - 豆包大模型日均Token处理量半年内翻两番至16.4万亿[3][49] - 公司2021年定下1000亿元年收入目标,去年收入100亿,今年目标200亿[22] 技术优势与产品布局 - 推出MCP服务、Prompt Pilot等Agent定制开发套件,思考模型定价为同行1/3[4] - 深度思考模型context长度达256K国内第一,TPM达500万领先行业[39][45] - 强化学习框架veRL和集成式Coding Agent Trae构成技术壁垒[46][47] 商业模式与竞争策略 - MaaS业务实现盈利,毛利率优于传统PaaS服务[33] - 采用"技术优化+规模效应"降本模式,而非价格战[34][41] - C端产品豆包App成为B端获客重要渠道,形成协同效应[37][40] 行业趋势判断 - 预测AI云服务市场将扩大100倍,GPU业务占比超50%[23][42] - Agent将突破App时代天花板,创造更大经济价值[48] - 多模态模型带动AI搜索、AI Coding需求增长10倍[52][53] 运营管理特点 - 坚持"内外技术同源"原则,复用字节基础设施[12][61] - 通过规模效应摊薄成本,1万台服务器优化收益放大100倍[41] - 建立垂直优化团队深度参与模型研发[61][62]
从高考到实战,豆包大模型交卷了
机器之心· 2025-06-12 14:08
豆包大模型1.6升级 - 豆包大模型1.6包含标准版、深度思考强化版和极速版三个主要版本[3] - 性能达到世界前沿水平,是国内首个支持256K上下文的思考模型系列,具备多模态理解和GUI操作能力[4] - 在高考数学测试中,豆包1.6从能读重本升级到能上清北的水平[4] - 编程任务测试中,豆包1.6一次性完成贪吃蛇游戏代码编写且无需修改[15] - 在五位数字密码推理问题中,豆包1.6是国内首个能通过非编程式推理解决该问题的模型[19][22] Seedance 1.0 Pro视频生成模型 - Seedance 1.0 Pro支持无缝多镜头叙事、多动作及随心运镜[6] - 在Artificial Analysis视频竞技场中表现超过Veo3和可灵2.0[6] - 测试显示该模型在动态一致性、细节真实感和镜头语言理解方面表现优异[38][39] AI基础设施与工具 - 火山引擎推出三大AI基础设施套件:AgentKit、TrainingKit和ServingKit[8][65] - veRL强化学习框架已支持DeepSeek 671B和Qwen3 235B等大型MoE模型,GitHub star量超过9300[62][63] - 构建多模态数据湖,为企业提供AI原生数据基建[64] - 推出Prompt Pilot服务,可自动分析和优化提示词[58] 技术发展主线 - 第一条主线是"推理+视觉"范式发展,将推理能力扩展到视觉理解领域[51] - 第二条主线是视频生成走向实用化,高质量视频生成进入实际生产环境[51] - 第三条主线是多步骤复杂任务处理,即智能体(Agent)概念的发展[52] 市场影响与战略 - Meta宣布148亿美元投资Scale AI事件引发市场关注[30] - 火山引擎强调"AI云原生"概念,重新优化AI工作负载的云端架构[8][71] - 公司计划长期投入,目标是成为客户信赖的云服务平台[72]