Workflow
AI云原生
icon
搜索文档
打造全球首个强化学习云平台,九章云极是如何做到的?
机器之心· 2025-07-16 12:21
AI范式转变与强化学习崛起 - AI正经历从被动响应的语言模型向具备自主决策能力的智能体转变,进入"经验时代"或"软件3.0时代"[1] - 强化学习(RL)成为实现AGI的关键技术,被诺贝尔奖得主Demis Hassabis和图灵奖得主Richard Sutton视为哺乳动物智能的基础[2] - 强化学习面临高频数据交互、动态算力需求等挑战,传统云计算平台难以适配其动态多阶段特性[2] 九章云极AgentiCTRL平台突破 - 公司发布全球首个工业级强化学习云平台AgentiCTRL,支持万卡级异构算力调度[3] - 基于MoE架构实现端到端训练效率提升500%,综合成本下降60%[4] - 平台采用Serverless架构实现弹性资源调度,GPU利用率提升25%,人工介入次数减少90%[16][19] - 在OSWorld基准测试中,训练后的Alaya-UI智能体任务完成率从6.87%跃升至24.8%[21] 技术架构创新 - 重构强化学习训练流程,用户仅需极少代码即可完成训推闭环[12] - 自研异构算力操作系统突破"秒级生成百万级token"性能瓶颈,GPU利用率超95%[31] - 实现全异步解耦、多环境异构引擎等核心技术,支持智能体即服务模式[10] - 环境模拟、策略执行等复杂机制深度封装,开发效率提升数倍[14] 智能基础设施战略 - 构建三层能力体系:软件定义AI基础设施、Alaya NeW OS操作系统、Alaya NeW Cloud工具链系统[29] - 提出"1度算力"普惠化标准,采用按使用量计价模式降低AI使用门槛[28][30] - 已在政务、金融等七大行业实现部署,强化学习云领域稳居第一梯队[31] - 成立AI-STAR生态联盟及1.8亿元生态基金,加速产业落地[33] 行业竞争与未来展望 - 公司通过系统级重构实现范式跃迁,而非简单算力堆叠[37] - 开发门槛降低使RL训练如调用API般简单,端到端性能提升5倍[38] - 定位为"智能体运行的操作系统级云平台",非传统工具链供应商[40] - 预计强化学习将从实验室特权转变为AI系统常规组件[41]
字节打响Agent基建之战
华尔街见闻· 2025-06-16 20:56
字节跳动AI战略布局 - 公司正押注AI Agent作为新一代技术范式,试图通过换道超车实现技术突破 [1] - 火山引擎发布豆包大模型1.6系列,综合成本降低63%,支持256K上下文处理能力 [8][10] - 公司CEO梁汝波明确表态将长期投入AI技术研发,追求智能突破与产业应用结合 [1] AI Agent行业趋势 - AI Agent被视为继PC时代的Web、移动时代的APP后的下一代技术主体 [1][5] - IDC预测2025年将成为中国Agent落地元年,图像/视频类大模型调用量将显著增长 [6] - Agent技术将重构互联网入口格局,传统超级App可能面临边缘化风险 [3] 字节技术产品进展 - 豆包1.6系列包含三个版本,其中thinking模型在GPQA测评集达81.5分,达到国际第一梯队水平 [8][9] - 视频生成模型Seedance 1.0 pro价格低至3.67元/5秒视频,性能登顶全球榜单 [10] - 实时语音模型全量开放,AI云原生服务新增MCP、PromptPilot等工具链 [10][11] 云计算市场竞争格局 - 火山引擎在大模型调用量市场占比46.4%,但整体云计算市场尚未进入第一梯队 [4] - 公司通过价格战策略将大模型成本降至"厘时代",日均tokens调用量达16.4万亿 [13][14] - 2024年火山引擎收入增速三位数,目标规模超百亿并实现翻倍 [16] 行业生态与挑战 - 公司发起V-START加速器计划,扶持AI初创企业弥补B端生态短板 [17] - Agent落地面临基础设施成本、多平台验证等瓶颈 [17] - 竞争对手包括阿里/腾讯等全栈布局大厂及智谱AI等创新公司 [18]
AI云原生革新AI架构拆除AI落地之墙
环球网资讯· 2025-06-15 13:47
AI行业发展趋势 - 2025年AI模型、AI算力、AI应用相互推动,呈现螺旋上升趋势,传统云架构向AI云原生方向演进 [1] - 2024下半年中国公有云市场增速达17.7%,涵盖IaaS、PaaS、SaaS领域 [1] - 2024年12月中国公有云大模型日均token调用量达9522亿,较2024年6月的963亿增长近10倍 [1] 火山引擎市场表现 - 2024年5月火山引擎将大模型推理成本降低90%以上,推动行业降价并带动市场扩容 [1] - 2024年火山引擎在大模型调用总量中市场份额达46.4% [2] - 截至2025年5月,豆包大模型日均tokens调用量达16.4万亿,较2024年5月的1200亿增长137倍 [2] 云计算架构变革 - AI时代传统云计算分层结构(IaaS/PaaS/SaaS)被消解,转向以Agent为核心的AI云原生架构 [2] - AI云原生架构重新优化计算、存储与网络,目标是提升单位时间内token生成效率,加速AI应用响应 [2] - 复杂Agent任务需模型优化、服务优化及调优环境支持,强调基础设施的重要性 [3] 行业技术转型 - 技术主体从网页、App转向AI智能体,标志PC时代到移动时代再到AI时代的演进 [2] - 火山引擎原动力大会提出AI云原生架构更关注业务架构而非技术分工 [2]
梁汝波首次公开站台,为什么给了豆包?
虎嗅· 2025-06-14 06:29
核心观点 - 字节跳动CEO梁汝波首次公开为豆包站台,凸显公司对AI大模型及火山引擎业务的战略重视 [1][6][29] - 火山引擎通过技术优化实现大模型成本大幅下降(降幅达99%),推动行业价格战并加速AI普及 [9][22] - 公司提出"AI云原生"概念,构建从开发范式到基础设施的完整解决方案,聚焦Agent技术落地 [17][19][20] - 火山引擎营收呈现爆发式增长:2021年超10亿元→2022年20亿元→2023年50亿元→2024年110亿元,2025年目标230亿元 [12][14][15] - 字节跳动坚持大模型自研路线,豆包在中国公有云大模型市场份额达46.4%,日均Token使用量16.4万亿(较首发增长137倍) [34][38] 产品与技术突破 - 豆包1.6-thinking在复杂推理、数学竞赛等测试集跻身全球前列,视频生成模型Seedance 1.0 pro在Artificial Analysis评测中超越Veo3等竞品 [5] - 工程优化实现企业成本下降63%(同任务成本从7元降至2.6元),关键技术包括Serve key方案和方舟调度系统 [22][24] - 编程能力显著提升:豆包1.6接入TRAE编程产品,超80%字节工程师使用,月活突破100万 [28] 战略布局 - 公司定位从娱乐平台向科技公司转型,火山引擎承载构建完整自研体系(服务器/操作系统/芯片/SaaS)的使命 [40][43][44] - 采用差异化竞争策略:不参与大模型投资并购,通过Top Seed计划全球招募顶尖人才 [33][37][41] - 依托抖音生态优势:10亿用户日均2小时使用时长为云计算提供规模效应和算力调优空间 [31] 行业影响 - 价格战改变行业格局:2024年豆包1.0降价99%触发连锁反应,加速中国大模型发展 [9] - Agent技术被视为下一代开发范式,将重构互联网入口(PC→移动→AI对应Web→APP→Agents) [17][25] - 安全需求升级:推出大模型防火墙、模型投毒防护等新产品,应对多模态数据安全挑战 [18]
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 18:23
火山引擎发展历程与战略 - 火山引擎成立5年,从最初不被看好到目前国内大模型调用量占比46.4%,远超二三名总和[4] - 公司2021年定下1000亿元年收入目标,当时阿里云年收入仅600亿,目前火山引擎去年收入100亿,今年目标200多亿[14] - 公司采用"内外技术同源"原则,复用字节跳动内部技术资源,如推荐系统GPU训练经验直接对外服务[10] 技术优势与市场表现 - 豆包大模型日均Token处理量从去年12月4万亿增长至16.4万亿,半年翻两番[4][26] - 公司TPM(每分钟处理Token数)达500万,远超同行默认水平,并通过技术优化将大模型价格降至行业1/3[19][22] - 深度思考模型和多模态模型带动AI工具类应用增长10倍,如AI搜索、AI编程和线下巡店等场景[26] Agent战略布局 - 公司认为Agent将突破App时代天花板,能创造更大经济价值,正在加码开发全链路Agent工具[4][25] - 推出MCP服务、Prompt Pilot等Agent定制开发套件,采用按输入长度区间定价的创新模式[5][24] - 开源强化学习框架veRL,并打通Trae开发者工具与云组件服务,构建完整Agent开发环境[24] 商业模式与竞争策略 - MaaS(模型即服务)毛利率较高,公司通过C端(豆包App)与B端协同获客,客户常参考C端效果提出需求[17][19] - 资源调度能力突出,将不同context长度混合推理,实现256K上下文窗口,国内首家[24] - 按整个集团计算资源规模不输阿里云,内部基础设施复用大团队保证体系协调[21][29] 行业趋势判断 - 预计云计算市场空间将扩大100倍,GPU为基础的AI云服务将占收入大头[14][25] - 模型能力提升带动行业爆发,如DeepSeek破圈后客户热情明显提升[26] - 提示词工程价值被低估,模型越好时明确的需求描述越能发挥性能[28]
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 17:57
火山引擎发展现状与战略 - 火山引擎国内云端大模型调用量占比达46.4%,超二三名总和[3] - 豆包大模型日均Token处理量半年内翻两番至16.4万亿[3][49] - 公司2021年定下1000亿元年收入目标,去年收入100亿,今年目标200亿[22] 技术优势与产品布局 - 推出MCP服务、Prompt Pilot等Agent定制开发套件,思考模型定价为同行1/3[4] - 深度思考模型context长度达256K国内第一,TPM达500万领先行业[39][45] - 强化学习框架veRL和集成式Coding Agent Trae构成技术壁垒[46][47] 商业模式与竞争策略 - MaaS业务实现盈利,毛利率优于传统PaaS服务[33] - 采用"技术优化+规模效应"降本模式,而非价格战[34][41] - C端产品豆包App成为B端获客重要渠道,形成协同效应[37][40] 行业趋势判断 - 预测AI云服务市场将扩大100倍,GPU业务占比超50%[23][42] - Agent将突破App时代天花板,创造更大经济价值[48] - 多模态模型带动AI搜索、AI Coding需求增长10倍[52][53] 运营管理特点 - 坚持"内外技术同源"原则,复用字节基础设施[12][61] - 通过规模效应摊薄成本,1万台服务器优化收益放大100倍[41] - 建立垂直优化团队深度参与模型研发[61][62]
从高考到实战,豆包大模型交卷了
机器之心· 2025-06-12 14:08
豆包大模型1.6升级 - 豆包大模型1.6包含标准版、深度思考强化版和极速版三个主要版本[3] - 性能达到世界前沿水平,是国内首个支持256K上下文的思考模型系列,具备多模态理解和GUI操作能力[4] - 在高考数学测试中,豆包1.6从能读重本升级到能上清北的水平[4] - 编程任务测试中,豆包1.6一次性完成贪吃蛇游戏代码编写且无需修改[15] - 在五位数字密码推理问题中,豆包1.6是国内首个能通过非编程式推理解决该问题的模型[19][22] Seedance 1.0 Pro视频生成模型 - Seedance 1.0 Pro支持无缝多镜头叙事、多动作及随心运镜[6] - 在Artificial Analysis视频竞技场中表现超过Veo3和可灵2.0[6] - 测试显示该模型在动态一致性、细节真实感和镜头语言理解方面表现优异[38][39] AI基础设施与工具 - 火山引擎推出三大AI基础设施套件:AgentKit、TrainingKit和ServingKit[8][65] - veRL强化学习框架已支持DeepSeek 671B和Qwen3 235B等大型MoE模型,GitHub star量超过9300[62][63] - 构建多模态数据湖,为企业提供AI原生数据基建[64] - 推出Prompt Pilot服务,可自动分析和优化提示词[58] 技术发展主线 - 第一条主线是"推理+视觉"范式发展,将推理能力扩展到视觉理解领域[51] - 第二条主线是视频生成走向实用化,高质量视频生成进入实际生产环境[51] - 第三条主线是多步骤复杂任务处理,即智能体(Agent)概念的发展[52] 市场影响与战略 - Meta宣布148亿美元投资Scale AI事件引发市场关注[30] - 火山引擎强调"AI云原生"概念,重新优化AI工作负载的云端架构[8][71] - 公司计划长期投入,目标是成为客户信赖的云服务平台[72]
字节跳动发布新一代AI大模型 降价逾六成
智通财经网· 2025-06-11 16:40
产品发布与定价策略 - 火山引擎发布豆包大模型1.6 采用统一定价模式 最低价格为2.6元/百万tokens 较1.5版本和DeepSeek-R1的7元/百万tokens下降63% [1] - 豆包大模型1.6首创按输入长度区间定价 在0-32K区间内 输入价格为0.8元/百万tokens 输出价格为8元/百万tokens 综合成本较1.5版本和DeepSeek R1降低63% [2] - Seedance 1.0 pro视频生成模型定价为每千tokens 0.015元 生成一条5秒1080P视频仅需3.67元 为行业最低价格 [2] 产品矩阵与技术能力 - 豆包大模型家族已形成全模态、全尺寸、高性价比的领先模型体系 包括视频生成模型Seedance 1.0 pro、语音播客模型和实时语音模型 [1] - 截至2025年5月底 豆包大模型日均tokens使用量超过16.4万亿 较去年5月发布时增长137倍 [1] - 公司发布12款面向Agent开发和应用的工具产品 涵盖AI云原生全栈服务 [2] 公司战略与发展规划 - 字节跳动CEO梁汝波强调火山引擎对公司保持技术竞争力的重要性 表示将坚定长期投入 追求智能突破 服务产业应用 [1] - 公司认为AI时代需要构建"AI云原生"全新技术栈 这是企业开发Agent和实现创新的关键 [2]
让AI听懂行业,火山引擎如何拆掉大模型落地的「墙」?
36氪· 2025-06-10 21:34
大模型产业化趋势 - 2025年大模型在产业端加速渗透,正以前所未有的深度与广度融入金融、汽车、科技等核心业务领域[3][6] - 大模型应用从早期探索迈向规模化落地,2024年中国公有云大模型调用量达114.2万亿tokens,火山引擎以46.4%市场份额居首[5] - 企业从被动创新转向主动寻找落地点,基于明确业务痛点开发解决方案,云厂商角色扩展至业务陪伴与咨询[7] 行业落地案例 - **金融领域**:国信证券基于豆包大模型打造股市助手智能体,处理超百万份研报、十亿条财经短视频数据,覆盖70%系统重要性银行[13][15] - **汽车行业**:覆盖80%主流车企,上汽大众实现跨端交互,奔驰CLA车型接入情感识别功能,宝马聚焦智能营销缩短决策链路[16][17][19][20] - **教育科研**:南开大学共建AI+教育标杆,浙江大学打造全学科科研平台,同济大学开发校园智能助手覆盖多系统互通[21][22][24] - **智能终端**:联想通过Jeddak AICC平台实现全链路加密,推理效率无损且延迟接近明文模式[25][26] - **消费零售**:瑞幸利用意图识别引擎预测点单需求,高峰时段算力资源保障流畅体验[27] 云厂商核心能力 - 火山引擎提供多云多模型基础服务、Agent开发平台及全栈工具链,解决落地最后一公里问题[10] - 豆包大模型日均调用量12.7万亿tokens,千tokens输入成本降至0.0008元,推理成本进入厘时代[36][38] - AI云原生服务整合全栈推理加速与分布式优化,企业API调用延迟可控制在20ms以内[39] 未来发展方向 - 多模态模型与Agentic AI将爆发,中国B端AI Agent市场规模2025年预计达1718亿元[40][41] - 技术挑战聚焦能力与安全平衡、成本压力及系统集成难度,需持续优化算力调度与工程化能力[33][34][35] - 大模型未来3-5年或成企业基础设施,云厂商需降低技术门槛推动产业自由生长[42]
豆包概念震荡拉升 润欣科技涨超15%
快讯· 2025-06-09 10:42
行业动态 - 豆包概念股盘中表现强劲 润欣科技涨幅超过15% 光云科技、海天瑞声、引力传媒、汉仪股份等多只股票涨幅超过5% [1] - 2025火山引擎原动力大会·春将于6月11日-12日举行 聚焦大模型与AI云原生等前沿技术领域 [1] 会议内容 - 大会讨论主题包括Agent开发、多模态理解、深度思考、AI云原生等多个前沿技术话题 [1]