火山方舟

搜索文档
DeepSeek-V3.1上线火山方舟
每日经济新闻· 2025-08-22 16:27
每经AI快讯,据火山引擎消息,今天,DeepSeek-V3.1正式上线火山方舟,企业用户可以在更快、更稳的资源保障 下体验最新 DeepSeek-V3.1模型:实现20-40ms 吐字间隔(TPOT)超低延迟,并提供全网最高的500万初始并发 TPM。 (文章来源:每日经济新闻) ...
火山引擎撕开“Agent元年”真相:大模型已演进到按使用量订阅
犀牛财经· 2025-08-11 17:13
行业动态 - 大模型产业进入"Agent元年",企业级市场正在发生深刻变革 [2] - 2025年上半年智能体构建平台中标项目达371个,同比增长250%,接近去年全年总量的三分之二 [2] - 行业商业模式正经历根本性转变,从按卡时、Token收费演进到按使用量订阅,未来终极形态将是"营销增收、成本节约"的价值分成模式 [3] 公司表现 - 火山引擎凭借HiAgent智能体平台,以"中标金额与数量双第一"的业绩占据企业级AI智能体赛道领跑位置 [2] - 火山引擎自2024年下半年起稳居中标数量榜首,今年上半年包揽中标金额与数量双料冠军 [2] - 替换HiAgent后智能体并发能力突破原有平台200上限,满足真实生产需求 [3] 产品创新 - HiAgent 2.0首创Agent DevOps体系,实现开发运营一体化 [2] - 提供行业模板库,将企业定制周期缩短80% [2] - 打通"模应一体",支持企业精调专属模型 [2] - 推出Canvas交互门户,统一调度数百个分散Agent [2] 竞争策略 - 火山引擎通过豆包大模型+火山方舟推理优化构建性价比护城河 [3] - Agent的长期记忆和知识库构成天然壁垒 [3] - 公司将行业know-how转化为生产力的确定性方案作为核心竞争力 [2]
字节豆包大模型日均调用量飙升137倍,最新输入tokens价格低至0.15元
钛媒体APP· 2025-07-31 17:29
字节跳动火山引擎产品升级 - 火山引擎发布豆包·图像编辑模型3.0、豆包·同声传译模型2.0及豆包大模型1.6系列升级版 [2] - 豆包大模型日均tokens使用量达16.4万亿,较去年5月增长137倍 [2] - 豆包大模型在中国公有云大模型服务调用量占比达46.4%,位居第一 [2][7] 技术迭代与商业化进展 - 豆包大模型1.6版升级强化视觉理解、代码、推理等能力,PerToken延迟低至10ms [8][9] - 豆包·同声传译模型2.0将语音延迟从8-10秒降至2-3秒,降低超60% [8] - 企业级API调用成本在0-32k文本长度区间为每百万tokens输入0.15元、输出1.5元 [9] 市场份额与营收目标 - 中国公有云大模型调用量达114.2万亿tokens,火山引擎市场份额46.4% [7] - 火山引擎2024年营收超120亿,2025年目标翻倍至250亿 [8] - 预计2030年火山引擎年收入或达1000亿元 [8] AI Agent与数字员工解决方案 - 推出HiAgent数字员工工作台,实现千人千面工作画布形态 [14] - 广交数科与厦门大学已落地HiAgent方案,覆盖车辆维修、招生咨询等场景 [16] - AI Agent开发平台扣子开源后三天内星标数破万 [9][10] 开源生态与技术框架 - 开源扣子开发平台、扣子罗盘等工具,支持可视化开发与全链路管理 [9][10] - 开源veRL训练框架、KubeWharf操作系统等多项技术栈 [10] - 将持续开源高质量项目助力开发者创新 [12]
DeepSeek+风起,金融行业率先加速生产力落地
格隆汇APP· 2025-03-03 18:45
算力平权运动 - DeepSeek-V3以557.6万美元预训练成本追平硅谷巨头数亿美元研发的顶尖模型,标志"算力平权运动"开启 [1] - ASML首席执行官指出AI模型训练成本从数亿美元压缩至百万级将催生指数级市场扩容 [2] - 算法创新与开源生态协同瓦解算力垄断,技术民主化使创新成果流向中小企业与个人 [4] - 云厂商通过构建跨平台模型市场、优化调度算法等措施编织去中心化算力网络 [5] - 中国算力产业链重构,华为云昇腾AI集群将云计算基础设施价值提升至数字经济治理层面 [5] 火山引擎技术突破 - 火山引擎实现DeepSeek模型高度对齐官方,精度不打折,支持V3/R1等不同尺寸模型 [8] - 在AIME测试中成为唯一实现"满血可联网版"服务商,复杂多轮对话能力与原生模型无异 [9] - 推理延迟压降至30ms,目标稳定在15-30ms区间,API响应性能全面领先行业 [11] - 实现完整回复率100%,API可用性达99.83%,服务稳定性行业最优 [12] - 提供500万TPM限流阈值,支持每分钟1250次复杂推理请求,突破传统API吞吐限制 [14] 金融行业应用 - 已服务60余家金融机构包括国信证券、平安证券等,覆盖投研投顾、风控合规等场景 [15] - AI一体机提供私有化部署方案,搭载veStack统一底座保障金融数据安全 [17][18] - 全栈自研推理引擎深度优化算子层、调度层,缓解金融行业"算力饥渴症" [19] - 轻量化方案降低金融机构AI转型门槛,破解"创新桎梏"重塑行业竞争力 [19][20] 全栈AI生态构建 - 提供豆包大模型、HiAgent、扣子等全栈服务覆盖语言、图像、视频等多领域 [22][24] - 火山方舟平台提供模型训练、推理、评测全流程服务,支持第三方模型接入 [25] - 扣子平台独家支持DeepSeek工具调用,降低开发者门槛构建智能体生态 [25] - 形成从底层硬件到上层应用的完整AI生态链,推动行业智能化转型 [25][26]
火山引擎的新产品,字节和 100 多家企业的大模型实验场
晚点LatePost· 2024-12-19 22:09
颠覆式新技术发展路径 - 颠覆式新技术往往始于前景不明的实验,经过多次迭代找到市场需求契合点后发展壮大,如AWS从商品数据库查询演变为全球最大云计算平台[3] - 大模型应用当前处于早期探索阶段,Chatbot类应用30日用户留存率仅6%,行业正通过功能叠加、产品嵌入和Agent开发寻找突破口[3] - 字节跳动采取全面布局策略,开发10多个C端大模型产品同时在企业服务市场发力[3] 火山引擎HiAgent平台定位 - HiAgent定位为企业大模型应用开发平台,类比Android系统中的SDK,帮助企业降低开发门槛[4] - 产品开发采用敏捷模式,10多人团队边测试边迭代,未采用传统"谋定后动"方式[5] - 解决企业五大痛点:AI人才不足、数据泄露担忧、专属应用开发难、系统集成复杂和效果评估困难[6] 大模型应用落地趋势 - 重点布局人力密集且流动大的场景(客服/导购)和知识密集且人力成本高的场景(科研/法律/教育)[10] - 上线7个月签约100+客户,包括宁德时代、飞鹤、华泰证券及浙大等高校[11] - 观察到两大落地趋势:非技术人员直接参与开发(如浙大师生)和复杂场景需知识增强(如电池公司)[12][13] HiAgent核心功能升级 - "普敏捷"功能降低使用门槛,支持无代码开发,上线100种行业模板实现"一键复刻"[12] - "图知识"功能采用GraphRAG技术,提升碎片化知识处理能力,较传统RAG提高回复准确性[14] - "富交互"功能融合自然语言与图形交互,推出生成式画布,支持大小模型结合[17] 大模型对云计算格局影响 - 大模型重塑云计算竞争格局,GPU需求打破传统CPU算力规模优势,后发厂商获得新机会[20] - 火山引擎未投资创业公司但大模型IaaS市场份额已升至国内第二,带动传统云服务增长[23] - 豆包模型日均tokens使用量达40000亿,较5月增长33倍,形成模型与平台互促的飞轮效应[21] 企业知识资产构建 - 大模型普及将抹平企业技术优势,知识增强工程成为新竞争壁垒[15] - 头部电池公司案例显示,有效知识工程需结合文档数据、专家经验及员工反馈进行多维度校准[14] - 火山引擎推出独立AI咨询服务,协助企业完成从数据到知识的转化过程[17]