Workflow
火山引擎
icon
搜索文档
火山引擎金融大模型解决方案升级
金融大模型解决方案发布 - 火山引擎发布金融大模型全新解决方案 针对金融机构对客服务和内部提效两大方向 推出AI原生App与数字员工两大场景应用 [1] - 金融业已成为AI大模型规模化应用的先行领域 目前解决方案已覆盖70%系统重要性银行及数十家券商、基金公司 [1] - 对客服务与对内提效是行业焦点 也是火山引擎打造金融AI原生应用的两大发力点 [1] AI原生App解决方案 - AI App是以手机客户端为载体 提供智能投顾、交易、服务、资讯等场景交互的AI-Native平台 已在多家券商机构落地 [3] - 方案构建三层能力体系:智能交互层(专家智能体)、中台能力层(智能总控+Agent中台)、基础设施层(大模型+云安全) [4] - Data Agent通过会话助手 已为多家企业打造投顾智能体 帮助用户获取市场分析、追踪热点和研报内容 [4] 数字员工解决方案 - 数字员工方案覆盖六大场景 打造普惠型AI工具矩阵 [5] - 展业助手实现从"经验依赖"转向"AI驱动" 覆盖尽调全周期 [5] - 智能客服提升服务效率与合规性 智能风控用VLM替代传统OCR [6] - Chat BI突破数据使用技术门槛 报告撰写释放人力 代码辅助提升研发效率 [6] 生态合作 - 火山引擎与10家金融科技企业达成"金融AI原生应用联创伙伴"签约 共建金融智能新生态 [8] - 合作企业包括像素绽放、高伟达、感易智能等金融科技先锋企业 [8] - 通过技术落地与场景创新的双向驱动 加速金融行业智能化转型 [8]
从多模态融合到行业深扎,国内 AI 大模型三大发展方向解析
搜狐财经· 2025-07-07 11:36
技术深化方向 - 多模态融合成为大模型发展重点 科大讯飞的星火认知大模型通过综合判断语音、手势、行为、情绪等提供更自然交互 并首发汽车端侧星火大模型赋能汽车产业 字节跳动的豆包强化多模态能力 其视频生成模型Seedance 1.0 pro在国际评测中表现优异 未来大模型将更精准融合文本、图像、语音等多模态信息 [2] - 推理能力持续提升 字节跳动的豆包1.6-thinking在复杂推理、竞赛级数学等测试中跻身全球前列 多轮对话能力达企业级应用标准 百度文心一言通过引入外部知识源提升知识水平和回答准确性 [2] 应用拓展方向 - 行业深度赋能趋势明显 科大讯飞计划将星火大模型从通用走向行业 覆盖汽车、教育、医疗、智慧城市等领域 百度、阿里等公司也在金融、工业、政府、科研、电商领域探索定制化应用 [3] - 智能应用创新加速 字节跳动提出"互联网从APP时代进入Agents时代" 火山引擎方舟平台构建了服务Agent开发完整体系 催生他她它、推氪AI等创新产品 未来大模型将与新兴技术结合创造智能助手、创作工具等应用 [3] 生态建设方向 - 开源共享成为重要趋势 2025年以来字节豆包、百度文心、阿里通义千问等推出开源模型 商汤科技发布LazyLLM开源框架 MiniMax开源新一代MiniMax-01系列模型 通过开源吸引开发者提升模型性能 [4] - 产业生态构建持续推进 国内出台政策支持AI产业发展 上海模速空间覆盖算力层、数据层、基础大模型层和应用层全产业链 未来研发机构将加强与上下游合作构建完整产业生态 [4]
携手火山引擎,顺丰科技用AI重塑供应链
财富在线· 2025-07-04 14:35
大模型在物流供应链的应用 - 大模型在长链路、复杂协作的供应链场景中提效显著,顺丰科技与火山引擎合作推出物流垂直领域大模型「丰语」[1] - 「丰语」系列包含语言、语音、多模态三大模型,覆盖市场营销、客服、收派、国际关务等20+业务场景[2] - 通过火山引擎AI云原生推理套件ServingKit实现模型部署到推理全链路提效,支持千万级订单的高并发处理[1][4] 丰语大模型的技术优化 - 火山引擎训练框架veTuner使模型训练性能较开源框架提升超30%,强化学习库veRL最高实现64.9% MFU,降低训练成本[4] - xLLM推理框架通过PD分离部署与动态流量调度,将模型吞吐能力提升最高达5倍[4] - 算子融合和镜像优化技术使DeepSeek V3/R1满血版部署效率达到"即日达"标准,相同SLO下吞吐显著提升[4] 多模态大模型的具体应用场景 - 语言模型应用:国际地址拆分、HS编码查询、定制化推荐、智能调度AI等[3] - 多模态模型应用:图像质检、数字人、视频分析、文图生成(如丰源绘画)、人车货识别等[3] - 语音模型应用:声纹受理、语音质检、智能报表生成等[3] 未来发展方向 - 2025年计划加速智能体落地,深化物流场景的AI生产力探索[4] - 持续优化训推一体架构,覆盖更多业务板块场景[2][4]
AI基建市场排名出炉:华为云不敌阿里云,火山引擎冲进前三
南方都市报· 2025-07-01 19:22
7月1日,根据 IDC的最新报告,2024年全年阿里云AI IaaS市场份额达23%排名第一,超过第二名和第三名总和。 华为云占比10%排名第二,火山引擎占比9%排名第三,中国电信占比8%排名第四,腾讯云、百度云和aws中国、 商汤皆占比7%。这也是IDC首次以AI IaaS进行数据统计。 在今年3月的2024年第四季度及全年业绩年报媒体沟通会上,腾讯高管提到,2024年腾讯年度资本支出达107亿美 元,相当于同期收入的大约12%。其中第四季度资本支出增加十分显著,因为腾讯在这一季度购买了很多GPU。 2025年腾讯计划进一步增加AI相关资本支出,预期资本支出占收入的比例为低两位数百分比。 采写:南都记者 林文琪 聚焦到生成式AI IaaS(GenAI IaaS)市场中,报告显示阿里云取得模型训练和模型推理市场的双项冠军。另外, 2024年模型训练消耗的生成式AI IaaS资源约为模型推理的3.25倍,随着"爆款"大模型应用的出现,IDC预计AI算力 有望在2025年进入"训推"拐点,推动AI算力需求从训练驱动过渡到推理驱动。IDC认为,推理场景的爆发将为国 产算力未来发展带来更多市场机会,互联网、运营商、自 ...
算力需求井喷,英特尔至强6如何当好胜负手?
半导体芯闻· 2025-06-27 18:21
AI算力架构变革 - AI基础设施正从"GPU为中心"转向"多设备协同"的异构计算架构,传统GPU算力架构面临边际效能递减挑战[2][7] - 大模型负载需要CPU和GPU协同配合,涉及数据采集、清洗、标注、RAG等多个环节,要求企业同步升级两类算力资源[4][5] - 英特尔提出基于异构的四大解决方案:数据预处理CPU流水线(训练性价比提升10%)、投机执行CPU+GPU方案、KVCache QAT压缩优化(Qwen2.5-14B首词延迟下降)、稀疏感知MoE CPU卸载(DeepSeek-R1并发数从11提升至27)[6][7] 至强6处理器技术突破 - 至强6采用模块化设计,I/O与计算模块解耦,支持灵活扩展(最高288核),BIOS框架升级实现性能核与能效核动态调度[10] - 性能飞跃:内存带宽提升2.3倍(12通道DDR5达6400MT/s),PCIe带宽提升1.2倍,跨插槽通信提升1.8倍,支持CXL 2.0[12][13] - 内置硬件加速模块:单个QAT引擎可替代6.8个CPU核心,4个QAT模块释放32核资源;AMX加速器提升AI任务效率[13] - 场景性能:6900系列性能提升2倍,能效比提升1.4倍;云计算场景实现2倍核心密度,60%能效提升,30% TCO节省[13][14] 芯云协同实践 - 英特尔与火山引擎合作推出第四代ECS实例,CPU频率提升20%,网络存储带宽最大提升100%,IOPS/PPS提升30%[18][20] - RAG应用全链路优化:利用AMX加速器使任务耗时最多减少90%,CPU推理吞吐能力提升114%[20][22] - 双单路架构增强稳定性,新增支持Jumbo Frame、TDX机密计算及新型SSD云盘[20] 本地化部署方案 - 推出锐炫GPU+至强CPU的高性价比一体机,提供纯本地部署(数据不出域)和云边协同部署两种架构[24][27] - 锐炫Pro B60配备24GB显存,支持32K-128K token上下文窗口,通过EAP软件封装实现模型"零改造"迁移[28] - 集成Grafana监测系统,提供完整可观测性,支持与企业现有运维体系集成[28]
AI时代的领导力变革,可能会比以往的革命来得更猛烈些
36氪· 2025-06-26 10:46
2025年,全球企业正经历一场由AI驱动的"领导力大考"。 微软凭借Copilot重构生产力生态,华为在算力封锁下逆势突破万亿营收,字节跳动以算法领导力颠覆内容产业。 当DeepSeek等大模型成为员工的"第一顾问",当Z世代管理者天然拥抱人机协作——传统领导力的围墙正在崩塌。 随着人工智能深度融入人类智能,传统组织向智能组织发展成为必然。领导者将面对人与机器结合的新形态组织。 领导力从未如此关键,也从未面临如此深刻的变革。当下企业领导者普遍面临的痛点是:领导者如何驾驭变局?传统领导力如何升级? 82%的青年领导者已开始"共生" 让我们先看一组数据。 谷歌Workplace在2024年11月的调查显示:82%的青年领导者在工作中使用AI,93%的Z世代每周使用两种以上AI工具。更让人震惊的是,98%的受访者相 信,AI将在未来5年彻底改变他们的行业。 这意味着什么?意味着你的年轻下属,可能已经有了一个比你更聪明的"顾问"。 我们在复旦大学管理学院进行的一项针对EMBA学员的持续跟踪研究更加耐人寻味。2024年8月,17.81%的企业高管表示"从不使用"AI。短短8个月后,这 个数字降到了8.89%。 图1企业 ...
国产智能终端AI能力再升级,火山引擎助力打造应用场景新可能
财富在线· 2025-06-19 17:27
从文本到图像,从音频到视频,在火山引擎覆盖文本、语音、图像等领域的强大模型家族的支持下,国 产智能终端产品的AI功能持续跃升。如今,搭载豆包大模型后的AI助手早已突破传统交互边界,从基 础的命令执行与语音通话,深度渗透到问答、闲聊、创作、视频通话等多元场景。这种能力的跃迁,标 志着AI助手正从"工具属性"向"智能伙伴"角色转型。 在智能手机图片编辑场景,荣耀AI助手「YOYO智能体」基于豆包大模型推出了"一语修图"功能,只需 语音说出"帮我把照片变清晰","帮我换个卡通风格滤镜"等修图指令,YOYO智能体便能基于语义理 解,智能完成AI场景扩图、AI图片换风格等个性化任务。 用户需求进阶,火山引擎助力智能终端AI体验跃迁 当AI技术加速演进,用户AI需求持续进阶:对智能终端的AI功能期待,正从"尝鲜体验"向"深层需求"跃 升,更倾向于兼具趣味性与高效性的智能服务体验。用户需求的升级,背后是AI技术实力的不断进 化、应用场景的不断落地。 根据IDC发布的《中国公有云大模型服务市场格局分析,1Q25》报告显示,火山引擎以46.4%的绝对优 势,稳居2024年中国公有云大模型市占率榜首。截至今年5月底,火山引擎豆包 ...
大厂做AI,必败吗?深度拆解字节跳动AI帝国:从豆包到火山引擎,字节能否大象转身?
混沌学园· 2025-06-18 18:05
字节跳动AI领域逆袭 - 公司旗下豆包大模型1.6以"史上最低价格+顶尖推理能力"杀入企业级市场,火山引擎在中国公有云大模型调用量市场份额达46.4%,超过百度与阿里之和[1] - 豆包模型日均调用量飙升至16.4万亿tokens,是发布初期的137倍,在全球AI应用5月产品榜排名第四,IOS下载排行第二[1] - 公司从AI领域"边缘玩家"通过激进策略和快速迭代,在不到一年时间内逆袭老牌云厂商[1] 商业视角:成本革命 - 火山引擎首创按输入长度分段定价,0-32K区间每百万Tokens输入0.8元,输出8元,平均成本约2.6元/百万Token,较前代降低63%[6] - 2024年下半年中国云上大模型调用量从6月963亿次暴增至12月9522亿次,半年增长近10倍[7] - 公司通过持续降价策略推动市场扩张,豆包1.0定价比行业平均便宜99.3%,视觉模型处理284张图片仅需1元,较同行低85%[7] 产品视角:豆包App崛起 - 豆包App日活跃用户从2023年11月不足130万增长至2024年10月945万,超越百度文心一言成为中国日活最大AI产品[8][10] - 2024年5月全球AI产品榜显示豆包MAU达118.25M,排名第四,月增长10.23%[11] - 公司通过抖音、今日头条等渠道为豆包导流,并集成进飞书等办公产品,形成"流量+产品"组合拳[11][12] 组织架构调整 - 2023年下半年公司重组AI研发体系,创建Seed部门专注大模型研发,Flow部门专注AI应用,赋予极高优先级[16] - 从内部调配顶尖人才支援AI战场,包括抖音灵魂人物陆游、原抖音CEO张楠等[16] - 从外部引进Google、阿里等公司顶尖AI人才,成立Seed Edge长期研究组攻关AGI课题[17] 技术能力建设 - 公司AI组织架构形成Flow应用团队、Seed模型团队和Stone支持团队"三驾马车"分工[21] - 豆包大模型仅用一个季度达成"整体效果追平GPT-3.5"的目标[21] - 公司战略从内容分发转向成为智能时代基础设施提供者,强调"Build"能力建设[25]
100%加密计算+端云延迟无感:火山引擎如何实现AI安全与性能兼得?
财富在线· 2025-06-18 10:56
行业趋势 - 智能终端已成为用户隐私数据的重要载体 涵盖照片 视频 备忘录 日程 文档及APP本地缓存等多种数据类型 [1] - AI问答 AI生成 AI搜索等场景需将部分数据上传至云端 涉及复杂的个人数据收集 传输 处理和存储流程 [1] - 2025年智能终端行业将迈入"AI原生"时代 端云协同环境下的隐私保障成为核心挑战 [2] 技术解决方案 - 火山引擎与联想合作推出联想个人云1.0 通过TEE加密 可信传输和机密容器技术构建端云协同安全壁垒 [2] - 方案支持全链路100%加密计算 用户prompt在完全加密环境中传递 开发者可通过透明自证机制验证计算过程安全性 [4] - 火山引擎AICC机密计算平台为努比亚打造端到端数据安全防护体系 保障传输与模型推理全流程隐私合规 [4] - 平台实现安全与性能兼得 端到端用户感知延迟接近明文模式 大模型推理效率几乎无损 [6] 合作与生态 - 火山引擎与联想合作推出"可信混合计算方案" 安全能力从终端延伸至云端 [7] - 火山引擎AICC机密计算平台具备高开放性与终端适配性 未来可搭配RAG Agent等AI能力构建全生命周期安全体系 [7] - 平台合作智能终端厂商数量持续增长 有望为更多AI终端提供安全服务环境 [4][7] 技术突破 - 行业长期面临安全与性能的"悖论" 安全措施增加计算开销 性能优化需减少中间环节 [5] - 火山引擎通过深度技术优化 在架构 算法和硬件层面实现创新 破解安全与性能兼得难题 [6]
火山引擎解锁AI应用升级密码,打造智慧生活新体验
财富在线· 2025-06-18 10:42
在当下数字化浪潮中,AI正深度渗透生活场景:智能生成个性写真、一站式制作时光剪影集等功能持 续释放便利价值。如今,随着用户需求从"可用"向"好用"、"实用"加速升级,这一转变对AI技术的实用 性提出了更高维度的要求。 当前,智能终端厂商纷纷加速AI能力集成,通过将AI技术深度嵌入产品矩阵中,持续拓展应用场景边 界,为用户打造更智能、更优质的AI使用体验。过去一年,豆包大模型成为千行百业的共同选择,备 受行业关注:截至2025年5月底,豆包大模型日均 tokens 调用量已超过16.4万亿,较去年5月刚发布时增 长137倍。尤其在豆包·文生图模型等多元大模型能力的助力下,火山引擎与智能终端厂商进行深度合 作,从 AI 创作方面拓展创意边界,为用户带来更具实用价值的 AI 新体验。 AI创作拓界,技术升维开启图像创作新体验 当用镜头记录日常成为生活标配,用户对"好照片"的需求正不断升级。尤其在AI技术席卷摄影领域的当 下,从影像创作到后期处理的全流程,都迎来深刻变革。依托豆包家族大模型的丰富能力,火山引擎能 从人物消除、美颜滤镜、相片风格化等多重技术维度,为智能终端注入更具实用价值的AI创作能力, 让影像处理更贴 ...