Workflow
多模态大模型
icon
搜索文档
豆包大模型日均token用量破50万亿后,火山引擎将主战场押注Agent
钛媒体APP· 2025-12-19 18:05
图片由AI生成 在历经"卷"价格争议、DeepSeek冲击波、Agent元年、端侧AI爆发后,豆包大模型又迎来了一次重要更 新。 12月18日,火山引擎正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。 据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长 超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。 火山引擎称,权威评测数据显示,最新版大模型在Agent能力、多模态理解等方面已跻身全球第一梯 队。 针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。据其介绍,该模型具 备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性 进展。 目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可通过火山引擎API接入Seedance 1.5 pro模型服务。 多模态能力增强,Agent进入"真干活"阶段 尽管多模态大模型需求旺盛,但行业仍处于早期,技术限制尚未完全突破,谭待也在会后的媒体采访中 表示,需保持耐心,模型会持续进化并逐步解锁新 ...
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-19 14:51
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”,但公司认为行业发展仍处早期,本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求,从而创造增量,例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP,而是会与现有载体共存互补,通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段,市场需求已存在但模型尚不完善,企业实践各具特色,这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善,公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP,本质都是由众多复杂Agent构成的集合,不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型(如Seedance 1.5 pro)的迭代标志着AI应用向更深场景发展,使AI能“看、听、说、做”,处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台,火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:GPU出货量已超过CPU,MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例,佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代(约三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署,固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此,公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]
AI 时代,如何定义电商营销新范式
搜狐财经· 2025-12-19 11:08
「用 AI 改造行业」这句话,电商行业已经喊了很多年。 但实际行动,却一直比较散点,停留在诸如「猜你喜欢」「以图搜图」这样单点的能力建设,不够深入,也难以实现真正的系统级 AI 升级改造。 核心瓶颈有二:一是早年 AI 技术尚未成熟,缺乏支撑全链路协同的底层能力;二是系统级改造需穿透产品核心逻辑,而新玩法、新能力的叠加必然推高 使用门槛。对普通商家而言,应对复杂系统往往需要投入高额人力物力,这让技术升级的规模化落地难以为继。 直到 2025 年,抖音电商率先用 AI 破局,解开了技术深度升级与商家门槛降低的两难问题。 而背后的秘密武器,正是不久前千川大会上重磅发布的「千川・乘方」:借助 AI 加持,以及平台的精准用户洞察,千川・乘方不仅能最大限度的简化商 家的操作,提升用户的内容体验,更做到了预判用户需求、激发用户需求、千人千策,以实现商家、用户、平台三方共赢。 那么千川·乘方到底是怎样一个产品?它是将如何撑起抖音电商高增长、用户体验、商家体验的之间的不可能三角的? 再看技术引擎。过去五年,虽然基于深度学习的推荐模型一直是电商搜推的核心,但是包括多模态 AI 在内的更多技术则一直停留在辅助工具层面,核心 原因 ...
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-18 23:26
除了外部独立APP的"反制",整个技术生态的成熟度也未做好迎接Agent全面接入的准备。对此,火山引擎智能算法负责人吴迪对第一财经记者表示,当前 行业对AI与Agent的探索仍处于摸索阶段。过渡阶段里,市场需求已存在,但模型尚不完善,企业实践也各具特色,这种状态预计还会持续三年左右。从生 态与第三方视角来看,行业"是否准备就绪"的核心在于Agent 工具的完善。吴迪透露,公司内部已投入大量精力,尝试将存量功能转化为Agent可识别、可 调用的工具。 谭待向记者补充称,不论是豆包AI助手还是APP等产品,本质都是由众多复杂Agent构成的集合。哪怕是搜索、垂直领域问答等不同功能,背后都对应不同 逻辑的Agent,而如今Agent待突破的两大核心挑战包括基础能力支撑与真实线上落地要求,满足健全性、运行时稳定性、弹性伸缩、数据安全等高标准。 2025年迈入尾声,海内外大模型头部厂商密集发力,包括Seedance 1.5 pro在内的多款多模态大模型更新迭代。对此,谭待分析称,多模态让大模型能像人一 样 "看、听、说、做",标志着AI应用往更深的场景走了。以前用大模型多为文字聊天,现在要让它办实事,不管是开车时的路况 ...
商汤科技预计配售31.5亿港元,用于多模态大模型研发和垂直场景商业落地
格隆汇· 2025-12-18 08:55
公司融资与资金用途 - 公司于2025年12月18日通过一般授权配售17.5亿股新B类股份,预计配售总额约为31.5亿港元 [1] - 配售获得六家机构积极认购,反映市场对公司长期价值与发展前景的信心 [1] - 配售所得款项将全面用于深化全栈人工智能领域的领先布局 [1] - 具体资金用途包括:打造行业领先的AI云、持续扩大并提高人工智能基础设施“商汤大装置”的规模与国产化比例 [1] - 资金将支持生成式人工智能的研发,以及基于多模态大模型衍生产品的开发与商业落地 [1] - 资金还将用于探索人工智能在创新垂直领域的技术融合与实践,例如金融、教育等行业 [1] 产品生态与技术进展 - 公司自12月15日启动“商汤产品发布周”,陆续推出多款基于日日新多模态大模型的产品应用 [2] - 发布行业首个创编一体、多剧集生成智能体Seko2.0,其背后的日日新Seko系列模型已完成与国产AI芯片寒武纪的适配 [2] - 推出面向办公场景的AI办公智能体小浣熊3.0 [2] - 推出面向电商运营场景的如影营销智能体 [2] - 即将亮相大晓机器人、咔皮家族等一系列兼具开创性与实用性的AI产品 [2] - 近期产品突破体现了公司在AI技术与实际场景融合方面的持续引领能力 [2]
商汤科技预计配售31.5亿港元,继续扩大大装置规模和提升国产化比例
金融界· 2025-12-18 08:35
公司融资与资金用途 - 公司于2025年12月18日通过一般授权配售17.5亿股新B类股份 [1] - 预计配售总额约为31.5亿港元 并获得六家机构积极认购 [1] - 配售所得款项将用于深化全栈人工智能领域布局 包括打造行业领先的AI云及扩大人工智能基础设施商汤大装置的规模与国产化比例 [1] - 资金将支持生成式人工智能的研发 以及多模态大模型衍生产品的开发与商业落地 [1] - 资金还将用于探索人工智能在金融、教育等创新垂直领域的技术融合与实践 [1] 产品生态与技术进展 - 公司自12月15日启动“商汤产品发布周” 陆续推出多款基于日日新多模态大模型的产品应用 [2] - 发布行业首个创编一体、多剧集生成智能体Seko2.0 其背后的日日新Seko系列模型已完成与国产AI芯片寒武纪的适配 [2] - 推出面向办公场景的AI办公智能体小浣熊3.0 以及面向电商运营场景的如影营销智能体 [2] - 即将亮相大晓机器人、咔皮家族等一系列兼具开创性与实用性的AI产品 [2] - 近期进展体现了公司在AI技术与实际场景融合方面的持续引领能力 [2]
商汤-W(00020)拟配售17.5亿股新B类股份 净筹约31.46亿港元
智通财经网· 2025-12-18 07:19
待配售事项完成后,假设配售股份悉数获成功配售,预期配售事项的所得款项总额及所得款项净额将分 别约为31.50亿港元及31.46亿港元。配售事项的所得款项净额将主要用于以下用途:(i)30%用于支持公 司的核心业务发展,包括打造行业领先的AI云、持续扩大公司人工智能基础设施商汤大装置的规模与 提高其国产化比例;(ii)30%用于支持生成式人工智能的研发,以及基于公司多模态大模型衍生产品的开 发与商业落地;(iii)20%用于探索人工智能在创新垂直领域的技术融合与实践,包括但不限于AI在金融、 教育等行业的落地;(iv)20%用作公司的一般营运资金。 智通财经APP讯,商汤-W(00020)发布公告,于2025年12月18日,公司与配售代理订立配售协议,据 此,配售代理已有条件及个别同意(作为公司的配售代理)尽力促使不少于六名承配人认购17.5亿股配售 股份,每股配售股份1.80港元的配售价较B类股份于2025年12月17日(即最后交易日及厘定配售价之日) 在联交所所报之收市价每股1.97港元折让约8.63%。配售事项项下的配售股份将相当于本公告日期已发 行B类股份数目约4.60%及已发行股份数目约4.52%。 ...
商汤-W(00020.HK)拟配售17.5亿股新B类股份 总筹31.5亿港元
格隆汇· 2025-12-18 07:07
待配售事项完成后,假设配售股份悉数获成功配售,预期配售事项的所得款项总额及所得款项净额将分 别约为31.50亿港元及31.46亿港元。配售事项的所得款项净额将主要用于以下用途:(i)30%用于支持公 司的核心业务发展,包括打造行业领先的AI云、持续扩大公司人工智能基础设施商汤大装置的规模与 提高其国产化比例;(ii)30%用于支持生成式人工智能的研发,以及基于公司多模态大模型衍生产品的 开发与商业落地;(iii)20%用于探索人工智能在创新垂直领域的技术融合与实践,包括但不限于AI在金 融、教育等行业的落地;(iv)20%用作公司的一般营运资金。 格隆汇12月18日丨商汤-W(00020.HK)发布公告,2025年12月18日,公司与配售代理(即国泰君安国际与 招银国际)订立配售协议,据此,配售代理已有条件及个别同意(作为公司的配售代理)尽力促使不少于六 名承配人认购17.5亿股配售股份,每股配售股份的配售价为1.80港元。配售事项项下的配售股份将相当 于本公告日期已发行B类股份数目约4.60%及已发行股份数目约4.52%。 ...
最近收到了很多同学关于具身方向选择的咨询......
具身智能之心· 2025-12-17 08:05
【具身智能之心论文辅导重磅上线!多模态大模型/VLA/强化学习/VLN/遥操作/数采/机器人仿 真/real2sim2real/端到端/diffusion等顶会方向1V1定制化辅导】 辅导区间 CCF-A到CCF-C 先看看具身的一些方向,vln、vla、强化、还有一些real2sim2real。很多小白不知道如何下手,选择强化学 习还是vla?传统slam还是vln?哪些方向需要较大算力,哪些不需要?除此之外,什么样的本体适合自己研 究,预算不够怎么办?仿真可以吗? 对正在从事slam的同学,vln和vla都是一个比较好的切入方向。如果有机械臂,展开vla是一个不错的选择。 除此之外,没有硬件的同学可以尽量在仿真里面或者使用低成本的so-100等硬件完成实验。也有很多低成 本的科研平台,比如移动操作平台。四足和人形更适合强化,vla难度过高。 剩下就是一些方法论的问题了,有好的idea至关重要。对很多新人研究者,一个好的idea需要踩很多次坑。 如果你还是新人,不知道怎么入门,可以看看我们推出的论文辅导。 论文辅导上线了 最近收到很多小伙伴的咨询,其中不乏大模型、传统机器人、机械方向的同学。 ✅ 顶会/顶刊 ...
商汤科技与寒武纪实现多模态大模型Day 0成功适配 激发AI前沿应用创新活力
智通财经网· 2025-12-16 19:25
智通财经APP获悉,12月15日,"国产芯片+国产模型"的技术协同发展迎来重要里程碑。在商汤科技 (00020)发布行业首个多剧集生成智能体Seko2.0的同时,寒武纪(688256.SH)也宣布完成对商汤自研日日 新Seko系列的适配,本次成功适配日期为"Day 0"。而寒武纪曾官方宣布在"Day 0"成功适配的仅有商汤 科技的"日日新"和DeepSeek,而Seko系列模型是行业内少数完成国产芯片适配的多模态模型系列。 双方共同推动国产AI应用生态发展,打磨更高效、更易用的阶梯式产品体系 此次与寒武纪在多模态生成模型的适配,是国产大模型与国产算力底座协同创新的重要实践,让更多开 发者和企业能够以更低成本享受到顶尖的多模态AI能力。 为高效释放国产算力潜能,商汤科技在其LightX2V框架中设计了强兼容的国产化适配插件模式,可快 速完成各类国产硬件的适配。同时,Seko系列模型与LightX2V框架在设计之初便引入了低比特量化、 压缩通信、稀疏注意力等硬件友好创新机制,已实现将推理性能提升3倍以上的显著效果。 适配完成后,双方的合作将进入更深化的优化阶段。未来,商汤科技与寒武纪将围绕多个方向展开联合 攻关。 ...