Workflow
多模态Agent
icon
搜索文档
Agent取代App、机器人“盲区”、RAG成本失控……2026 奇点智能技术大会首批议题发布
AI科技大本营· 2026-03-06 10:30
会议概览 - 2026奇点智能技术大会将于4月17-18日在上海举行,由CSDN与奇点智能研究院联合主办[1] - 会议旨在为一线技术决策者与开发者提供应对未来半年技术挑战的实战指南,议题覆盖AI技术全生命周期[2] - 会议将汇聚50余位技术专家,围绕大语言模型、多模态世界模型、AI Infra、AI原生应用等十二大专题展开深度分享[22] 具身智能与多模态感知 - 当前具身智能在暗光、遮挡或重工业等复杂场景下存在感知局限[6] - 北京大学许辰人教授将分享“多模态超视感知”范式,利用电、声、磁、射频等可穿透物理场模态,为AI开启“第六感”[7] - 网易伏羲陈广大将分享数据驱动算法在无人装载机中的应用,通过“世界模型+强化学习”实现7x24小时无人化作业,人效提升120%[7] 商业AI与决策智能 - 传统商业AI多止步于预测,而企业需要能进行反事实推演和博弈决策的AI[8] - 京东邓金秋将分享“Agentic Commerce”与商业世界模型,利用大模型语义先验结合时序动态与因果建模,刻画“决策—环境—结果”关系[8] - 商业AI正从预测驱动进化为基于Agentic AI的决策驱动,通过多智能体博弈与仿真推演最优策略[9] 数字生命与操作系统Agent - 当前Agent面临数据与反馈瓶颈,难以胜任复杂的跨应用任务[10] - 美团薛涛锋将分享EvoCUA架构,该项目以56.7%成功率登顶OSWorld榜单,通过“生成即验证”引擎与RFT动态去噪反思,使Agent能在万级沙盒中自我迭代[11] 垂直场景AI应用工程化 - 通用大模型在处理专业办公文档(复杂版式、多语种)和非线性创作流程(如视频剪辑)时能力不足[12] - 金山办公孙亚博将分享Monkey系列模型如何实现对复杂文档的像素级精准解析及端到端版式理解[12] - 小红书许思杰将分享如何设计状态驱动的调度机制,在OpenStoryline中实现可控、可工程化的智能视频创作闭环[13] - 商汤科技马林将分享AI PPT在线编辑系统的工程化实践,通过HTML结构化输出与自研渲染引擎,实现从“生成”到“可编辑”的跨越[15] AI算力优化与推理架构 - 大模型推理面临成本高、延迟大的挑战[16] - 亚马逊云科技杨扬将探讨通过Inference-Free稀疏搜索、Graph RAG等技术平衡效果、速度与成本,并利用Claude Code对性能场景进行自动化优化[16] - 趋境科技杨珂将分享Mooncake的分离式架构,通过P/D分离、全局KVCache复用与弹性专家并行,支撑Token量的爆发式增长[16] - 清微智能楼群芳将分享可重构计算超节点方案,通过芯片-系统-软件三层可重构设计,动态适应AI算力需求[17] AI原生研发与架构 - 企业关注如何将AI编码从单点辅助提升至体系化协同,并思考在万人团队中代码资产的核心价值[18] - 快手华剑侃将分享如何在万人规模研发组织中建立L1-L5智能研发能力分层,实现体系化效率跃迁[23] - 腾讯云汪晟杰将通过CodeBuddy等工具案例,分享AI如何在实际业务中重塑团队协作[23] - 行业专家黄佳将提出覆盖感知、记忆、推理、行动、反思、协作的六维Agent设计模式体系,以构建可靠Agent[20] 模型底座与基础设施 - 行业专家探讨大模型如何从“辅助工具”进化为软件开发的“基础设施”,以及Agent如何重塑编程未来[23] - 会议演讲嘉宾包括来自新浪微博、小红书、微软、京东、百度、智源研究院等公司的AI研发负责人与首席科学家[29]
独家|VUI Labs宇生月伴完成数千万元天使+轮融资,同创伟业领投,打造行业领先的情感语音大模型和多模态Agent
Z Potentials· 2026-02-28 10:12
融资与资金用途 - VUI Labs(宇生月伴)宣布完成数千万元天使+轮融资,由同创伟业领投,老股东靖亚资本、小苗朗程持续加注,心流资本FlowCapital担任长期财务顾问[1] - 公司半年累计获得近亿元投资[1] - 所募资金将用于核心模型迭代、产品和商业化落地、全球人才引进及Voice Agent平台建设,以夯实公司在“超低延迟+情感交互+多模态智能体(Agent)+端侧模型”上的综合壁垒[1] 公司背景与使命 - VUI Labs是语音人工智能领域的先行者,专注于打造全球领先的多模态情感对话语音大模型与语音智能体平台[2] - 公司由教育部长江学者、上海交通大学计算机学院特聘教授和人工智能学院双聘教授、听觉认知与计算声学研究中心负责人钱彦旻教授创办[2] - 公司创始人兼CEO梅杰是一位连续成功创业者,毕业于浙江大学竺可桢学院创新与创业管理强化班[2] - 公司致力于构建全链路情感交互语音技术能力,以“让AI听懂情感,让交互充满温度”为使命,打造下一代AI原生交互入口,为用户提供更智能、更自然的语音交互体验[2] 核心技术:Luna系列模型 - 基于在端到端语音模型的深厚积累(团队于2019年在全球第一个提出端到端语音模型训练),公司自研了多模态情感交互语音大模型Luna系列[3] - Luna-1作为全球首个端到端情感语音交互模型,在VoiceBench权威测评中取得79.05的高分,属于行业第一梯队,语音对话延迟仅1.4秒,达到行业领先水平[3] - 公司覆盖全栈语音模型技术,在超低延时和丰富情感语音交互、丰富情感语音生成、多说话人理解等方面全面对标国内外一线语音模型厂商,如Google、ElevenLabs、OpenAI、HumeAI和Sesame等[3] - Luna-TTS-1语音合成模型延迟低至200毫秒,在自然度、可控性、稳定性方面稳居TTS行业第一梯队[4] - 公司依托自主可控的高吞吐数据管线持续生产高质量语音数据,通过深度场景化优化实现稳定可靠的输出效果,无需依赖“抽卡式”生成[4] 核心技术:同声传译模型 - 团队在同声传译模型领域提出的SimulMEGA无监督策略学习框架,将基于前缀的训练与一个混合专家精炼器结合,以隐式方式学习有效的读/写决策,且推理阶段不引入额外开销[5] - 基于该框架的Luna-Live-Translation-1是全球首个可端侧部署的同声传译模型,模型大小仅500M,延迟低至1.5秒,支持数十种语言互译[5] - 该模型已在某知名手机品牌的欧洲版本上落地商业应用[5] 产品:语音智能体SaySo - 公司于2026年1月推出首个C端语音智能体产品SaySo,定位为智能语音助手[6] - SaySo能够精准理解上下文语境,优化输出内容,消除创意构思和表达落地之间的鸿沟[6] - 公司构建了完整的语音智能体技术框架,涵盖多步规划、工具调用、长时记忆与智能体编排等核心能力,实现从语音交互到任务执行的全链路打通[6] - 与传统的语音转文字工具不同,SaySo被定位为懂思考的合作者[7] 产品表现与用户反馈 - 在早期测试阶段,SaySo展现出远超预期的用户粘性,正迅速演变为核心生产力界面[11] - 用户78%的文字产出已由其完成,横跨近50个主流应用,周处理的语音转文字生成量近千万[11] - 仅6周,中位数用户的键盘依赖度即断崖式降至20%,绝大部分数字化工作流已完全交由语音智能体接管[11] - 早期用户给予极高好评,有用户表示其体验“就像真正拥有了《钢铁侠》里的贾维斯”[7] - 有资深内容创作者分享,过去需要1小时完成的稿件,通过口述与SaySo协作不到10分钟就能搞定,且生成的文本完全不需要二次修改,可一键分发到各大社媒平台,帮助其在一周内收获了“几十万”的爆款流量[7] 战略愿景与行业观点 - 公司创始人钱彦旻教授表示,自然语言正在成为新的编程语言,但键盘逐渐成为束缚人类表达效率的枷锁,公司致力于推动语音成为下一代人机交互的核心界面[12] - 公司通过端到端情感语音交互模型、高表现力语音合成模型、低延迟同声传译模型、多人对话语音理解模型以及Skill-based Voice Agent Framework,为VUI的落地与规模化提供关键基础设施[12] - 投资方同创伟业认为,下一代人机交互界面的核心技术在于语音,语音交互的核心在于时延与情感,VUI Labs在这两方面的基础技术都非常优秀,超越Sonic 3与Elevenlabs[13] - 投资方靖亚资本指出,基于语音大模型的多模态Agent在To B和To C的应用场景中非常有价值,并举例海外市场ElevenLabs的ARR已突破3.3亿美金,估值超过110亿美金,与SaySo相似的Agent应用Wispr Flow估值超过7亿美金[13] - 投资方小苗朗程认为,语音交互作为AI时代全新的核心交互方式与重要信息入口,具备广阔的市场增量空间[14]
融资35亿后,Kimi神秘模型现身竞技场
量子位· 2026-01-05 13:00
神秘模型Kiwi-do的发现与推测 - 一个名为Kiwi-do的神秘模型在大模型竞技场出现,引发关注 [1] - 该模型自报家门,声称来自月之暗面Kimi,训练数据截止到2025年1月 [2] - 有网友指出Kiwi-do在竞技场中表现出一些有趣的结果 [3] Kiwi-do的身份推测与测试 - 最早发现者对比了Kiwi-do与已上线模型K2-Thinking在SVG绘图上的表现,两者结果有明显差别 [4][8] - 有网友猜测Kiwi-do可能是一个小参数模型 [12] - 发现者联想到Kimi曾在AMA活动中提及将发布VL模型,并使用VPCT基准测试Kiwi-do [13][15] - Kiwi-do在视觉物理理解测试中正确解决了所有问题 [16] - 基于测试表现,博主与网友推测Kiwi-do很可能就是AMA中提到的K2-VL模型 [17] - 有评论认为Kimi的新模型通过VPCT测试将改变多模态Agent的格局 [18] Kimi的新模型发布计划 - 根据《科创板日报》消息,Kimi计划在2025年一季度上线多模态新模型,型号可能是K2.1或K2.5 [19] - 此前AMA提到的K2-VL也是多模态版本,因此可能与计划发布的新模型是同一模型的不同代号 [20] Kimi的融资与资金状况 - 2025年末,Kimi完成了5亿美元(约35亿人民币)的C轮融资 [21] - 本轮融资由IDG领投,阿里、腾讯、王慧文等老股东进行了认购,投后估值为43亿美元 [22] - 融资后,Kimi的现金储备达到100亿人民币 [23] 融资用途与公司战略 - 融资资金将用于“激进地扩增显卡”,以加速K3模型的训练和研发 [24] - 公司的远期目标是成为世界领先的AGI公司 [25] - 整个大模型行业算力成本高昂,需要持续融资维持,同为“六小虎”的MiniMax和智谱选择了IPO并提及算力扩张 [25][26] - Kimi在融资方式上依然看好一级市场,不急于IPO,因其B/C轮融资额超过了许多IPO募资和上市公司定向增发 [27][28] - 未来公司也会将上市作为加速AGI的手段,择机而行 [29] K3模型的发展目标 - K3模型的目标是在预训练水平上追平世界前沿模型,并通过技术改进使其等效FLOPs提升至少一个数量级 [32] - 旨在通过垂直整合训练技术和产品品味,让K3成为更“不同”的模型,提供其他模型不具备的全新用户体验 [32] - 在产品和商业化上聚焦Agent,不以绝对用户数量为目标,而是追求智能上限,创造更大的生产力价值,并实现营收规模的数量级增长 [32]
全球大公司要闻 | 摩尔线程首次披露GPU路线图
Wind万得· 2025-12-22 06:35
热点头条 - 字节跳动发布豆包大模型1.8,进军多模态Agent领域,并推出Seedance1.5Pro视频生成模型,实现毫秒级音画同步,企业用户12月23日起可通过火山引擎API接入,同时公司正推进与vivo、联想、传音等硬件厂商开展AI手机合作,并宣布大幅提高人才薪酬和期权激励力度 [2] - 长安汽车获得国内首块L3级自动驾驶专用正式号牌,标志着公司率先开启L3级自动驾驶时代,中国成为继德国之后第二个为L3放行的国家,且将成首个成规模放行L3的国家 [2] - 摩尔线程发布新一代GPU架构“花港”,算力密度提升50%,效能提升10倍,并支持从FP4到FP64的全精度计算 [3] - 软银集团正争取在年底前完成对OpenAI的225亿美元融资承诺,并将牵头联合十余家日本企业开发国家人工智能系统,总价值约3万亿日元(约合190亿美元),计划汇集约100名专家开发日本最大的基础人工智能模型 [3] 大中华地区公司要闻 - 贵州百灵因2019-2021年及2023年多期年报存在虚假记载,遭证监会贵州监管局重罚,拟对公司及10名责任人罚款共计2560万元,董事长姜伟被采取10年证券市场禁入措施,公司股票12月23日复牌并被ST [5] - 阿里巴巴旗下钉钉启动代号为“D计划”的秘密项目,涉足AI硬件领域,被猜测将推出类似“豆包手机”的智能硬件产品 [5] - 青岛港拟合计投资157亿元建设董家口港区两个码头工程,以提升货物吞吐能力和运营效率 [5] - 健康元控股子公司NS-041片新增抑郁症适应症获临床试验批准,该药物为国内唯一同时开展癫痫和抑郁症临床研究的KCNQ2/3靶向药物 [5] - 智谱冲刺“全球大模型第一股”,即将登陆港股,招股书显示2022-2024年收入分别为5740万元、1.245亿元、3.124亿元,年复合增长率130% [6] 美洲地区公司要闻 - OpenAI截至今年10月已将其“算力利润率”提升至70%,该指标在2024年底仅为52%,在2024年1月时,目前的利润率几乎是当时的两倍 [8] - 耐克预计第三财季营收将录得较低个位数下降,反映出消费需求疲软及市场竞争加剧的影响 [8] - 特斯拉埃隆·马斯克获得重大法律胜利,特拉华州最高法院恢复其价值约550-560亿美元的薪酬方案 [8] - 美敦力糖尿病业务单元以“MiniMed”为名提交IPO申请,该业务2025财年销售额27.5亿美元,占公司总营收8%,分拆后预计提升美敦力整体毛利率50个基点 [8] 亚太地区公司要闻 - 三星电子推出全球首款2纳米工艺移动应用处理器Exynos 2600,已开始量产并计划搭载于明年2月推出的Galaxy S26旗舰手机,该芯片AI算力较上一代提升113% [10] - 丰田汽车广汽丰田全新雷凌L正式上市,售价12.98万元起,一汽丰田新款卡罗拉同步上市,厂家直销价9.9万元起,此外丰田投资扩建美国加州氢能网络 [10] - 三菱日联金融集团收购印度Shriram Finance 20%的股份,截至12月,2025年涉及日本公司的交易额已接近3500亿美元,创历史新高 [10] - 日本电报电话公司以超过160亿美元价格收购NTT Data集团 [10] - SK电讯因4月用户信息泄露事件,被韩国消费者院要求向58名索赔用户每人赔偿10万韩元(约合人民币475元) [11] - 现代制铁宣布投资优质废钢处理产能,以强化原材料供应链,助力钢铁生产降本增效 [12] 欧洲及大洋洲地区公司要闻 - 宝马集团与德国Encory合作的电池回收能力中心启用,采用创新直接回收技术,年处理量达数十吨,同时其第三代燃料电池系统将于2028年量产,与丰田联合开发,功率密度提升且体积减少25% [14] - LVMH集团再次投资名人美妆品牌,持续加码高端美妆市场布局 [15] - 瑞典Stegra公司(前身为H2 Green Steel)绿色板材钢厂建设项目中,电解槽安装进度已超过50%,项目计划于2026年投产,配备产能210万吨/年的直接还原铁工厂,计划2027年全面投产 [15] - 西班牙海德姆钢铁公司推进普埃尔托拉诺基地的绿色钢厂项目,包含一座150万吨/年的直接还原铁工厂,投产日期从2026年调整为2027年 [15] - 瑞典GreenIron公司即将在桑德维肯工业园区启用一座直接还原铁工厂,目前处于商业运营前的最后阶段,工厂采用专利零排放技术,以绿氢为还原剂,铁矿石处理量约3万吨/年 [15]
火山引擎FORCE大会追踪(1):豆包1.8/Seedance1.5Pro发布
海通国际证券· 2025-12-21 21:32
报告行业投资评级 * 报告未明确给出行业投资评级 [1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18] 报告的核心观点 * 火山引擎通过发布豆包大模型1.8、音视频模型Seedance 1.5 Pro以及配套的企业平台与定价方案,构建了“模型-平台-定价”一体化的竞争壁垒,旨在系统性降低企业AI规模化部署的门槛与总拥有成本,推动智能体从试点走向规模化部署 [1][4][17] 根据相关目录分别进行总结 豆包大模型表现与升级 * 截至2025年12月,豆包大模型日均token使用量突破**50万亿**,同比增长超**10倍**,服务超**100家**万亿级企业客户,表明模型已在生产环境中实现规模化验证 [1][13] * “50万亿日均tokens”是一项反映实际业务负载、服务等级协议及成本结构的经营指标,表明其已超越“可演示”阶段,进入高并发、长周期的企业生产环境 [2][14] * 豆包1.8的升级重点并非单纯提升文本生成能力,而是系统性增强多工具调用、复杂指令的稳定执行以及操作系统级智能体的可操作性,聚焦解决智能体规模化落地的“最后一公里”问题 [2][15] * 豆包1.8通过将视频理解帧数翻倍并提供长视频分层理解方案,为质量检测、教育培训、安防巡检、门店运营等高价值场景提供了工程化、可集成的能力接口 [2][15] Seedance 1.5 Pro音视频模型 * Seedance 1.5 Pro通过原生音视频联合生成架构实现**毫秒级**音画同步与多语言口型适配 [1][13] * 其“Draft样片”机制可提升约**65%**的创作效率,有效缓解了AI视频生成中输出不稳定、需反复调整的痛点 [1][13] * 该技术将高精度音画同步转化为稳定可交付的方案,有望推动品牌营销、电商内容、短剧等领域将生成式视频纳入标准化、规模化生产流程 [3][16] * 其能力已在豆包、即梦AI等个人端产品完成用户体验验证,并通过企业端API开放集成,形成了从消费端验证到商业端部署的完整商业化路径 [3][16] 企业端支持体系与竞争策略 * 火山引擎推出AgentKit/HiAgent平台,着力解决企业在权限管理、身份认证、可观测性、效果评估及系统运维等环节面临的系统性部署与集成成本 [1][4][17] * 火山引擎推出“AI节省计划”,通过承诺消费换取阶梯折扣的机制,将大模型调用从零散试用转变为可预算、可统筹的集中采购方式,有助于推动AI调用从“项目制费用”纳入企业“常态化IT支出” [1][4][17] * 火山引擎正通过“模型能力+平台工具+定价机制”的组合策略,系统性降低企业AI规模化部署的门槛与总拥有成本,旨在形成更高粘性的客户锁定效应 [4][17]
豆包大模型日均调用量突破50万亿tokens 火山引擎深化AI时代Agent生态变革
新浪财经· 2025-12-20 04:27
核心观点 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro,其大模型在多模态理解、生成及Agent能力上已跻身全球第一梯队,并展示了强劲的用户增长与商业化进展 [3] - 公司通过技术创新与成本优化,致力于降低人工智能技术门槛,推动AI普惠化落地,并认为大模型市场未来增长空间广阔,焦点在于共同开拓而非存量竞争 [3][6] - 公司正构建从模型能力到AI云原生基础设施的全面能力,以支持企业级Agent从开发到规模化运营,加速AI在各行各业的深度落地 [9][10] 豆包大模型1.8的技术升级与能力 - 模型定位从知识库转向执行器,针对多模态Agent场景进行定向优化,增强了工具调用、复杂指令遵循及OS Agent能力 [3][4] - 多模态理解能力实现飞跃,单次视频理解帧数从640帧提升至1280帧,支持以低帧率理解超长视频并调用工具进行高帧率关键片段分析 [4] - 在视频运动理解、复杂空间理解、文档OCR能力方面均有提升 [5] - 支持256K长上下文窗口,可通过API进行上下文管理,以更好地支持长程Agent任务 [5] - 通过更大的图片转tokens压缩比和思考长度可调节优化,在提升效果的同时进一步优化了成本 [5] - 在多项公开评测中表现强劲,在视觉推理、通用视觉问答、空间理解及视频理解等任务中获最佳或接近最佳成绩,在通用智能体测评集BrowseComp上全球领先,数学与推理等基础能力接近全球顶尖通用模型 [6] 豆包大模型的商业化进展与市场策略 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 目前已有超过100家企业客户累计token使用量超过1万亿 [3] - 公司认为大模型市场明年规模能再扩大10倍,各方焦点在于携手开拓增长空间而非存量竞争 [6] - 发布了豆包助手API,将对话、思考、搜索等核心能力开放,帮助企业开箱即用或构建自定义豆包 [10] - 推出了业内首个全模型参与抵扣的AI节省计划,基于承诺用量提供阶梯式折扣,最高能帮助企业节省47%的成本 [10] 音视频创作模型Seedance 1.5 pro的创新 - 采用创新的原生音视频联合生成架构,能同时处理环境音、背景音乐和人声对白,实现毫秒级音画同步,解决了口型对不上、音画脱节的问题 [7] - 支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种 [7] - 在运动细节捕捉和人物情绪呈现上达到影视级标准,具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度专业运镜 [7] - 即将上线“Draft样片”功能,可生成低分辨率样片预览,据测算可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [8] - 个人用户已在豆包、即梦AI等平台可体验,企业用户自12月23日起可通过火山引擎API接入服务 [8] AI云原生架构与企业级Agent生态 - 传统的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成并围绕Agent开发与运营进行重构 [9] - 在企业Agent开发层面,全面升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [9] - 在企业Agent运营层面,推出了HiAgent智能体工作站,构建统一的企业AI任务调度中心,提供开箱即用的通用智能体并支持个性化定制,2025年累计服务数百家行业头部企业 [9] - 企业Agent应用正发生关键跨越:平均一家企业投产的智能体数量从2024年的几十个增至2025年的200多个,个别企业甚至超过千个;应用场景从to C娱乐延伸到to B的严肃生产场景 [10] - 小米集团案例显示,AI云原生架构帮助其手机业务将资源交付周期从一周缩短到10分钟以内,并帮助汽车业务提升训练稳定性和仿真效率,缩短算法迭代和上车周期 [9]
大厂多模态Agent能力激战正酣
证券日报· 2025-12-18 23:40
火山引擎产品发布 - 公司于12月18日发布豆包大模型1.8及音视频创作模型Seedance1.5pro [1] - 截至12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [1] - 目前已有超过100家企业客户累计token使用量超过一万亿 [1] 豆包大模型1.8技术升级 - 模型核心升级围绕打造更强大的Agent大脑展开,针对多模态Agent场景进行定向优化 [2] - 在复杂指令遵循、多轮交互及操作系统级别实际操作能力上实现系统性增强 [2] - 视觉能力底层升级,单次视频理解帧数提升至1280帧,并能以低帧率解析超长视频 [2] Seedance1.5pro音视频创作模型 - 模型采用原生音视频联合生成架构,实现毫秒级音画同步 [2] - 能基于画面景深和角色数量,精准匹配多人、多语言对话的口型 [2] 行业阶段与趋势 - 大模型行业已从参数竞赛进入以多模态Agent为核心的产业落地新阶段 [3] - AI价值从“单点生成”向“全链路执行”质变,具备在垂直场景中闭环完成任务的能力 [3] - IT基础设施从“功能驱动”向“智能驱动”范式重构,未来软件形态将是以Agent为主体的智能协同网络 [3] - 大模型应用正在跨越“成本与稳定性”的规模化门槛 [3] 市场竞争格局 - 主要云厂商已将战略重心调整至多模态智能体平台,竞争维度升级为全栈技术、开发生态与行业场景的立体化角逐 [4] - 阿里云在9月全面升级全栈AI体系,其通义旗舰模型Qwen3-Max在聚焦Agent工具调用能力的Tau2-Bench测试中取得突破性高分 [4] - 阿里云发布Agent开发框架ModelStudio-ADK和低代码平台ModelStudio-ADP,将Agent开发效率提升至“1个小时”开发一个深度报告项目的水平 [4] - 百度搜索于10月15日全面升级文心助手AIGC创作能力,支持8种模态创作,并支持一键调用多工具解决多场景问题 [4] 火山引擎竞争策略 - 公司全面升级企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [5] - 推出HiAgent智能体工作站,构建统一的企业AI任务调度中心,提供开箱即用的通用智能体并支持个性化定制 [6] - 推出业内首个“AI节省计划”,通过阶梯定价承诺最高可为按量付费企业节省47%的成本 [6]
豆包大模型1.8正式发布,拥有更强多模态Agent能力,豆包日均使用量超过50万亿,推出成本节省计划降幅达47%
硬AI· 2025-12-18 22:05
核心模型能力升级 - 豆包大模型1.8发布,具备更强的多模态Agent能力,拥有256K超长上下文和原生API上下文管理,擅长处理复杂多步任务 [2][3][5] - 模型在多模态理解上显著提升,长视频理解和安防监控场景能力增强,可辅助公司处理复杂任务并支持决策 [5] - 图像创作模型Doubao-Seedream-4.5同步发布,具备多图组合、创意写真、图片拆解、复杂组图、虚拟试穿与海报设计等能力 [3][5] - 视频生成模型Seedance系列发布,其中Seedance-1.0-Pro支持2至12秒1080P自由生成,可实现多人语言对白和多镜头叙事,提供影视级画质与原生音效 [3][7] 产品应用与生态构建 - 豆包大模型已落地智能硬件与语音助手,应用场景覆盖日常沟通、专业服务与报告解读、联网搜索等,配合边想边搜交互体验 [9] - 推出“火山方舟”推理代工服务,已接入Qwen、GLM、Seed-OSS等主流开源大模型,支持企业将精调后的模型一键Serverless部署,提供海量资源与专属推理加速 [11] - Viking系列产品亮相,包括VikingAI搜索与VikingDB向量数据库,配套多模态搜索支持文本、图像跨模态检索和个性化推荐,为Agent快速构建知识库 [13] - 发布企业级AI Agent平台AgentKit与TRAE(CN)企业版,已获NIO、PwC、汇付天下等头部客户采用,支持10万文件、5亿行代码超长上下文,可灵活配置企业规则与知识库 [15] 市场表现与成本优化 - 火山引擎平台“万亿Tokens俱乐部”成员已突破100家,豆包大模型日均使用量超50万亿Tokens,自发布以来增长417倍 [3] - 正式推出“AI节省计划”,采用一次性加入机制,覆盖豆包大模型、视频图像创作模型及第三方开源大模型,最高节省幅度达47%,支持全预付、零预付等多种付款方式 [2][3][18] - 公司认为明年模型行业市场可能再涨10倍,重点在于共同做大市场而非存量竞争,同时模型需要进一步降价以推动市场增长 [4] - 此次发布有望推动AI在企业生产场景中的落地应用,Agent开发工具的升级与生态扩容是关键 [3][18]
【周四美股盘前你需要了解的全球要闻】 通胀超预期放缓!美国11月核心CPI为2.6%,创2021年以来最低涨幅。 美国上周首申人数回落至22.4万人,好于预期。 特朗普:将很快宣布新任美联储主席,是一个认同低利率的人选。 5比4惊险过关!英国央行“鹰派”降息25个基点,称进一步判断宽...
搜狐财经· 2025-12-18 22:05
宏观经济与政策 - 美国11月核心CPI同比涨幅为2.6%,创2021年以来最低涨幅,显示通胀超预期放缓 [1] - 美国上周首次申请失业救济人数回落至22.4万人,好于市场预期 [1] - 英国央行以5比4的投票结果决定降息25个基点,但表示未来进一步宽松的判断将更艰难 [1] - 欧洲央行连续第四次维持利率不变,重申通胀将在中期回归2%的目标 [1] - 德国政府计划将2025年发债规模上调至5120亿欧元,以支持基础设施和国防建设 [1] 科技与半导体行业 - 美光科技(MU)美股盘前股价上涨超过14%,因芯片需求旺盛,公司最新业绩与未来指引均大幅超出市场预期 [1] - 豆包大模型1.8版本正式发布,该版本拥有更强的多模态Agent能力 [1] 人工智能与前沿科技 - 据报道,OpenAI正在商讨以约7500亿美元估值进行新一轮融资,融资规模可能达数百亿美元,最高或至1000亿美元 [1] - 特朗普媒体集团(DJT)美股盘前一度大涨逾30%,公司计划并购核聚变公司TAE,并计划于明年开始建设核聚变发电厂 [1] 生物医药行业 - 礼来公司宣布,其口服减肥药在临床试验中显示,患者从诺和诺德的Wegovy和礼来自身的Zepbound转用该口服药后,能有效维持减重成果 [2] 金融市场动态 - 对冲基金巨头Steve Cohen旗下的Point 72资产管理公司正考虑开启大宗商品交易业务 [3] - 亚太市场收盘涨跌互现,日经225指数收跌1%,上证综指收涨0.16%,恒生指数收涨0.12% [4]
港股尾盘走强!关注今晚大事件,明天日本央行或加息、股指期货交割
搜狐财经· 2025-12-18 17:04
市场行情与指数表现 - 上证指数当日涨幅为0.16%,创业板指跌幅为2.17%,市场成交额缩量至1.67万亿元 [5] - 港股市场尾盘走强,恒生指数涨幅为0.12%,恒生科技指数跌幅为0.73% [5] - 前一日科技股大涨,当日科技股大跌,行情波动剧烈 [1] 行业与板块涨跌 - 领涨行业包括银行(+1.97%)、煤炭(+1.89%)、石油石化(+1.25%)、国防军工(+0.90%)、轻工制造(+0.86%)[6] - 领跌行业包括电力设备(-2.22%)、通信(-1.58%)、电子(-1.51%)、综合(-1.13%)、机械设备(-0.64%)[6] - 领涨概念板块包括昨日连板(+5.64%)、SPD概念(+5.61%)、DRG/DIP(+3.43%)[6] - 领跌概念板块包括英伟达概念(-3.56%)、PCB(-3.08%)、苹果概念(-3.06%)、ChatGPT概念(-3.27%)[6] 美股AI与科技股动态 - 美股AI龙头前夜大跌,甲骨文跌幅超过5%,博通跌幅超过4%,英伟达与谷歌跌幅均超过3% [2] - 美联储理事沃勒表示,随着就业市场趋弱且通胀受控,美联储仍有50至100个基点的降息空间,但无需采取激烈行动 [1] - 前总统特朗普表示将任命一位认同低利率的新美联储主席 [1] - 纳指走势不佳,英伟达面临破位风险,市场期待“金发姑娘”叙事,后续通胀数据将影响降息预期和AI科技股表现 [3] 数据中心与AI基建项目 - 甲骨文规划容量达1吉瓦(GW)的数据中心项目受阻,其最大合作伙伴Blue Owl决定不再提供原计划高达100亿美元的资金支持 [1] - 该项目原计划为OpenAI提供服务,此次挫折不仅是项目暂停,更反映出甲骨文“第三方持有+长期租赁”的AI基建扩张融资模式在更紧的信贷环境下遭遇压力测试 [1] - 市场担心项目延迟可能扩散,并导致资本开支延期 [1] A股相关公司股价表现 - A股光模块、PCB板块当日调整,新易盛大跌超4%,工业富联跌超5% [2] - 当日跌幅居前的部分A股公司包括:工业富联(-5.24%)、东山精密(-6.22%)、生益电子(-5.91%)、沪电股份(-5.40%)[3] 大模型与汽车电池合约 - 火山引擎发布豆包大模型1.8,该模型日均使用量(Tokens)超过50万亿,自发布以来增长417倍 [3] - 福特汽车取消了与LG新能源签订的65亿美元(约合460亿元人民币)电动汽车电池合同,该金额相当于LG新能源去年总收入的37.5% [3] - LG新能源股价因此暴跌近9%,A股宁德时代股价当日也大跌近3% [3]