豆包1.5·视觉深度思考模型 - 财报，业绩电话会，研报，新闻

AI Agent

Software and Internet

DataAgent

国泰海通：发展Agent已成各大厂共识新规激发并购重组市场活力

智通财经网· 2025-05-19 15:54

AI技术迭代与产品发布 - 字节跳动火山引擎发布豆包·视频生成模型Seedance 1.0 lite 支持文生视频和图生视频生成时长5秒或10秒分辨率480P或720P [1] - 字节推出豆包1.5·视觉深度思考模型激活参数仅20B 具备多模态理解和推理能力在视频理解、视觉推理和GUI Agent能力方面处于第一梯队 [1] - 字节升级豆包·音乐模型同时正式发布Data Agent并升级Trae接入豆包深度思考模型以强大模型矩阵和智能体工具帮助企业打通业务到智能体的应用链路 [1] - 谷歌DeepMind发布通用科学AI系统AlphaEvolve 能自主生成并改进算法代码成功破解数学和计算机科学领域重大难题 [3] - AlphaEvolve可生成数百至数千个改进方案通过评估者算法筛选已用于改进下一代张量处理单元设计节省总计算资源0.7% [3] 行业商业化与整合趋势 - AI技术迭代和Agent落地在各大厂稳步推进 AI商业化持续发展 2025年将成为AI Agent规模化商业落地的元年 [1][3] - Agent落地已成为科技大厂共识未来发展速度有望进一步加快 [3] - 证监会修改《上市公司重大资产重组管理办法》建立重组股份对价分期支付机制注册决定有效期延长至48个月 [2] - 新设重组简易审核程序适用该程序的交易无需证券交易所并购重组委审议证监会在5个工作日内作出注册决定 [2] - 完善锁定期规则支持上市公司吸收合并鼓励私募基金参与并购重组此举有望激发并购重组市场活力 [2] - 证监会新规则有望加速计算机板块在数字化转型需求推动下的细分领域整合 [1][2]

火山引擎在沪发布系列新模型豆包大模型产业落地加速

新华财经· 2025-05-14 16:31

产品发布与升级 - 火山引擎发布豆包视频生成模型Seedance 1.0 lite 支持文生视频和图生视频实现影视级生成质量与速度突破适用于电商广告、娱乐特效、影视创作和动态壁纸等场景 [1] - 豆包1.5视觉深度思考模型具备多模态理解和推理能力在60个公开评测基准中有38个表现突出视频理解和视觉推理能力处于第一梯队已上线火山方舟平台 [1] - 豆包音乐模型升级支持英文歌曲创作和视频理解自动适配背景音乐用户可通过一张图或一句话创作十多种风格的高品质音乐目前已全量上线 [2] 行业应用与客户覆盖 - 豆包大模型已落地汽车、智能终端、互联网、金融、教育科研、零售消费等行业覆盖近4亿台终端设备、80%主流车企、70%重要性银行、数十家证券基金公司及多所顶级高校与科研院所 [2] - 巨人网络与火山引擎合作社交推理游戏《太空杀》接入豆包大模型升级AI原生玩法机器学习平台提供大模型训练和算力资源支持自研模型迭代优化 [2] - 礼来制药搭建专属AI应用开发平台通过火山引擎可视化工作流编排构建智能体应用于药物研发、疾病诊疗、学术沟通、销售培训和疾病教育等场景实现企业AI资产沉淀与持续运营 [3] 技术架构与生态战略 - 火山引擎推出Data Agent企业数据智能体具备主动思考、洞察、分析和行动能力融合企业内结构化与非结构化数据及互联网知识生成专业深度研究报告并支持智能营销 [2] - 火山方舟覆盖语言、深度思考、视觉、语音等多模型领域建立完整模型服务矩阵通过专业化模型应对差异化业务需求释放AI价值 [4] - AI落地需完成业务视角投资回报旅程、技术视角模型基建旅程和用户视角智能体全生命周期旅程模型、算力、数据和安全构成AI新基建火山引擎提供AI新基础四件套服务企业智能化提效 [3]

Software

Data Agent

Software

AI早报 | 软银对OpenAI的投资或降至200亿美元；月之暗面回应涉足AI医疗

Data Agent

搜狐财经· 2025-05-14 08:21

软银对OpenAI投资变动 - 软银对OpenAI的投资可能从400亿美元缩减至200亿美元因OpenAI取消转为营利企业的计划维持非营利组织控股结构 [2] - 原协议规定若OpenAI在2025年内未转型为公益公司(PBC) 软银有权将投资减半 [2] 火山引擎AI模型发布 - 火山引擎发布豆包视频生成模型Seedance 1 lite 支持文生视频、图生视频生成时长5s/10s 分辨率480P/720P [2] - 同步推出豆包1 5视觉深度思考模型升级音乐模型企业用户可通过火山方舟平台调用API 个人用户可在豆包APP体验 [2] 月之暗面AI医疗布局 - 月之暗面优化Kimi在财经、法律、医学等专业领域的搜索信源质量探索Agent产品方向 [3] - 公司回应称目标是为用户提供更可信、可靠的高质量专业回答 [3] 谷歌AI未来基金 - 谷歌启动"AI未来基金" 向初创公司提供DeepMind最新AI模型早期使用权、技术资源及股权融资 [3] - 获选企业有机会获得谷歌直接投资以加速AI规模化发展 [4] 腾讯混元开源多模态模型 - 腾讯混元联合多家机构开源UnifiedReward-Think模型为首个具备长链式推理能力的多模态奖励模型 [4] - 模型提升复杂视觉任务的评估准确性、跨任务泛化能力及推理可解释性开源内容包括完整训练脚本与评测工具 [4] 沙特HUMAIN与英伟达合作 - 沙特HUMAIN公司与英伟达合作建设AI工厂计划部署数十万块先进GPU 目标五年内推动沙特成为AI领域全球领导者 [4] - 双方将开展大规模培训项目为数千名沙特开发者提供AI、机器人、数字孪生等技术实践 [5] 智元机器人新设AI公司 - 智元机器人关联公司在四川成立智象启元智能科技注册资本1000万人民币业务含AI软件开发、系统集成等 [5] - 股东包括上海智元新创技术有限公司等三家实体 [5] 昆仑万维开源大模型 - 昆仑万维开源Matrix-Game大模型(17B+) 为工业界首个10B+级开源空间智能模型专注游戏世界交互式生成 [6] - 该模型基于Matrix-Zero世界模型针对开放式环境的高质量生成与精确控制设计 [6]

软银(US:SOBKY)

豆包视频生成模型Seedance 1 lite

Kimi

豆包视频生成模型Seedance 1 lite

苹果发布FastVLM模型，可在iPhone上运行的极速视觉语言模型；昆仑万维宣布开源Matrix-Game大模型丨AIGC日报

Kimi

创业邦· 2025-05-14 07:52

昆仑万维开源Matrix-Game大模型 - 昆仑万维正式开源17B+参数的Matrix-Game大模型该模型为Matrix-Zero世界模型中的可交互视频生成大模型是工业界首个开源的10B+空间智能大模型 [1] - Matrix-Game专为开放式环境中的高质量生成与精确控制设计面向游戏世界建模的交互式世界基础模型 [1] 百型智能推出外贸行业垂类Agent - 百型智能发布国内首个外贸行业垂类Agent AI外贸员Zoe 可独立完成外贸开发拓客全链路包括市场分析、客户寻找、精准筛选、开发触达、转化跟进 [2] - Zoe的转化率高出传统人工方式10倍以上 [2] 火山引擎发布豆包视频生成模型 - 火山引擎发布豆包视频生成模型Seedance 1 0 lite 支持文生视频、图生视频视频生成时长支持5s、10s 分辨率提供480P、720P [3] - 同时发布豆包1 5视觉深度思考模型并升级豆包音乐模型企业用户可在火山方舟平台使用API 个人用户可在豆包APP体验 [3] 苹果发布FastVLM模型 - 苹果发布FastVLM视觉语言模型专为高分辨率图像处理优化可在iPhone等移动设备上高效运行 [4] - FastVLM通过FastViTHD视觉编码器实现85倍编码速度提升为实时多模态AI应用铺平道路 [4]

上海证券报· 2025-05-14 02:45

大模型产品迭代策略 - 公司发布小而专、聚焦实用的大模型产品，强调"实用至上"和"小步快跑"的迭代思路 [1] - 相比追求"一鸣惊人"的大招，公司更注重多线程并进和可靠的商业场景落地 [1] - 新发布的豆包视频生成模型Seedance 1.0 lite参数规模小但实现影视级质量，支持文生视频、图生视频，生成时长5s/10s，分辨率480P/720P [1] 视频生成模型优化 - 通过优化语义理解能力提升指令遵循精度，增强对人物表情、衣着服装的精确控制 [2] - 模型针对电商广告、娱乐特效、影视创作等场景优化，帮助客户降低制作成本与周期 [2] - 视频生成速度大幅提升，兼顾效果、速度与性价比 [1] 视觉深度思考模型 - 豆包1.5·视觉深度思考模型激活参数仅20B，在60个公开评测基准中38个取得业内最佳表现 [3] - 模型具备强大多模态理解和推理能力，在视频理解、视觉推理、GUI Agent能力等方面处于第一梯队 [3] - 新增GUI Agent能力，可跨PC端/手机端完成复杂交互任务，如自动化检测App功能 [3] AI生态布局 - 公司AI生态已覆盖汽车、智能终端、互联网、金融等行业，服务4亿终端设备、80%主流车企、70%系统重要性银行 [4] - 推出Data Agent智能体，具备主动思考和分析能力，覆盖数据分析、智能营销等企业数据应用场景 [4] - 国内首款AI原生IDE产品Trae升级，支持通过MCP协议让AI主动调用外部工具 [4][6] 技术协议战略 - 公司积极布局MCP协议（模型上下文协议），称其为AI领域的"万能插座"，可降低开发成本 [5][6] - 专注于企业端垂类智能体开发，同时为开发者提供便利工具，推动行业标准化 [6] - 通过技术和资源复用实现内外服务统一，提升性价比 [4][6]

人工智能

豆包视频生成模型Seedance 1.0 lite

豆包视频生成模型Seedance 1.0 lite

Data Agent

Trae

接入MCP后，火山引擎更新Agent生态建设“工具包”

第一财经· 2025-05-13 21:22

火山引擎Agent生态布局 - 公司于5月13日公开Agent搭建工具及案例包括新视频生成模型Seedance 1.0 lite、视觉深度思考模型、企业数据智能体Data Agent及升级版音乐模型 [2][4] - 通过接入MCP协议构建Agent开发生态平台提供Agent Devops全流程支持（开发-运营-使用）并降低开发者门槛 [2][4] - 智能体当前处于对话框形态阶段预计2025年后将实现自主决策能力 [2] 行业竞争格局 - Agent生态建设集中于云服务大厂之间因公有云基础设施不完善及需依赖大厂插件生态 [2][4] - MCP协议接入成为海内外大厂近期密集布局方向生态竞争本质是插件与工具资源的竞争 [2][4] 技术实现与挑战 - 数据智能体Data Agent支持多模态输入通过语义解析引擎自动识别业务标签（如"营销效果评估""库存优化"） [3] - 大模型应用开发需规避"能力延长线"陷阱避免被基础模型能力迭代取代且数据基础决定应用效果下限 [2] - 智能体落地存在黑盒属性风险包括幻觉问题、不确定性与不稳定性需持续运营（评测/训练/调优）保障效果 [3] 开发者支持策略 - 云平台通过提供自有模型降低开发成本如视频生成与视觉深度思考模型促进生态整合 [4] - 利用云服务优势帮助普通开发者跨越AI开发门槛英特尔架构师指出复杂应用栈中数据核心地位不变 [2]