豆包视觉理解模型

搜索文档
字节跳动推出豆包大模型1.6 逻辑推理全面升级
凤凰网· 2025-07-30 14:32
根据简介,豆包大模型1.6有更强的推理能力,多模态理解能力,GUI操作能力和前端页面编程能力。 豆包视觉理解模型对视觉内容有更强的识别能力,更强理解和推理能力,以及更细腻的视觉描述能力。 豆包视频生成模型支持将用户的文本、图像生成高质量的视频,能够生成具备丰富的细节层次的影视即 视频。 凤凰网科技讯 7月30日,火山引擎官网推出豆包大模型1.6、豆包视觉理解模型、豆包视频生成模型三款 新的AI大模型。 另据报道,今天,在FORCE Link AI创新巡展 厦门站,字节跳动火山引擎发布豆包 图像编辑模型3.0、 豆包 同声传译模型2.0,豆包大模型1.6系列全新升级,并宣布开源扣子核心能力,发布企业自有模型托 管方案、Responses API等多个模型服务和工具产品。 生态开放层面,火山引擎宣布开源扣子核心能力,开放模型微调框架等技术模块以降低开发门槛;同步 推出企业自有模型托管方案,支持私有数据训练模型的安全部署与运维;上线 Responses API 标准化接 口,助力企业快速集成对话、生成等 AI 能力,缩短应用开发周期。 此次发布中,豆包 图像编辑模型 3.0 实现精度与效率双提升,支持高清细节修复、 ...
国产多模态模型持续加速迭代
太平洋· 2025-05-19 08:45
报告行业投资评级 未提及相关内容 报告的核心观点 - 近期AI文生图、文生音视频、3D生成模型持续迭代,生成质量和速度均有突破,有望提升用户体验,推动AI生成在多场景应用,加快产业落地 [6] - 建议关注AI+营销的天娱数科,AI+游戏的恺英网络、巨人网络、电魂网络,AI+影视的博纳影业等 [6] 根据相关目录分别进行总结 一周行情回顾 - 上周上证综指、传媒指数(中信)、深证成指、创业板指涨跌幅分别为0.76%、 -0.67%、0.52%、1.38% [11] - 上周传媒互联网板块涨幅最大的十只个股为*ST返利、迅游科技等,跌幅最大的五只个股为荣信文化、完美世界等 [13][15] 行业运行数据 游戏 - 2025年第一季度国内游戏市场实际销售收入857.04亿元,同比增长17.99% [16] - 2025年05月17日重点手游排名iOS畅销榜排名前三位分别为《和平精英》《王者荣耀》《无尽冬日》 [16] - 2025年4月微信小游戏买量投放排名前三的游戏分别为《无尽冬日》《向僵尸开炮》《英雄没有闪》 [23] AI - 2025年04月全球AI产品网页版访问量排名前三的分别为ChatGPT(53.1亿)、New Bing(14.5亿)、DeepSeek(4.69亿) [24] - 2025年04月国内AI产品网页版访问量排名前三的分别为DeepSeek(4.69亿)、纳米AI搜索(2.77亿)、豆包(0.54亿) [26] 电影 - 2025年至今内地电影总票房268亿元,05月17日单日票房6040万 [28] - 2025年05月17日电影综合票房排名前三分别为《水饺皇后》《猎金·游戏》《哪吒之魔童闹海》 [28] 电视剧 - 2025年05月15日CSM71卫视黄金剧场电视剧收视前三分别为《我家的医生》《我的后半生》《蛮好的人生》 [31] - 截至2025年05月16日电视剧集播映指数排名前三分别为《折腰》《淮水竹亭》《蛮好的人生》 [33] 综艺节目 - 截至2025年05月16日综艺节目播映指数排名前三分别为《歌手2025》《乘风2025》《奔跑吧第十三季》 [35] 渠道 - 2024年08月国内五大视频平台MAU分别为爱奇艺(3.94亿)、腾讯视频(3.86亿)、芒果TV(2.68亿)、哔哩哔哩(2.19亿)、优酷(1.99亿) [38] 直播电商 - 2025年05月05日 - 05月11日抖音直播主播销售排名前三分别为与辉同行(1亿+)、小北珠宝(1亿+)、新疆和田玉老郑(1亿+) [39] 广告营销 - 2025Q1全国户外广告投放刊例花费574亿元,同比增长6% [40] 重点公司重要公告速览 - 三七互娱25Q1拟向全体股东每10股派送现金股利2.10元,现金分红总金额约4.62亿元 [43] - 国脉文化拟以自有资金回购股份,金额不低于5000万元且不超过1亿元,回购价格不超过16元/股 [43] - 万达电影全资子公司影时光拟与关联方儒意星辰共同投资乐自天成,双方将开展战略合作 [43] - 中文在线多位董事拟减持公司股份,合计占公司总股本比例0.12% [43] - 顺网科技拟向全资子公司雾联科技增资3.1亿元,增资后注册资本将由4000万元增加至3.5亿元 [43] - 华策影视实控人拟减持不超过约2076万股公司股份,即不超过公司现有总股本的1.11% [43] 行业要闻 AI - 海外要闻:OpenAI发布AI编程智能体Codex,支持多任务并行,半小时可完成数天的软件工程任务 [45] - 国内要闻:昆仑万维开源交互式世界基础模型Matrix - Game;巨人网络与字节火山引擎开展AI领域合作;阶跃星辰发布并开源3D大模型Step1X - 3D;腾讯发布混元图像2.0模型;Manus上新文生图功能 [46][47][48] 游戏 - 点点互动《Whiteout Survival》位列4月中国手游海外收入第一 [51] - 完美世界《异环》发布最新实机视频 [52] - 世纪华通《云海之下》将于5月20日发布 [53]
字节 AI 再创业:独立组织、全链条的饱和出击
晚点LatePost· 2025-03-31 19:58
字节跳动AI战略布局 - 公司面对AI机遇采取饱和式投入策略,至少5个团队同时开发不同智能体产品,包括对内工具[3] - 2023年年中决定自主开发AI后,公司在算力芯片层、云计算层、模型研发层、应用层实现全链条布局[3] - 产品矩阵覆盖聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等主流方向,主力产品豆包在2024年底成为中国日活最多AI应用[4] - 2025年设定三大目标:探索智能上限、探索新UI交互形式、加强规模效应,由Flow/Seed/Stone三大板块近2500人团队支撑[17] 技术研发进展 - 模型迭代速度显著提升,2023年8月至2025年5月共发布12个版本,涵盖对话/视频生成/音乐/视觉理解等多领域[10] - 2025年1月发布豆包大模型1.5 Pro版本,多模态与推理能力全面提升[10] - 组建独立模型研发团队Seed,整合原有AI Lab资源,40%研究人员为近两年新增[15] - 引入Google Fellow吴永辉等顶尖人才,设立Seed Edge前沿研究计划瞄准AGI探索[21] 市场竞争态势 - 主力产品豆包被腾讯接入DeepSeek的元宝快速追赶,后者用十分之一时间达到豆包20%用户规模[5] - 错过中国ChatGPT时刻,因内部对复现OpenAI o1模型存在时间误判[10] - 面临DeepSeek开源模型冲击,该团队不足200人却实现技术突破[4][13] - 豆包2025年DAU目标超5000万,季度增长目标从30%调高至150%[22] 组织架构创新 - 建立独立AI组织Flow/Seed,与抖音/TikTok等业务平级,直接向创始人汇报[15] - 打破原有薪酬考核体系,为AI团队提供百万年薪及5年长周期评估机制[15] - 创始人张一鸣深度参与技术研究,每月召集核心团队复盘进展[16] - 采用"能力中台"模式,将模型能力模块化供产品团队调用[21] 资源投入规模 - 2023年GPU储备超10万张,上半年英伟达订单超10亿美元[22] - 2025年AI算力采购预算达900亿元人民币,优先保障大模型研发[22] - 通过收购补充技术能力,包括Oladance耳机品牌及存算一体硬件公司[15] - 调动全集团资源支持,曾阶段性限制非AI产品在抖音体系的广告投放[22]