Workflow
豆包App
icon
搜索文档
字节跳动最新音视频模型Seedance 1.5 Pro上线豆包App 一键生成有声视频
证券时报网· 2025-12-19 17:39
记者19日从字节跳动获悉,豆包App视频生成能力升级,支持Seedance1.5Pro模型,可一键生成声音和 画面相匹配的有声视频。 记者发现,打开豆包App对话框,选择"照片动起来",上传图片并输入提示词,选择"1.5Pro"模型,已 经可以体验到该功能。 2025年6月,视频生成模型Seedance1.0Pro正式发布,支持文字与图片输入,可生成多镜头无缝切换的高 品质视频,主体运动稳定性与画面自然度较高。 同时,即梦AI也上新Seedance1.5pro,支持声音、画面同步生成。 具体来看,即梦AI网页版官宣全面升级,打造一站式"AI片场"。本次更新涵盖了核心模型能力、交互方 式及创作流程等,旨在为用户提供从灵感到成品的全流程创作支持,让创意海报、专业视频乃至AI漫 剧、AI短片的制作变得更加高效便捷。 此次升级的核心亮点之一,是即梦AI最新视频生成能力"视频3.5Pro"。该模型基于字节自研模型 Seedance1.5pro,在即梦AI全球首发上线。视频3.5Pro支持视频与音频同时生成,人物口型、乐器演 奏、环境音效等元素无需再后期配音,大幅提升了视频的真实感与沉浸感。该模型在遵循复杂指令方面 表现 ...
豆包生视频功能升级,可同步生成声音和画面
新浪财经· 2025-12-19 13:07
新浪科技讯 12月19日下午消息,近日,豆包App视频生成能力升级,支持Seedance1.5 Pro模型,可一键 生成声音和画面相匹配的有声视频。打开豆包App对话框,选择"照片动起来",上传图片并输入提示 词,选择"1.5 Pro"模型,即可体验。 据字节跳动Seed官网介绍,Seedance 1.5 Pro是其新一代音视频创作模型,依托原生音视频联合架构与精 细化后训练,Seedance 1.5 pro 较好地实现了对多模态指令的遵循。 首先,该模型可实现精准音画同步,实现较高的视听一致性,且支持多种语言和地方方言口音,能够捕 捉其独有的语音韵律与情感张力。其次,豆包Seedance1.5 Pro具有电影级运镜控制与动态张力,具备自 发的镜头调度能力,也能实现电影级的画面衔接与专业影调,大幅提升了视频的动态张力。再次,语义 理解与叙事协调性增强,实现了对叙事语境的精准解析。它显著提升了音视频段落的整体叙事协调性, 为专业级内容创作提供有力支撑。 据悉,Seedance 1.5 Pro 模型对视听协同、动态调度和文化语境的精准掌握,使其在影视创作、短剧生 成、广告生产及戏曲演绎等场景中,均展现出较好的叙事 ...
2025科技与资本报告|人工智能赶考
北京商报· 2025-12-14 15:47
2025年,中国人工智能产业正站在一个新的历史拐点上。截至2025年6月,我国生成式人工智能用户规模5.15亿人,较2024年12月增长2.66亿人。截至2025年 8月,共有538款生成式人工智能服务完成备案,相关应用或功能应用于智能搜索、内容创作等领域,并向农业生产、工业制造等场景延伸。 国家层面的计划已经出台,2025年8月国务院印发的《关于深入实施"人工智能+"行动的意见》提出6大重点行动、8项基础支撑能力,给行业发展明确了方 向。 资本市场敏锐地捕捉到了这一趋势。据IT桔子统计数据,2025年至今,中国人工智能领域共发生709起投资事件,是2024年全年投资事件数量的136%,投资 金额合计约591.45亿元,是2024年全年投资总金额的94.5%。自动驾驶双雄实现美股+港股双重主要上市,其中小马智行以绿鞋后77亿港元集资额,成为2025 年港股AI领域募资额最高的新股,大模型赛道的MiniMax完成近3亿美元融资,走在上市路上的智谱获得10亿元人民币融资。 这个拐点同样是资本与产业的残酷交汇点。头部企业凭借技术护城河和场景落地能力赢得资本青睐,加速登陆资本市场接受公开检验;估值虚高、缺乏造血 能力 ...
人工智能赶考
北京商报· 2025-12-10 20:13
行业规模与增长 - 截至2025年6月,中国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人 [1] - 截至2025年8月,共有538款生成式人工智能服务完成备案,应用向智能搜索、内容创作、农业生产、工业制造等场景延伸 [1] - 2025年上半年,中国大模型市场日均调用量超过10万亿tokens,较2024年下半年增长约363% [13] 政策与方向 - 2025年8月,国务院印发《关于深入实施“人工智能+”行动的意见》,提出6大重点行动和8项基础支撑能力,为行业发展明确方向 [1] 资本市场动态 - 2025年至今,中国人工智能领域共发生709起投资事件,是2024年全年数量的136%,投资金额合计约591.45亿元,是2024年全年的94.5% [1] - 2025年三季度,人工智能行业一级市场新增融资事件435起,同比增长99%,环比增长21%,总融资规模约370亿元 [8] - 2025年三季度,人工智能是资本最集中的投资赛道,前十名企业合计融资超百亿元,前三名为MiniMax、曦智科技和千里智驾 [8] - 自动驾驶公司小马智行以绿鞋后77亿港元集资额,成为2025年港股AI领域募资额最高的新股 [1] - 大模型公司MiniMax完成近3亿美元融资,智谱获得10亿元人民币融资 [1] 企业上市与融资案例 - 2025年11月,自动驾驶公司小马智行和文远知行在港交所双重主要上市 [6] - 小马智行Robotaxi车队规模超过720辆,在部分城市实现7×24小时服务 [6] - 文远知行L4级自动驾驶车队规模超过1500辆,其中Robotaxi超700辆,在11个国家、30余个城市运营 [7] - 企业级数据智能软件公司明略科技、仿真技术公司赛目科技、机器视觉服务商索威尔科技相继上市 [7] - AI语音公司云知声股价从2025年6月上市时的205港元涨至超500港元 [7] - 多家AI相关公司如合合信息、特斯联、群核科技正在赴港上市途中 [7] - AI+消费机器人公司灵宇宙完成2亿元Pre-A轮系列融资,其“小方机”产品在“双11”期间销售额同比“6·18”增长超230% [16] - 阿里云领投企业级AI智能体平台斑头雁,创下国内AI Agent赛道当时已披露的单笔最大融资纪录 [12] 竞争格局与生态演变 - 2025年中国AI产业进入深度洗牌与生态重构阶段,竞争立体化、生态化 [11] - 科技巨头与新兴创业公司在几乎所有赛道同台竞争,合作加深 [11] - 深度求索的DeepSeek App在2025年初迅速崛起,日活跃用户数在2月24日突破5000万 [11] - 截至2025年2月,国内AI原生App活跃用户达2.4亿,较1月净增1.15亿 [11] - 截至2025年9月,原生AI App用户规模达2.87亿,In-App AI及手机厂商AI助手用户规模分别达7.06亿和5.35亿 [12] - 大厂通过投资(如百度“文心杯”创业大赛)与创业公司绑定,并购案例相对较少 [12] 应用场景与商业化 - 大模型核心价值在于“提质增效”,应用占比最高的场景为“问答增强”(32%),其次是代码助手(18%)和文档处理生成(17%) [14] - 与自动驾驶、具身智能相比,大模型在数字世界运行,试错成本低、迭代快,被认为可率先实现商业闭环 [14] - AI硬件成为商业化新载体,IDC预计2026年中国智能终端市场出货量将超9亿台,同比增长4% [16] - 市场理性化导致同质化竞争加剧与价格战延续,企业更关注营收规模和盈利时间 [15] 巨头战略与投入 - 阿里巴巴积极推进三年3800亿元的AI基础设施建设计划,并规划到2032年将其全球数据中心能耗规模较2022年提升10倍 [18] - 腾讯2025年三季度研发开支约为228.22亿元,同比增长28%,创单季历史新高;同期资本开支130亿元,持续投入AI人才、研发及算力 [18] - 科技巨头竞争从底层算力延伸至C端入口和智能硬件,如百度小度、阿里千问App、腾讯元宝、字节跳动豆包App等 [18] 技术实力与未来展望 - 截至2025年4月,中国人工智能专利申请量达157.6万件,占全球申请量的38.58%,位居全球首位 [19] - 行业形成“技术突破、产业落地、资本反哺”的良性循环生态,未来发展关键在于实现技术价值、产业价值和商业价值的统一 [17][19]
豆包大消息 直接引爆!
证券时报· 2025-12-01 16:37
事件概述 - 12月1日,字节跳动豆包团队发布豆包手机助手技术预览版,直接引爆A股AI手机概念股 [1][2] 市场反应 - 截至当日收盘,天音控股、福蓉科技、道明光学封板,市值近两千亿元的中兴通讯也封在涨停 [2] 产品合作模式 - 豆包手机助手是在豆包App基础上,与手机厂商在操作系统层面合作的AI助手软件 [2] - 公司明确表示没有自研手机计划,而是与多家手机厂商洽谈,以“生态合作”形式整合进不同品牌机型,模式类似于“华为不造车,赋能车企” [4] - 目前正与多家手机厂商洽谈助手合作 [3] - 现阶段可在豆包与中兴合作的工程样机nubia M153上体验技术预览版本 [2][4] 产品功能与性能 - 基于豆包大模型能力,模型在推理、视觉理解、图像创作、视频生成、语音等方面性能达到国际一流水平,图形界面操作能力在多项权威评测中获得业界最佳成绩 [3] - 用户可通过语音、侧边键或豆包Ola Friend耳机直接唤醒豆包,实现便捷交互 [5] - 在任意界面,用户可就屏幕内容向助手提问以获取更多信息 [5] - 将语音通话、视频通话和屏幕共享等常用功能嵌入助手,用户双击侧边AI键即可调用 [5] - 打通系统原生相册,用户可直接在相册内通过语音对图片下达修图指令,例如删除人物、清理杂物 [5] - AI操作手机功能可根据用户指令在多款应用间自动跳转,完成查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务 [5] - 上线操作手机Pro模式,除调用GUI Agent(模拟点击)外,还可直接调用系统工具,结合记忆数据与更强推理能力完成复杂任务 [5] - 在Pro模式下,若记忆已存储用户信息,助手可自动查询符合偏好的方案,无需用户逐一交代细节 [5] 产品测试与发布状态 - 媒体测试显示,在完成“对比外卖平台价格并下单”的复杂任务时,只有付款阶段需要人工介入,其他操作全部由AI在后台自动完成 [4] - 目前技术预览版本已面向开发者和科技爱好者少量发售,售价3499元 [4] - 官方提示,受限于大模型技术不确定性,演示场景无法保证百分百复现,产品实际可用性与团队预期仍有差距,未来将持续迭代优化 [6] 行业趋势 - 手机AI助手领域正呈现“手机厂商+大模型厂商”深度合作的清晰趋势,例如谷歌Gemini与三星的合作探索已为行业提供跨界协同参考样本 [6]
字节回应与中兴手机合作:无自研手机计划
每日经济新闻· 2025-12-01 10:48
公司战略与产品发布 - 字节跳动旗下豆包团队发布豆包手机助手技术预览版 该产品是在豆包App基础上与手机厂商在操作系统层面合作的AI助手软件 [1] - 公司明确表示目前没有自己开发手机的计划 业务重点在于与手机厂商合作 [1] - 公司目前正与多家手机厂商洽谈助手合作 但官方已披露的唯一合作手机厂商是中兴手机 [1] 行业合作动态 - AI助手软件的发展模式呈现与硬件厂商深度整合的趋势 豆包手机助手是与手机厂商在操作系统层面进行合作 [1] - 手机厂商成为AI大模型应用落地的重要渠道 多家厂商正与豆包洽谈合作 [1]
想留在牌桌上,大厂们必须要“卷”AI TO C | 马上评
钛媒体APP· 2025-11-28 07:25
阿里巴巴AI战略转向 - 阿里巴巴集团CEO吴泳铭在2026财年Q2财报分析师电话会上,明确将“AI to C”与“AI to B”并列为集团核心战略方向 [1] - 公司近期推出“千问”APP,被视为进军C端AI原生应用战场的冲锋号角 [1] - 战略转向背后是移动互联网红利消失殆尽,争夺未来AI时代C端超级入口成为生存之战 [1] 阿里巴巴押注AI to C的驱动因素 - 大模型技术已越过早期探索阶段进入应用爆发前夜,千问等大模型在理解能力、生成质量及多模态交互方面取得显著进步 [3] - 公司在电商领域的主导地位面临挑战,抖音电商的GMV体量已经逼近阿里核心电商板块,对用户时长与消费决策形成明显分流 [3] - 字节跳动的豆包、腾讯的元宝、百度的AI搜索等产品已率先在C端站稳脚跟,用户习惯正在形成,现在不入局未来可能会失去关键用户入口 [4] - 阿里生态内丰富的电商、支付、本地生活等高频消费场景可为AI应用提供真实数据反馈和用例验证,形成“场景-数据-模型”的闭环迭代 [4][5] AI超级应用的价值与形态 - 未来线上生态的核心枢纽将是面向C端的AI超级原生应用,其意义不亚于互联网时代的浏览器与搜索引擎 [5] - 以Chatbot为主的交互方式是最适合作为AI时代入口的产品形态,实现对互联网底层逻辑的重构 [5] - 理想的Chatbot入口能将信息获取、服务调用、消费决策无缝整合于对话流中,实现“对话即服务”的范式 [6] - 掌握AI入口者将掌握未来至少五年的流量分配权,AI to C已成为争夺用户时长的核心战场 [6] 主要互联网公司AI to C战略对比 - 字节跳动凭借庞大的内容生态与多元业务场景,构建“场景驱动数据、数据反哺模型、模型优化体验”的闭环,豆包App是其战略落地关键载体 [8] - 阿里巴巴必须通过AI重构流量入口与用户连接方式,打破封闭生态的桎梏,千问APP的出击是背水一战 [9][10] - 百度优势在于多年技术积累与搜索赋予的内容理解能力,但用户场景单一、生态闭环薄弱,深陷依赖外部流量输入的困局 [11] - 腾讯将AI能力嵌入微信的社交、支付、小程序等高频场景,但面临AI原生对话入口可能反向吞噬微信传统入口地位的风险 [13] - 拼多多对大模型“军备竞赛”兴趣寥寥,战略聚焦电商主业,AI布局轻量化、场景化,通过“场景—数据—反馈”闭环在下沉市场持续放大低价优势 [14] AI to C竞争的关键成功因素 - 竞争核心在于构建“场景-数据-模型”的黄金闭环,将AI能力植入高频生活场景形成用户习惯与商业壁垒 [16][17] - 五年后可能形成1-2个独立的AI超级应用成为一级入口,承载60%以上的用户需求 [18] - 胜利者不属于拥有最强算法或最大算力的公司,而属于最深刻理解用户需求、最无缝融入生活场景的巨头 [17] - 数据流动效率决定模型进化速度,生态协同能力成为竞争护城河 [18]
豆包凶猛,深度解析字节AI战略
36氪· 2025-10-28 20:27
公司AI战略与市场地位 - 字节跳动在AI战略上采取“一盘棋”式协同打法,这在当前国内大型互联网公司中较为少见 [1][7] - 公司AI体系被视为“几乎没有短板”的选手,具备自研大模型底层能力、抖音超级流量入口及快速孵化App的产品体系 [1] - 豆包大模型与DeepSeek、阿里Qwen同处国内第一阵营,但在视频、图像、语音多模态产品化与矩阵完整度上具有优势 [4][5][6] 豆包App用户与产品策略 - 截至2025年8月,豆包App月活用户超过1.57亿,成为国内移动端用户量最大的AI聊天助手,其主要竞争对手DeepSeek月活约为1.43亿 [2] - DeepSeek流失用户中有近四成转向豆包App [2] - 豆包App产品风格主打“亲近”、“易用”,支持语音、视频、方言聊天,区别于西方AI聊天助手的强工具属性 [2] - 2025年9月,字节老将赵祺接手豆包产品,工作重心或将转向加速用户规模与商业变现 [3] 豆包大模型技术进展与表现 - 豆包大模型在2025年6月发布1.6版,作为国内首个原生多模态模型,在长上下文和性价比上表现突出,实现市场处境逆转 [4][5] - 截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比2025年5月底增长超过80% [5] - 在开发者评测中,豆包大模型在中文理解、多模态理解、视频生成中表现优异,但在代码生成、复杂API调用等任务上弱于部分竞品 [5] - 2025年初,Seed部门核心领导层变动,前Google DeepMind副总裁吴永辉博士加入,担任模型基础研究负责人 [6] 商业化与生态协同路径 - 豆包App未来可能的变现路径包括:围绕特定场景推出按次计费服务、针对企业或高频需求设置超额使用收费、在抖音生态中嵌入功能通过广告分成或佣金获取收益 [3] - 豆包大模型通过“一盘棋”打法实现品牌、产品互动、引流和商业化的协同,例如豆包App的消费端体验直接推动了企业级市场对豆包大模型的选择 [8][10] - 抖音(含极速版)月活于2025年3月达10.01亿,成为AI原生应用引流的万能入口,并在产品层与豆包形成双向互动闭环 [10] - 豆包大模型已应用于抖音、飞书、番茄小说等字节内部超过50个业务场景,火山引擎上的产品均先在内部跑通验证后再对外服务 [10][11] - 在电商大促期间,飞书多维表格集成文案、图片和视频生成工具,能批量帮助商家生成内容并一键发布至抖音,形成内部闭环 [11]
豆包上线未成年人模式;电商将成为小红书一级入口|未来商业早参
每日经济新闻· 2025-08-27 07:16
小红书电商战略升级 - 小红书启动新版本测试 将电商入口"市集"提升至App底部导航栏一级位置 紧靠"首页"选项[1] - "市集"作为生活方式电商的产品化呈现 上部设置市集直播、买手橱窗和新品首发等频道[1] - 电商入口升级有助于整合内容与电商资源 提升用户购物体验并丰富购物选择[1] 盒马NB业绩与品牌发展 - 盒马NB上半年营业额达80亿元 较去年同期实现双位数增长[2] - 门店数量近300家 半年时间实现翻倍增长 主要集中在华东核心城市市区和郊区[2] - 推出"超盒算"自有品牌 上百款产品已更换品牌名 近期整体将更名为"超盒算NB"[2] 淘宝天猫图书数据合作 - 淘宝天猫图书行业与中国国家版本馆签署合作协议 引入图书在版编目(CIP)标准数据[3] - 合作将改变商家在平台的图书数据录入模式 提供更准确规范的数据支持[3] - 此举有助于推动图书行业的数字化转型进程[3] 豆包App功能更新 - 豆包App正式上线未成年人模式 默认关闭回答展示视频、浏览第三方网页等功能[4] - 翻译、资料查询与深入研究等学习与工作相关能力在未成年人模式下保持正常使用[4] - 功能优化体现对未成年人网络环境的重视 更好满足家长和教育机构需求[4]
豆包上线未成年人模式,默认关闭相关视频展示等功能
证券时报网· 2025-08-26 15:37
产品功能更新 - 豆包App正式上线未成年人模式 该模式默认关闭回答展示视频、浏览第三方网页、与外部智能体对话及AI创作等功能[1] - 未成年人模式下保留翻译、资料查询与深入研究等学习与工作相关能力[1] 用户反馈与产品优化 - 此前有网友反馈豆包会在问答结果中提供短视频参考 部分儿童可能借此浏览视频内容导致注意力分散[1] - 公司针对反馈推出专项功能调整 通过限制娱乐化功能强化学习场景适用性[1]