Workflow
AIGC
icon
搜索文档
Seedance2.0狂飙48小时,技术造神,字节跳动踩刹车
新浪财经· 2026-02-14 12:04
Seedance2.0的技术能力与突破 - 作为字节即梦AI的第三代视频生成模型,打通了多模态输入、音画同步、空间建模三大核心能力,将AI视频从粗糙画面拼接带入工业化内容生产新赛道[5] - 技术能力包括:60秒生成带原生音频的2K视频、多镜头叙事流畅自然、场景运镜符合物理逻辑、角色细节几乎无漂移[5] - 实现单图克隆真人声形、一键生成空间运镜的跨维度突破,能覆盖九成短视频、短剧、广告制作的专业需求[5] - 在单镜头表现力、情绪张力、自动分镜衔接及视频编辑灵活性上表现亮眼[11] 技术对比与现存短板 - 与OpenAI Sora相比,Sora长于物理模拟和长叙事,但受限于生成迟缓、内测封闭、商用无期;Seedance2.0则在生成速度和应用性上更具侵略性[5] - 未突破AI视频行业核心落地痛点:未能解决内容生成的一致性难题,仅能产出5-10秒碎片级素材,多素材拼接时人物、道具、场景易割裂,缺乏叙事连贯性[11] - 在物理一致性、人物情绪表达贴合度方面不及Vidu Q3,特效表现张力、画面细节还原也稍逊一筹[11] - 未实现音视频一体化的16秒段落级直出,在长段落视听协同交付上存在明显短板[11] - 在极致4K画质、复杂物理动作还原能力上不及Sora 2,超长视频叙事节奏把控、复杂语义事实准确性仍需打磨,未覆盖顶级影视团队专业级工具需求[12] 对内容产业的降本增效影响 - 传统影视制作中,实拍、棚拍、后期与配音成本占据总成本六成以上,该模型直接将核心制作成本腰斩[5] - 短剧与自媒体原本需要一到三天完成的成片,在AI辅助下压缩至数小时,生产效率大幅增长[5] - 能打破影视、短剧、广告行业高成本、低效率的生产瓶颈,被资本赋予极致的估值想象[14] 市场与资本反应 - 内测上线后迅速引发全球科技圈关注,内测邀请码在海外社交平台被炒至数百美元,单日求码帖暴涨过万[3][6] - 海外创作者与科技机构将其视作对标Sora的国产标杆疯抢测试资格[6] - 资本认为谁先绑定AI视频工业化,谁就能握住内容行业下一轮洗牌的入场券[6] - 即便真人克隆功能下架,其在场景生成、音画同步上的价值依旧坚挺,降本增效的资本故事仍有足够讲述空间[14] 引发的数据安全与伦理风险 - 模型无需授权、无需告知、无需付费,就能通过一张普通照片精准复刻创作者的声音、容貌与表达特质,还原精度足以以假乱真[4][7] - 训练数据来源引发争议,普通用户的生活记录、博主的原创内容可能在不知情下成为训练AI的免费数据[8] - 单张人脸照片即可克隆声形,将个人数字身份保护成本降至零,无限压低了侵权与犯罪门槛[9] - 2025年AI深度伪造诈骗案件已层出不穷,该技术使高精度伪造风险呈指数级爆发[9] - 创作者的核心知识产权(个人风格、声形特质)面临被零成本攫取的风险,陷入被替代、被侵权、无补偿的困境[10] 公司的应对措施与行业监管现状 - 内测仅数日后,字节跳动于2月9日紧急暂停Seedance2.0真人图片与视频素材上传功能[3][13] - 此举被解读为企业的风险止损,旨在避开肖像权与版权集体诉讼、防止大规模维权风暴、契合日趋严格的监管红线[14] - 计划将无边界克隆转为“真人校验和授权”的可控服务[14] - 国内针对AI视频的监管尚停留在生成式AI管理办法框架层面,数据授权、版权归属、克隆边界等核心问题均无明确细则[14] - 欧盟已将AI克隆列为高风险技术要求强制评估与全程可追溯;美国多州出台数字肖像权法案,要求AI使用他人声形必须获得明示授权[14] 行业面临的共性挑战与未来方向 - AI视频行业面临“技术狂奔在前,规则滞后在后”的普遍困境,技术创新、商业资本与合规伦理三者容易失衡[4][15] - 法律存在空白,平台默认授权条款司法争议不断,创作者维权面临举证难、认定难、赔偿低的困境[11] - 行业需要搭建数据授权与收益分成的自治体系,监管需要出台划清边界的精准细则,全球需协同防范深度伪造的跨国风险[15] - AI视频的终极价值应是赋能和辅助创作,降低创作门槛,而非替代创作者与掠夺知识产权[15]
Seedance 2.0急刹车! 这个赛道的水到底有多深?
新浪财经· 2026-02-14 12:04
核心事件:Seedance 2.0真人功能暂停 - 字节跳动旗下即梦APP内测的AI视频生成模型Seedance 2.0,在爆火后突然暂停了其核心的“真人素材作为主体参考”功能[1] - 该功能允许用户上传一张真人照片,AI即可生成以该照片为主体的、动作神态高度还原的视频,效果肉眼难辨真假[1] - 功能暂停前,Seedance 2.0因“低门槛+高还原”特性迅速走红,内测12小时申请人数突破100万,推动即梦APP下载量冲进应用商店免费榜前十[2] - 官方暂停通知称“为保障创作环境健康可持续,正在针对反馈紧急优化”,但未给出功能恢复时间表[1][2] 事件爆火原因与技术表现 - 技术实现多项突破:除真人还原外,还在自运镜、多镜头叙事、音画同步上实现突破,支持文字、图片、音频多素材输入[2] - 输出质量高:普通人无需视频基础,输入描述即可生成1080P、60fps的高清视频,效果堪比专业团队[2] - 获得行业高度评价:《黑神话悟空》制作人冯骥评测后称其“领先、全能、低门槛,AIGC的童年时代结束了”,并用“Kill the game!”形容其冲击力[1] 功能暂停的背后原因 - **核心驱动力是规避多重风险**,而非技术不成熟[2] - **合规风险**:2026年国家AI生成内容监管新规全面落地,要求“强制标识+版权保护”,而Seedance 2.0的真人功能难以实现有效的“强制标识”和授权管控,踩在监管红线边缘[3] - **隐私与数据授权风险**:实测表明,模型可能在未授权情况下采集学习了用户的肖像、音色及周边环境信息,侵犯隐私并违反《个人信息保护法》[2][4] - **商业风险**:Seedance 2.0的母公司MotionVerse刚完成红杉中国领投的B轮融资,估值破10亿美元,若引发大量肖像权诉讼或隐私投诉,将损毁品牌并影响后续融资[4] AI视频行业竞争格局 - **市场高速增长**:麦肯锡报告显示,2025年全球生成式AI市场规模预计达790亿美元,内容生成是最大驱动力[6] - **渗透率快速提升**:2025年9月底,AI在全球视频领域渗透率突破63%,AIGV市场规模较2024年翻倍[6] - **中国厂商领先**:全球TOP10文生视频模型中,有8款来自中国[6] - **国内竞争白热化**:2026年1月,国内头部AI视频产品达10款,背后是互联网巨头或独角兽企业[6] - **技术内卷到“毫厘之间”**: - 可灵AI支持生成2分钟、1080P、60fps分镜视频,2025年三季度营收超3亿元,累计生成视频超2亿个[6] - PixVerse AI V5.5音画错位率低于0.1秒,累计生成视频超8亿个[6] - 商汤科技Seko 2.0实现“一人剧组”,将影视流程简化为三步,单次推理成本下降50%以上[6] - **“真人还原”成为核心赛道**:因其更贴近普通人的创作需求,在电商带货、短视频、企业宣传等场景需求巨大[7] - **竞争策略分化**:大厂布局全场景通用平台;中小玩家聚焦垂直领域,如万兴天幕(影视级)、MOKI(颜值类)、海螺AI(运镜功能)[7] AI视频技术带来的社会影响与挑战 - **虚假信息泛滥风险**:逼真的AI视频使造谣、诈骗成本趋近于零,人类进入“后真相视频时代”[9] - 美国FBI报告显示,2025年Deepfake诈骗案件同比增长187%,其中真人AI视频诈骗占62%[9] - 国内某短视频平台2025年底出现多起相关诈骗,涉案金额超5000万元[9] - **隐私泄露与数据滥用风险**:AI模型训练需要大量真人数据,存在严重的数据来源不明和未授权使用问题[9][10] - 中国互联网络信息中心报告显示,70%以上的AI视频模型存在“数据来源不明”问题,30%明确使用未授权真人数据[10] - **就业结构冲击**:AI视频技术首先冲击的是内容生产流水线上的基础岗位[10] - 传统动漫单分钟成本两三万元,AI漫剧成本仅1000-2500元,制作周期从数月压缩到十来天,相关岗位裁员比例超50%[11] - 中小企业宣传片外包预算可因AI节省一半以上[11] - 快手可灵AI平台累计生成视频超1.6-2亿条,服务两万多家企业,背后是大量乙方剪辑师和外包团队的岗位流失[11] - **监管滞后挑战**:AI视频技术的发展速度远超法律和监管体系的完善速度,在侵权责任认定、数据采集规范、私下传播追溯等方面存在大量漏洞[11] 行业发展趋势与共识 - **发展重心转变**:Seedance 2.0事件标志着AI视频赛道从“拼技术、拼速度”的“炫技阶段”,进入“拼合规、拼安全”的新阶段[7][13] - **行业共识形成**:技术领先固然重要,但合规和安全才是长久发展的根基,忽视风险的玩家终将被市场淘汰[7] - **未来方向**:技术发展不能脱离伦理法律,AI创新不能牺牲隐私安全,守住底线才能让技术真正服务于人类[12][13]
小红书:对未主动标识的AI生成合成内容限制分发;智能图像创作模型Seedream 5.0 Lite发布丨AIGC日报
创业邦· 2026-02-14 08:16
AI模型与工具的重大升级 - 美图旗下口播视频制作工具“开拍”将首批接入Seedance 2.0,预计2月底上线,接入后生成能力将直接嵌入产品工作流,用户无需单独使用大模型或跳转 [2] - 字节跳动Seed团队发布Seedream 5.0 Lite智能图像创作模型,相比4.0版本在理解、推理和生成方面全面提升,并引入实时检索增强能力以获取最新知识 [2] - 蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平 [2] - 蚂蚁集团的Ring-2.5-1T模型在32K以上长文本生成场景中,访存规模降低10倍以上,生成吞吐提升3倍以上,并在国际数学奥林匹克竞赛自测中达到金牌水平(IMO 35分) [2] - 蚂蚁集团的Ring-2.5-1T模型可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用 [2] 内容平台对AI生成内容的监管加强 - 小红书表示将依据《人工智能生成合成内容标识办法》加强AI生成内容的识别检测,对未主动标识的内容将添加标识并限制分发 [2] - 小红书平台将对借由AI生产虚假仿冒信息、魔改经典、宣扬不良价值观的内容,以及发布教唆祛除AI标识的教程予以严厉打击 [2]
歌舞小品样样齐全,网友已经靠商汤Seko AI手搓出“春晚”了
新浪财经· 2026-02-13 22:18
公司动态:商汤科技AI视频创作智能体Seko举办“全民AI春晚共创计划” - 公司旗下AI视频创作智能体Seko成功举办首届“全民AI春晚共创计划”活动,活动以“马年焕新”为主题,吸引了全民参与[1] - 活动历时数周,最终集结了来自全国各地的200余部创意作品,为传统春节注入了新的生命力[1] - 活动中,四分之一创作者凭借出色作品获得了现金奖励与平台流量扶持,多部优质内容成功破圈,在全网提前点燃“过年模式”[3] 产品表现与用户反馈:Seko展现强大创作能力与低门槛优势 - 用户借助Seko AI工具创作了题材横跨相声小品、家庭短剧、歌舞才艺与创意整活的多元风格作品,包括细腻逼真的4K画风大片、皮影戏演绎的传统年俗及诙谐幽默的宠物小品[3] - 创作者画像呈现“全民性”,参与者包括影视制作资深爱好者、学生、宝妈、上班族、公务员等跨界人群[3] - 用户反馈积极,一位获奖的宝妈创作者表示,使用Seko几句话就能生成完整的剧情短片,使创作变成了一种日常表达[3] - 商汤Seko自2025年7月上线以来迅速走红,上线仅两个月用户量突破10万,不到半年已聚集超20万创作者[3] 战略与行业影响:推动AIGC从专业圈层走向日常生活 - 公司正以“人人皆可创作”的理念,推动AIGC(人工智能生成内容)从专业圈层走向日常生活[4] - 本次“全民AI春晚”被视作一场科技与民俗的融合实验,展示了当创意不再受限于工具时,传统节日焕发的无限可能[4] - 未来,公司将持续深耕AI视频生成与创作智能体,致力于让更多普通人以最低的门槛进行创意表达[4]
奥拓电子:控股子公司创想数维致力于成为“中国领先的创意领域技术赋能者”
证券日报网· 2026-02-13 19:40
公司业务与战略 - 奥拓电子控股子公司创想数维致力于成为"中国领先的创意领域技术赋能者" [1] - 创想数维专注基于LED显示的XR虚拟扩展现实一体化解决方案 [1] - 公司为客户提供虚拟直播、XR技术服务及数字资产生成等技术服务 [1] 产品与技术进展 - 创想数维自研的"Coruscant星核渲染合成服务系统"已正式上线 [1] - 公司自研的AIGC数字内容创作工具—"Vormir源行生成式工具"已正式上线 [1] - 相关技术将专业级虚拟制片能力转化为轻量化、智能化的工业流程 [1] 解决方案与行业影响 - 公司技术形成了从内容生成到实时合成的闭环解决方案 [1] - 相关技术推动数字内容生产向高效化、平民化方向发展 [1]
Seedance 2.0深度测评:复杂场景贼稳,连asmr都会?
选股宝· 2026-02-13 18:51
产品发布与市场反响 - 字节跳动旗下AI视频生成模型Seedance 2.0上线,并在全网引发现象级刷屏和高度关注[1] - 产品获得了包括埃隆·马斯克在内的国际知名人士的积极评价,并有观点认为其可能对好莱坞传统影视制作构成冲击[1] - 产品的火爆引发了全球用户对其开放国际版和注册中国账号的强烈需求[1] 核心功能升级与性能表现 - 模型在多模态输入形式上实现升级,支持图像、视频、音频和文本四种混合内容输入,显著提升了生成视频的画面一致性和可控性[11] - 在处理多镜头提示词时,模型能有效稳定主体特征,避免人物外形、场景和镜头风格在切换过程中出现不一致或“发飘”的问题[11][13] - 模型具备“一镜到底”功能,能够根据用户提供的多个不同参考画面,生成一个将这些画面流畅串联起来的连续视频[20][23][24] - 模型支持基于多份参考素材和提示词,生成包含完整剧情的视频输出,而不仅仅是基于首帧进行画面延续[30][31] 具体应用场景与生成效果 - 用户生成的内容创意多样,包括“猫咪大战哥斯拉”、AI版《F1狂飙飞车》、中国功夫对战钢铁侠等,展示了模型在动作、音效和镜头语言上的强大表现力[3][5][7] - 模型能够根据单张漫画截图,自动脑补并生成一整段剧情视频[9] - 在复杂场景测试中,如要求蒙娜丽莎在固定画像框架内完成掏可乐、喝可乐和说话等大幅动作,模型保持了面部特征和动作的一致性[15][16] - 通过“首尾帧玩法”,模型能将画风完全不同的两张图片(如从水墨风到油画风再到像素风)在同一个视频中实现自然过渡和变身[18] - 模型支持视频时长自定义,用户可通过提示词明确指定需要生成的视频长度(如10秒),并能完成指定的连续动作[36] - 在音效生成方面,模型能高准确度地还原特定场景的声音(如吃播中不同食物的咀嚼声),并且音色与人物/场景的贴合度较高[38][39][41] 当前存在的局限性 - 在“一镜到底”功能中,不同参考画面之间的衔接有时可能不够自然,存在一定的画面割裂感[26][28] - 在处理多宫格漫画生成完整剧情视频时,模型可能无法1:1精确还原漫画中的文字,存在字体不符或文字出现时机与画面不同步的问题[34][35] - 在部分音效生成场景中(如ASMR中的水晶碰撞声),模型可能直接生成标准音效而非结合场景思考,导致声音略显出戏[41][43] - 在视频延长功能中,存在生成物体运动方向与预期不符的情况(如甜甜圈倒着跑)[36]
影视行业的创意火种,不会被AI轻易吹灭
新京报· 2026-02-13 17:39
文章核心观点 - 中国视频生成模型Seedance2.0的爆火引发了全球影视行业对AI颠覆性影响的担忧,但分析认为AI主要替代的是内容生产中的基础技能性工作,而非人类创意本身,其本质是视听行业生产力提升和生产函数调整的机会 [1][2][3] AI技术发展现状与行业反应 - 中国视频生成模型Seedance2.0全球爆火,相关视频在短视频平台刷屏,引发美国导演及影视从业者对“好莱坞要完蛋了”的恐慌 [1] - AI恐慌定期在不同领域发作,此次轮到了影视剧等内容行业,电影作为内容行业最复杂、最具门槛的领域被“入侵”引发恐慌可以理解 [1] AI对内容创作环节的影响分析 - AI真正取代的是“从想法到实现”过程中的基础技能性工作,而非人类的创意和灵感 [2] - 即使AI能根据简单提示词生成完整叙事作品,其背后的世界观构建、审美选择、叙事节奏与价值表达仍需人类创作者参与设计与校准 [2] - AI替代的是实物布景、基础摄像、粗剪等工作,任何需要创意、设计的环节仍需人的深度参与,只是参与方式改变 [3] - AI的生产逻辑是基于既有数据与提示词进行概率生成,真正的原创方向选择、价值表达与文化判断仍来自人类 [3] - 剪辑师工作转变为与AI交互进行“参数校准”,摄影师需拍摄关键素材并学会指挥AI生产视频 [3] - 演员的日常AI替身与关键场景亲自出演结合的模式仍不可替代,但“工具人”群演可能面临淘汰风险 [3] AI对行业成本结构与生产效率的影响 - 传统视听行业成本结构中,演员薪酬占30%—40%,制作成本(布景、设备、摄影等)约占30%,后期制作占15%—25% [4] - AI率先能够替代或缩减成本的是制作与后期环节,而非创意环节 [4] - AI是视听行业生产力的提升机会,能将过去分散、浪费的人力成本转化为可量化、相对低廉的算力成本,有望提升创作规模、数量和效率 [3] 行业面临的更广泛挑战与技术演进 - 高度依赖创意和复杂生产流程的影视剧,其AI化远未想象中容易和迫近 [5] - 在此之前,短视频和算法推荐是对传统视听行业影响更大的颠覆性力量,并催生了微短剧等产品 [5] - 回顾历史,有声电影、数字摄影、特效技术等都曾引发技术恐慌,但核心创作者始终存在,产业规模持续提升 [6] - AI效应进一步放大了“创意”本身的价值,有故事创意的编剧未来或能更容易地将想法变成作品,哪怕只是短时长的作品 [6] - 标准化程度高、情节模版化严重、依赖算法流量的快餐式文化消费品(如短剧、网文)更容易被AI率先替代 [6] - 在“人力取代”之前,行业更需应对短视频爆炸式增长带来的隐私法律边界、内容真实性判断、生产门槛降低及“劣币淹没良币”等问题 [7]
Seedance 2.0现象级刷屏!深度测评:复杂场景贼稳,连asmr都会?
量子位· 2026-02-13 16:23
文章核心观点 - Seedance 2.0作为一款AI视频生成模型,其发布引发了全球范围内的现象级关注和热烈讨论,被部分用户认为可能对传统影视行业(如好莱坞)构成冲击[1][40] - 该模型在多模态输入、画面一致性、可控性、镜头语言理解以及音效生成等方面实现了显著升级,尤其适合日常AIGC视频创作和商业场景应用[12][16][38][40] - 尽管在细节还原(如漫画文字)和部分场景衔接上仍有小瑕疵,但其整体表现超出预期,用户上手门槛低,使用体验良好[37][38][39] 模型核心能力升级 - **多模态混合输入**:模型支持图像、视频、音频、文本四种混合内容形式输入,增强了画面一致性和可控性[14] - **画面一致性与可控性提升**:在多镜头切换和大幅动作中,能有效稳住人物外形、面部特征及整体风格,解决了以往AI视频中主体特征“发飘”的问题[12][14][15] - **“一镜到底”功能**:能够根据用户提供的多个不同视角的参考画面,生成一个将画面串联起来的连贯视频,实现了镜头衔接[17][18] - **完整剧情输出**:模型能够结合多份参考素材和提示词,生成一段完整的剧情视频,而不仅仅是基于首帧进行画面延伸[23][24] - **视频时长自定义与音效编辑**:用户可通过提示词明确指定需要生成的视频时长(如10秒),模型能准确生成对应时长的视频[31][32][33];音效生成方面,音色准确度高,与人物、场景的贴合度好,能1:1还原如食物咀嚼等复杂声音细节[34][35][36] 具体应用测试效果 - **复杂镜头与角色控制**:在邵氏武侠风格视频测试中,要求完成包含对话、情绪变化、动作对峙的完整冲突链,模型在多镜头切换中稳住了男女主角的面部特征,无明显变形[15];在“蒙娜丽莎偷喝可乐”测试中,模型在人物完成掏可乐、喝可乐、说话等系列动作时,保持了面部一致性和动作合理性[15] - **风格转换与衔接**:通过上传水墨风、油画风、像素风等不同画风的马儿奔跑图片,模型能生成风格自然过渡的变身视频,且音效与动作卡点准确[15] - **未来城市穿越场景**:输入三张视角各异的赛博朋克风格城市画面,模型能生成一镜到底的无人机视角穿越视频,完整还原了参考镜头,但在部分画面衔接上略显生硬[18][19][21] - **漫画剧情生成**:输入一套六宫格漫画,模型能按顺序演绎并生成完整动漫视频,画面还原度好,但存在漫画内文字还原不准确、文字与画面出现不同步的问题[25][27][28] - **视频延长与音效测试**:根据一张3D风格奔跑的甜甜圈图片首帧,成功延长生成了一段10秒的连续动作视频,时长精准,音效动感,但出现了甜甜圈倒着跑的异常逻辑[32][33];在吃播音效测试中,模型准确还原了炸鸡的“咔嚓”声、黄瓜的清脆声、披萨拉丝声及气泡饮料声[35][36] 模型表现总结与适用场景 - **镜头语言理解到位**:模型对镜头语言的理解更到位,适合用于日常多镜头和精细化控制的视频制作[12][38] - **提示词要求友好**:即使使用很大白话的提示词,也能跑出相当理想的效果,降低了用户使用门槛[38] - **主要适用场景**:非常适合日常AIGC视频的画面生成创作,以及商业场景的应用[38][40] - **已知局限性**:在多宫格漫画的剧本输出中,可能无法1:1还原每个场景画面(尤其是文字部分);音效生成在极少数情况下可能出现与场景不完全匹配的“出戏”问题[29][37][39] 产品发布与访问信息 - **发布平台**:Seedance 2.0已在豆包App和即梦里上线[42] - **访问建议**:目前建议用户在豆包App体验,因为即梦里平台生成视频可能需要排队数小时[42]
一个老人眼中的AI幻象
投资界· 2026-02-13 15:28
文章核心观点 - 公众对AI养老存在普遍且不切实际的幻想,认为能全面照顾老人的机器人护工将很快实现,但行业专家认为这在可见的未来都不可能[3][4] - 当前AI养老的真实落地应用主要集中于软件和大模型工具,如信息查询、健康管理、生活辅助等,而非公众期待的物理护理机器人[12][13] - 行业存在利用“AI”和“机器人”概念进行模糊宣传和营销的现象,部分产品名不副实且成本高昂,与用户的实际需求和体验存在巨大差距[16][17][18] - 真正有价值的AI养老发展路径应是解决具体而微的实际问题,逐步完善功能,而非追求一步到位的机器人解决方案[21][22][23] 根据相关目录分别进行总结 公众认知与行业现实的落差 - 不同年龄段公众普遍相信AI养老机器人将很快实现并能照顾晚年生活,但AI、机器人、医疗及养老行业的从业者均认为这在可见的未来都不可能实现[3][4] - 公众对AI养老的想象高度集中于能替代人类护工的机器人,源于对老龄化社会无人照护的恐惧以及护工短缺的现实,中国未来养老护工缺口可能突破一千万[5] - 这种期待被描述为“人生无奈中一道明亮到刺眼的幻影”[5] 历史案例与当前困境 - 日本作为老龄化先行者,自1990年代起大规模探索养老机器人,推出超过2000款产品,但专业护理机器人使用率不足2%,多数未能量产[6][7] - 软银于2015年推出的情感识别机器人Pepper定价19.8万日元,月服务费14800日元,但功能有限,被指为“带轮子的iPad”,于2020年停产[7][8] - 国内早期AI养老试点(如智能音箱控制养老机构设备)常因技术细节问题失败,例如设备命名不灵活导致误操作、云服务依赖网络易失灵等[9][10] - 智能化方案在想象与现实间存在巨大差距,一个小问题可能困死整个工程[11] AI养老的真实应用现状 - 当前AI在养老领域真正成熟的应用是基于大模型的软件工具,用于解答疑问、制作培训课件、辅助老年人学习与生活提醒等[12][13] - 老年人正成为深度AI用户,多模态交互和自然语言理解能力帮助其解决实际问题,例如通过AI医疗软件咨询慢性病问题[13] - 一线养老机构认为,当前所谓的护理机器人多为噱头,关键衡量标准(如能否为老人换尿不湿)远未达到,在很长时间内都难以改变[14] - 近年快速发展的大语言模型(AIGC)能力与机器人并无直接关系,AI等同于机器人是大众文化联想与企业宣传的结果[14] 行业宣传与市场乱象 - 科技巨头、网红、媒体合力鼓吹机器人的可能性,并将AI与机器人概念进行强关联(例如引用马斯克关于机器人消除资源稀缺性的预言),影响了包括老年人在内的公众认知[17] - 部分养老机构或企业将产品随意定义为“机器人”以迎合市场期待,例如将摄像头称为看护机器人,将电动洗澡刷称为洗澡机器人,将智能音箱称为情感陪伴机器人[17][18] - 主流AI养老设备成本高昂,如价值数万的智能床垫、数十万的护理机器人,还需配套昂贵的网络与电力改造费用,且往往逻辑复杂、故障繁多[18] - 舆论场、养老行业和销售环节共同组合成了制造AI养老幻象的流水线[18] 务实的发展路径 - 被戏称为“三件套”的防跌倒、测心率、提醒吃药等传统AI养老功能仍有巨大发展空间,例如提升AI+毫米波防跌倒系统的准确率并降低成本,扩展穿戴设备的健康监测范围[21] - 解决具体小问题具有实际价值,例如智能音箱的语音购物功能成功帮助不擅用手机的老人便捷购物[22] - AI养老是诸多小事(如一次问答、一次识别)的集合体,需要逐步尝试和探索,日积月累才能带来改变[22][23] - 应让老年人了解AI的真实进展并参与其中,给予尊重而非幻象[24]
海通国际研究:解读Seedance 2.0及对行业的影响
新浪财经· 2026-02-13 14:32
核心观点 - 字节跳动发布新一代视频生成模型Seedance 2.0,其技术突破实现了AI视频从“玩具”到“工具”的质变,将大幅降低内容制作成本,并驱动AI视频在短剧、游戏等领域的应用渗透,同时持续刺激底层算力(Token)和云服务需求 [1][2][24] Seedance 2.0的技术突破 - 实现工业级一致性,彻底解决长视频中角色“脸部漂移”和“风格跳变”问题,使AI视频具备真正叙事能力 [3][24] - 支持图片、视频、音频、文本四模态输入,通过“引用机制”精确控制素材,创作过程如导演调度 [3][24] - 物理仿真升级,使流体、布料、人体动作更符合物理规律,大幅减少“AI抽搐”现象 [3][24] - 实现原生音画同步,口型匹配达毫秒级精度,可一次性生成画面、对白、音效和背景音乐 [3][24] 对视频内容行业的直接影响 - AI视频生成技术成熟显著利好短视频、微短剧等短时长、高频次、轻内容的视频消费赛道 [4][25] - 预期AIGC内容市场份额将快速增加,AI内容模式可能向短视频靠拢,带动UGC和PUGC内容爆发及平台增长 [4][25] - 长视频行业面临用户注意力和消费习惯迁移的压力 [4][25] AI短剧(特别是AI漫剧)成为核心落地场景 - 2026年初AI真人解说短剧快速爆发,26年1月抖音漫剧大盘日消耗3000万中,至少有2000万来自AI真人解说剧(AI漫剧约为500万) [5][25] - AI真人解说剧成本可低至100元/分钟,为AI漫剧的十分之一,具备极高叙事效率和极低制作成本 [5][26] - AI漫剧是AI视频目前最确定的落地场景,具有清晰盈利模式 [5][26] - 2025年在投漫剧数量增长超76倍,预估2025年中国漫剧市场规模达168亿元,2026年可达243.6亿元,涨幅达45% [6][27] - 2025年AIGC漫剧供给月度占比从几乎为零升至12月的10.88%,成为增速最高的漫剧细分品类 [6][27] - 根据快手可灵数据,3Q25 AI漫剧行业日流水较4Q24增长900% [6][27] AI漫剧的盈利模式与成本优势 - 核心变现路径采取付费购买+广告分成的IAP+IAA模式,当前已实现盈利 [8][29] - 单部千万级播放作品在付费模式下净利润可达20-30万元,免费模式亦有10万元级净利 [8][29] - 平均制作成本从传统短剧的1.5-4万元/分钟压缩至约1000元/分钟,最低可达200-300元/分钟 [8][29] - 制作周期从传统短剧的30-45天缩短至7-10天 [8][31] - 剧组规模从传统短剧的60-70人缩减至6-10人 [31] AI漫剧产业链与竞争关键 - 上游包括AI技术提供方和IP厂商,中游为内容制作团队,下游为以抖快为核心的短视频分发平台 [9][32] - AI技术降低制作门槛后,内容质量成为竞争关键,上游拥有海量优质网文、漫画IP的厂商具备核心优势 [9][32] 对游戏行业的应用 - Seedance 2.0可深度接入游戏生产全流程,在概念可视化、CG宣传片、剧情动画、买量素材等环节降低创意与制作成本 [11][34] - 帮助游戏厂商以更低成本完成内容试错与版本迭代,缩短宣发物料产出周期,提升研发与营销效率 [11][34] 驱动算力(Token)与云服务需求 - Seedance 2.0生成一条10秒、1080p的视频消耗约35万token,同等质量下可灵需要40万以上token [11][35] - 一部普通的AI动态漫项目,整体往往要消耗上亿token [11][35] - 火山引擎的大模型日均token调用量从2024年底的2万亿快速增至2026年1月的63万亿 [11][37] - 阿里云外部客户2025年日均token调用接近5万亿,2026年目标至少15-20万亿,内部业务目标从16-17万亿拉至100万亿 [12][37] - 中国整体日均token消耗从2024年初的1000亿,在2025年中突破30万亿,2026年2月主流大模型合计日均已达180万亿级别 [12][37] - 海外市场同样呈现指数增长,谷歌日均token调用量从2024年4月的0.3万亿提升到2025年9月的42.7万亿 [12][39] 多模态模型竞争格局 - 终局生态预计仍由大厂主导,字节因在视频内容的数据储备上占优,但此次提升更多是技术细节突破而非代际变化,大厂模型能力可能此起彼伏 [15][42] - 建议同时关注阿里通义万相的进展 [15][42] - Seedance 2.0对快手可灵影响有限,可灵聚焦全球专业创作者市场,70%收入来自海外 [16][42] - 2026年1月可灵全球APP界面流水(不含Android)为348.3万美元,月环比增长92%,年同比增长超过7倍 [16][42] - 全球专业创作者的潜在市场规模达1200亿美元 [17][43] - 不同模型具备差异化优势:谷歌Veo侧重端到端全场景覆盖,字节Seedance在文生视频领域优异,可灵优势主要在图生视频领域 [17][43] 对传统行业的长期影响 - 多模态模型在传统行业渗透率提升,例如提升制造业模具设备精确度以减少人工纠错,以及在屠宰业实现更精准分割以减少损耗 [20][46]