语音合成技术
搜索文档
临近春节,刘德华、冯巩、蔡明等AI名人拜年视频走红,专家提醒:存在法律风险
新浪财经· 2026-02-08 16:13
AI技术应用与市场现象 - 临近春节,短视频平台上掀起由AI技术生成名人拜年视频的热潮,包括影视巨星、体坛健将、商界名人甚至历史人物拱手作揖说吉祥话的场景[1] - 此类AI拜年视频为新春祝福注入新意并带来趣味,技术正以前所未有的娱乐化姿态介入传统节日[1] - 技术带来的新奇反差在短时间内赚足流量,有用户表示不仅自己看还会转发给朋友[1] 技术实现原理 - 此类视频的核心制作技术是当前人工智能最前沿的深度合成技术[2] - 视觉合成部分采用AI换脸或deep fake技术,利用深度学习和计算机视觉算法,通过大模型学习真实人物的面部特征、表情、嘴型等信息,然后将这些特征合成到新的素材中[3] - 语音合成技术能够模仿名人的声音、语调甚至语气,让AI生成的声音听起来非常逼真,视觉与语音合成结合即可生成AI拜年短视频[4] 内容识别与用户反馈 - 部分用户通过观察细节来区分视频真假,例如人物眨眼频率不自然或口型和声音对不上[2] - 有用户认为此类内容娱乐一下还可以[2] - 也有用户坦言第一反应是惊奇,随之而来的是一种难以言说的违和感[1] 法律与合规风险 - 《中华人民共和国民法典》对肖像权和声音权的保护作出了明确规定,人脸、人声等都是具有生物识别功能的敏感个人信息[5] - 未经授权的深度合成,侵犯了当事人的人格权益,包括肖像权、声音权[5] - 如果合成的声音可能涉及造成他人侮辱、诽谤,损害他人声誉,可能构成名誉权侵权[5] - 如果使用的声音来自受著作权保护的录音制品和作品,或他人声音已被注册为商标,可能还涉及侵害著作权和商标权等[6] - 《互联网信息服务深度合成管理规定》明确,提供人脸、人声等生物识别信息编辑功能的,应当提示使用者依法告知被编辑个人,并取得其单独同意[6] 平台治理与行业现状 - 记者搜索发现,一些官方账号发布的短视频标注了已获授权,但大量用户自行生成的拜年内容难以判断其合规性[6] - 某视频制作应用功能使用规范中明确,不得输入、分享任何未经授权的内容,不得侵害他人的著作权、专利权、商标权、肖像权、名誉权、荣誉权等[6] - 有短视频平台对涉及利用AI生成知名运动员形象进行虚假仿冒等违规内容进行过处理,但海量审核、用户规避等原因让治理存在防不胜防的现实困境[6] - 正规的大型AI服务平台和一些专业的视频合成工具已开始尝试加入防止滥用机制,例如强制添加AI生成标识或水印,在用户协议中明确禁止未授权使用他人的形象和声音,部分平台还在后台建立了内容检测和过滤机制[7] - 现状是仍有很多工具没有足够的防护机制,特别是一些开源模型或小型应用,可能根本没有添加标识或监管限制,给滥用留下了空间[7] 平台责任与监管要求 - 对于生产、传播此类内容的网络平台,必须履行好主体责任,建立全链条管理机制[7] - AI的经营者、平台企业应当尽到主体责任,严格落实相关的管理办法所规定的标识义务[7] - 平台应提供便捷的工具,并建立事前提示、事中审核和事后追溯的完整机制[7] - 在接到权利人发出的侵权通知之后,应当及时采取删除等措施,如果没有采取相应措施,应当就损害扩大部分承担连带责任[7]
通义千问Qwen3-TTS迎来升级:支持多音色、多语种和多方言
凤凰网· 2025-12-10 23:18
公司产品升级 - 通义千问宣布其语音合成模型Qwen3-TTS迎来升级,目前可通过Qwen API访问 [1] - 升级后的Qwen3-TTS提供超过49种高品质音色,涵盖不同性别、年龄、地域特征与角色设定 [1] - 模型支持中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等10大主流语言 [1] - 模型同时支持闽南语、粤语、四川话等更多音色的方言生成 [1] 技术性能表现 - Qwen3-TTS的平均词错误率(WER)优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview [1]
阿里通义千问Qwen3-TTS全面升级
每日经济新闻· 2025-12-10 19:55
公司产品升级 - 阿里通义千问Qwen3-TTS模型全面升级,可通过Qwen API访问 [1] - 该模型是支持多音色、多语种和多方言的旗舰语音合成模型 [1] - 主要改进包括:音色支持更加丰富、多语种多方言能力持续增强、韵律与语速更加自然且更拟人化 [1]
阿里通义千问语音合成模型Qwen3-TTS全面升级
第一财经· 2025-12-10 19:43
公司产品升级 - 阿里通义千问Qwen3-TTS模型全面升级,成为支持多音色、多语种和多方言的旗舰语音合成模型 [1] - 升级后的模型可通过Qwen API访问 [1] - 主要改进包括:提供更加丰富的音色支持 [1] - 主要改进包括:多语种多方言能力持续增强 [1] - 主要改进包括:韵律和语速更加自然、更拟人化 [1]
教育早餐荟 | 教育部提示考生和家长通过官方渠道查询信息;BOSS直聘倡议招聘方发布真实职位
北京商报· 2025-06-30 09:42
高等教育发展 - 截至2025年6月20日全国高等学校共计3167所 其中普通高等学校2919所(本科1365所 高职专科1554所) 成人高等学校248所 [1] - 北京市启动连续3年的思政课教师队伍建设专项工作 目标打造专职为主 专兼结合的高素质教师队伍 [3] 招聘行业动态 - BOSS直聘发布倡议书 呼吁行业建立信用评价体系 提升服务标准 推动招聘市场透明化 [4] 人工智能技术进展 - 科大讯飞语音合成技术升级 实现一句话声音复刻与超拟人合成突破 采用三阶段层次化建模框架(星火底座建模 音色恢复 高精度声码器) [5]