Workflow
数字人
icon
搜索文档
红宝书20250522
2025-05-23 13:25
纪要涉及的行业和公司 - **行业**:HVDC、AI眼镜、小家电、电声、具身智能、固态电池、人工智能、氮化镓/碳化硅芯片、制药、高铁车轴、核电电缆、创新药、数字人、创投 - **公司**:纳微半导体、英伟达、维谛技术、中恒电气、麦格米特、禾望电气、通合科技、英可瑞、盛弘股份、四方股份、科华数据、科士达、海特高新、天岳先进、露笑科技、雷鸟创新、雷神、博士眼镜、比依股份、亚世光电、XREAL、海信视像、龙旗科技、荣泰健康、领益制造、科森科技、星纪魅族、天音控股、智立方、Rokid、亿道信息、天娱数科、浙版传媒、慈文传媒、明亮眼镜、天键股份、英派斯、国星光电、胜利精密、瀛通通讯、北鼎股份、德尔玛、小熊电器、飞科电器、九阳集团、苏泊尔、美的集团、科沃斯、国光电器、盛视科技、强邦新材、昆仑万维、海翔药业、晋西车轴、尚纬股份、恒瑞医药、热景生物、舒泰神、睿智医药、亚虹医药、迈威生物、京东集团、利亚德、凌云光、宣亚国际、力合科创、电广传媒、鲁信创投、大众公用、四川双马、天准科技、众生药业、德迈仕、东方钽业、新劲刚、世纪瑞尔、上海电影、丽珠集团、新金路、天铁科技 纪要提到的核心观点和论据 1. **HVDC行业** - 核心观点:HVDC架构优势明显,市场前景广阔,相关公司值得关注 - 论据:AI算力单机柜功率超300kW时,传统UPS因效率低、散热难、占地大等问题被淘汰,HVDC架构可减少30%能量损耗并降低70%维护成本;到2031年,HVDC在数据中心渗透率将超40%,全球市场规模将达500亿美元;英伟达与纳微半导体合作开发下一代800V HVDC架构,维谛技术计划在2026年下半年推出800VDC电源产品系列[3][4] 2. **AI眼镜行业** - 核心观点:AI眼镜市场增长迅速,雷鸟创新领先,相关公司有投资机会 - 论据:2025Q1 AI+AR国内全渠道销量达7.1万副,同比+193%;雷鸟创新市占率断层第一(50%);雷鸟创新将举办旗舰AR眼镜新品发布会,雷神AI智能眼镜将开启预售[6][7] 3. **小家电行业** - 核心观点:内需持续改善,国补提振需求,小家电行业好转,相关公司受益 - 论据:我国家电类商品零售额连续8个月保持两位数增长,2025年618消费节临近,国补驱动下,小家电产品销售额有望实现较大增长;自2024年Q4,小家电行业价格竞争趋缓,2025年Q1起,厨房小家电多数品类恢复增长[10] 4. **国光电器** - 核心观点:或受益OpenAI推出AI伙伴设备 - 论据:OpenAI计划推出1亿个人工智能“伙伴”,设备计划2026年末开始出货;公司为多家互联网企业生产制造的智能音响可搭载ChatGPT等应用,曾受微软邀请展示AI智能音箱;公司是一站式电声解决方案提供商,取得更多订单,有望抓住AI+IoT市场机遇[13] 5. **盛视科技** - 核心观点:拟投资/并购布局具身智能,业务发展良好 - 论据:公司拟通过投资、收购等方式重点布局具身智能相关领域;在人形机器人方面取得一定进展,建立了机器人产品线并在口岸场景落地应用;受益于政策推动,在口岸领域持续中标大型项目,业务外延,毛利率提升[15][16] 6. **强邦新材** - 核心观点:与小米旗下创投联合投资固态电池公司,自身业务有发展潜力 - 论据:公司与小米旗下瀚星创投联合投资合肥因势新材料,持有2.99%股权;因势新材料有技术成果转化;公司主营印刷版材,国内排名第二,外销占比45.69%,我国柔性版材印刷市场渗透率低,公司具备量产能力[17] 7. **昆仑万维** - 核心观点:发布天工超级智能体,AI业务矩阵强大,商业化成果显著 - 论据:公司发布天工超级智能体,在GAIA榜单上排名全球第一;已形成包括AI大模型等在内的AI业务矩阵,境外销售占比90.98%;多项自研模型为全球第一;AI社交海外收入增长快,短剧平台年化流水收入ARR达约1.2亿美金;与华为云有战略合作[18][19] 8. **海特高新** - 核心观点:有氮化镓/碳化硅芯片布局,多领域有业务发展 - 论据:纳微半导体与英伟达合作开发800V HVDC架构,氮化镓和碳化硅技术发挥关键作用;子公司华芯科技是氮化镓芯片专利技术第一梯队,建成国内首条6寸化合物半导体生产线;车规级碳化硅和氮化镓出货量稳定,具备相关芯片工艺制程;成功研制并交付国内首台eVTOL模拟机,是最大的第三方飞行员、乘务员培训机构[20][21] 9. **海翔药业** - 核心观点:长期战略合作辉瑞,业务多元化发展 - 论据:公司和辉瑞是长期战略合作伙伴,合作的培南项目预计下半年注册完成;原料药业务占比57%,外销为主,合作多家全球知名制药公司;染料业务占比28%,蓝色系产品全球市占率60%[22][23] 10. **晋西车轴** - 核心观点:争取高铁车轴批量供货,业务有新突破 - 论据:高铁车轴国产化进程加速,公司将争取实现批量供货;公司是时速350公里高铁动车轴试制首批参研单位,相关车轴具备批量供货条件,完成高端产品试制交付;2025年有产品中标项目[24][25] 11. **尚纬股份** - 核心观点:国产核电电缆核心供应商,受益行业发展 - 论据:全球核聚变项目建设全面提速,我国聚变能源发展进入新阶段;公司为国内少数具备核级电缆研发与生产资质的企业,为中国核电认定4A供应商,与中广核等公司稳定合作;自主知识产权“华龙一号”核设施用电缆技术被认定为“国际先进水平”[25][26] 12. **创新药行业** - 核心观点:恒瑞医药上市受关注,创新药市场有潜力 - 论据:恒瑞医药将于2025年5月23日正式在港交所上市,暗盘交易股价大涨32%;2018年以来在创新药方面,公司与全球合作伙伴进行了13笔对外许可交易,潜在总交易额约为140亿美元,首付款总额约为6亿美元[30] 13. **数字人行业** - 核心观点:京东数字人发展良好,相关公司有机会 - 论据:近三个月,京东大模型服务调用量环比提升200%,内部运行的智能体超1.4万个,AI“工作搭子”解决超18%的工作内容,直播成本低,带货水平高,超1万家商家已使用京东数字人直播[30] 14. **创投行业** - 核心观点:债券市场“科技板”支持头部股权投资机构,相关公司或受益 - 论据:央行朱鹤新表示,债券市场“科技板”将重点支持排名靠前、投资经验丰富的头部股权投资机构发行债券[30] 其他重要但是可能被忽略的内容 1. **天准科技**:2024年11月推出人形机器人大脑控制器,获头部人形机器人公司认可,累计订单金额1000多万元,获显著先发优势[31] 2. **众生药业**:1类创新药昂拉地韦片获国家药品监督管理局批准上市,适用于成人单纯性甲型流感患者治疗,可18个小时快速缓解全身流感症状,网传机构表示其销售峰值可达20亿,预计2026年可进入医保目录[32] 3. **德迈仕**:汇心创智以约6.69亿元拿下公司控股股东德迈仕投资100%股权,成为间接控股股东,实控人将变更为潘异,潘异有丰富投资经验[33] 4. **东方钽业**:铍在核聚变反应堆材料中有巨大应用潜力,价值量预计占成本的30%-40%,公司参股公司西材院是国内唯一铍材研究加工基地[33] 5. **新劲刚**:射频功放产品成功进入国产大飞机(C919)产业链并实现小批量交付,相隐身材料应用广泛[34] 6. **世纪瑞尔**:子公司北海智行已推出AI 3D、2D数字人系列产品及AI全息音箱陪伴产品AI HoloBox(未证实)[34] 7. **上海电影**:上美影泡泡米益智乐园即将开园,融合经典IP打造超大国潮童趣玩乐区[34] 8. **丽珠集团**:拟约15.87亿元收购越南IMP公司64.81%股份,IMP与公司现有产品有较高协同性[35] 9. **新金路**:石英砂项目有序推进,有极少量产品销售[35] 10. **天铁科技**:与欣界能源签署战略合作框架协议,拟在固态电池锂金属负极材料及相关领域开展合作,负责产线金属锂材料供应[35]
深度思考大模型、高商业可用数字人、具身智能,京东AI正在产业端疯长
中金在线· 2025-05-22 16:27
大模型技术进展 - 公司推出750B超大规模模型,具备"深度思考"和"非深度思考"双通道能力,满足即时响应和深度推理需求 [1][3] - 750B模型采用动态分层蒸馏、跨领域数据治理技术,降低训练部署成本,在1280K长文本评测中实现接近100%准确率 [3] - 公司拥有全尺寸大模型矩阵:3B和10B模型侧重响应效率,81B模型平衡效果与性能 [3] 技术研发突破 - 公司研究成果发表于Nature旗下期刊,系统性解决开放环境下大模型开发效率难题 [4] - 创新模型蒸馏、数据治理、训练优化与云边协同方法,推理效率提升30%,训练成本降低70% [4] - JoyBuild开发平台提供100+算法工具链,支持企业将通用模型转化为专业模型 [6] 数字人商业化应用 - 通用数字人大模型2.0支持精品音色微调、声唇对齐,适配多品类主播人设与情感表达 [7] - 618期间推出六大行业定制数字人(如赛博先锋、国风达人),免费开放给商家使用 [7] - 三只松鼠合作案例显示,AI直播间在流量低谷时段仍实现超千万元GMV [9] 具身智能发展 - Joy Inside技术将角色大模型植入机器人等硬件,赋予硬件情感连接与长期记忆能力 [11] - 基于日均超千万次智能对话数据,实现硬件人格化演进 [11]
新纽科技展开数字人业务探索,众企业入局或将有效扩大数字人产业成长空间
证券之星· 2025-05-22 09:11
他表示,技术层面上,我国当前大多数数字人仍在技术方面存在融合与衔接方面不流畅等问题。这直接 导致了在使用中数字人可能出现的交互反应延迟、动作生硬、表情不自然等表现,让使用体验大打折 扣。而现阶段高质量的技术制作与高精度的品质把控又会直接提高数字人产品的整体成本,影响数字人 面向更广泛下沉市场的广泛普及与应用。另一方面,在伦理与合规上,数字人产品通常会包含肖像权、 版权等归属问题,那么随着数字人的进一步市场化商用,由此产生的内容及形象如何能达到监管要求, 如何合理保障数字人产品供应链中的多方权益等,都急需数字人产业多方与相关监管部门来共同探讨、 协商与解决。 同时,该分析人士还指出,参与到数字人产业的企业在后续发展中应不断寻找企业创新技术与市场合规 发展之间的有效平衡点,快速让自身推广与研发的数字人产品或解决方案真正从底层的"技术展现"升级 为更高层次的"价值创造",从而为我国产业数字化升级提供持续且有力的核心驱动力。 此前,中国互联网协会发布《中国数字人发展报告(2024)》中提到,截至2024年,中国与数字人相关的 企业已达114.4万家,仅2024年前五个月就新增注册企业17.4万余家。同时该报告还分析认 ...
腾讯控股:1Q25财报点评:收入、利润均超预期,游戏、广告展现高景气度-20250518
华创证券· 2025-05-18 13:45
报告公司投资评级 - 维持“推荐”评级 [1][5] 报告的核心观点 - 腾讯 1Q25 财报显示收入和利润均超一致预期 游戏和广告业务表现亮眼 公司在各业务领域展现出良好发展态势 随着 AI 基建投入和应用场景的不断拓展 未来有望实现持续增长 [1][4] 根据相关目录分别进行总结 1Q25 经营情况 - 实现总收入 1800 亿元 YOY+13% 超彭博一致预期 3% [1][8] - 实现 NON - IFRS 口径下归母净利润 613 亿元 YOY+22% 超彭博一致预期 3% [1][8] 基本面更新 业务结构与增速 - 结构上游戏>金融科技及企业服务>社交网络>广告 游戏业务收入 595 亿元占比 33% 金融科技及企业服务业务收入 549 亿元占比 31% 社交网络业务收入 326 亿元占比 18% 营销服务业务收入 319 亿元占比 18% [15] - 增速上游戏>广告>社交网络>金融科技及企业服务 游戏业务 YOY+24% 连续 5 个季度提速 广告业务 YOY+20% 环比增速继续提升 社交网络业务 YOY+7% 连续 4 个季度提速 金融科技与企业服务业务 YOY+5% 增速改善趋势持续 [15] 各业务板块情况 - **网络游戏**:实现收入 595 亿元 YOY+24% 超预期 8% 增速连续五个季度爬升 [4][18] - **本土市场**:收入 429 亿元 YOY+24% 增速近几个季度新高 超预期 7% 核心游戏如《王者荣耀》《和平精英》等表现出色 新游《三角洲行动》《地下城与勇士手游》贡献增量 [4][20] - **国际市场**:收入 166 亿元 YOY+23% 增速近几个季度新高 超预期 8% Supercell 收入增速释放 存量产品 PUBGM、CODM 流水维持增长 [4][20] - **展望**:维持对 25 年全年游戏收入增速相似水平判断 二季度开始受基数效应影响增速或平缓回落 [4][23] - **社交网络**:收入 326 亿元 YOY+7% 符合预期 主要驱动力为国内手游分成、TME 会员收入增长和小游戏分成 [4][26] - **营销服务**:收入 319 亿元 YOY+20% 超预期 3% 由供给端库存扩张、需求端广告主支撑和 AI 赋能广告落地共同作用 [4][30] - **金融科技及企业服务业务**:收入 549 亿元 YOY+5% 符合预期 收入增速有所改善 金融科技小个位数增长 云及企业服务恢复双位数增长 AI 对云服务业务收入拉动作用显现 [4][32] CAPEX 情况 - 本季度 CAPEX 达到 230 亿元 YOY+60% 占收入 13% 符合前期 low teens 收入占比指引 AI 基建投入若回报率好于其他现金使用选项 投入具有可见持续性 [4][32] AI 模型&应用情况 - 底模端混元大模型迭代更新图像 2.0 模型 主打实时生图+写实画质 改善文生图速度 加强对广告物料生成赋能 后续关注多模态方向更新 [4][35] - 应用端元宝接入微信 后续关注元宝功能迭代、微信体系中 Agent 和存量 APP 改造进展 [4][35] 盈利预测与投资建议 - 调整 25 - 27 年公司收入预测至 7286/7845/8356 亿元 YOY+10%/8%/7% [5] - NON - IFRS 口径归母净利润预测至 2560/2886/3131 亿元 YOY+15%/13%/9% [5] - 预计 25 - 27 年实现 NON - IFRS 口径 EPS 28.00/31.85/34.87 元 YOY+16%/14%/9% [5] - 给予公司 25 年 IFRS 口径 EPS 18 - 20x 目标 PE 区间 对应目标价 545.69 - 606.33 港元 [5] 主要财务指标 |指标|2024A|2025E|2026E|2027E| |----|----|----|----|----| |营业总收入(百万)|660,257|728,562|784,482|835,593| |同比增速(%)|8.4%|10.3%|7.7%|6.5%| |归母净利润(百万)|194,073|218,386|250,946|275,496| |同比增速(%)|68.4%|12.5%|14.9%|9.8%| |每股盈利(元)|21.04|23.77|27.31|29.98| |市盈率(倍)|22.3|19.7|17.2|15.6| |市净率(倍)|4.4|3.6|3.0|2.5|[6]
腾讯控股(00700):1Q25财报点评:收入、利润均超预期,游戏、广告展现高景气度
华创证券· 2025-05-18 10:45
报告公司投资评级 - 维持“推荐”评级,给予公司 25 年 IFRS 口径 EPS 18 - 20x 目标 PE 区间,对应目标价 545.69 - 606.33 港元 [1][5] 报告的核心观点 - 腾讯 1Q25 财报显示收入、利润均超一致预期,各业务表现良好,游戏业务增速创新高,广告业务受多因素驱动超预期,社交网络和金融科技及企业服务业务符合预期,AI 基建投入持续且有望带来回报,维持“推荐”评级 [1][4][5] 根据相关目录分别进行总结 1Q25 经营情况 - 实现总收入 1800 亿元,YOY + 13%,超彭博一致预期 3%;NON - IFRS 口径下归母净利润 613 亿元,YOY + 22%,超彭博一致预期 3% [1][8] 基本面更新 业务结构与增速 - 结构上游戏>金融科技及企业服务>社交网络>广告,本季度游戏收入 595 亿元占比 33%,金融科技及企业服务收入 549 亿元占比 31%,社交网络收入 326 亿元占比 18%,营销服务收入 319 亿元占比 18% [15] - 增速上游戏>广告>社交网络>金融科技及企业服务,游戏业务 YOY + 24%连续 5 个季度提速,广告业务 YOY + 20%环比增速提升,社交网络业务 YOY + 7%连续 4 个季度提速,金融科技与企业服务业务 YOY + 5%增速低位但 QOQ 改善 [15] 各业务情况 - **网络游戏**:本季度收入 595 亿元,YOY + 24%超预期 8%,增速连续五个季度爬升。本土市场收入 429 亿元,YOY + 24%超预期 7%,核心游戏景气度高,新游表现佳;国际市场收入 166 亿元,YOY + 23%超预期 8%,Supercell 贡献仍在,存量产品流水增长。预计 25 年全年游戏收入增速与 24 年(YOY + 10%)相似,二季度起增速受基数效应影响平缓回落 [4][18][20] - **社交网络**:本季度收入 326 亿元,YOY + 7%符合预期,主要驱动力为国内手游分成、TME 会员收入增长和小游戏分成 [26] - **营销服务**:本季度收入 319 亿元,YOY + 20%超预期 3%,源于供给端库存扩张、需求端广告主支撑和 AI 赋能广告落地 [30] - **金融科技及企业服务业务**:本季度收入 549 亿元,YOY + 5%符合预期,收入增速改善。金融科技小个位数增长,云及企业服务恢复双位数增长,AI 对云服务业务收入拉动作用显现 [32] CAPEX 情况 - 本季度 CAPEX 达 230 亿元,YOY + 60%,占收入 13%,符合前期 low teens 收入占比指引,AI 基建投入若回报率好于其他现金使用选项则具有持续性 [4][32] AI 模型与应用 - 底模端混元大模型迭代图像 2.0 模型,改善文生图速度,有望加强广告物料生成赋能;应用端元宝接入微信,后续关注功能迭代、微信体系中 Agent 和存量 APP 改造进展 [4][35] 盈利预测与投资建议 - 调整 25 - 27 年公司收入预测至 7286/7845/8356 亿元,YOY + 10%/8%/7%;NON - IFRS 口径归母净利润预测至 2560/2886/3131 亿元,YOY + 15%/13%/9%;预计 25 - 27 年 NON - IFRS 口径 EPS 28.00/31.85/34.87 元,YOY + 16%/14%/9% [5] 附录:财务预测表 - 展示了 2024 - 2027E 年资产负债表、利润表、现金流量表相关数据,以及成长能力、获利能力、偿债能力、每股指标、估值比率等财务比率 [39]
AI推动数字人“飞入寻常百姓家”
科技日报· 2025-05-12 07:40
数字人产业发展现状 - 2025年日本大阪世博会中国馆采用科大讯飞打造的"AI孙悟空",精通中、日、英三种语言,复刻经典动画形象[1] - 数字人技术作为AI、元宇宙关键连接点,正从"可用"向"好用"升级[1] - 截至2024年,中国数字人相关企业达114.4万家,2024年前5个月新增注册17.4万余家[2] 数字人技术演进 - 发展经历三阶段:真人驱动→程序驱动→AI驱动,AI驱动阶段实现高拟真度交互与思维[4] - 科大讯飞2023年发布超拟人数字人,基于多模扩散生成大模型实现实时动作生成[5] - 腾讯智影支持形象/声音克隆,阿里巴巴EchoMimic可赋予静态图像语音表情[6] 数字人应用场景分类 - 形成三大类:媒介数字人(场景占比50%)、服务数字人(30%)、行业数字人(20%)[3] - 媒介数字人案例:央视"AI主持人"与真人同台,交互流畅度达真假难辨水平[3] - 服务数字人应用于政务/电商/金融,行业数字人渗透医疗/教育/企业管理[3] 技术突破与行业趋势 - 科大讯飞研发动作表征抽取技术,提升数字人视频生成效率30%以上[7] - 生成式AI降低制作门槛,用户可通过单张照片+语音生成个性化数字人[7] - 行业专家认为数字人将成为AI创新入口和下一代互联网交互界面[6] 商业化发展方向 - 当前存在同质化问题,个性化定制成为未来重点[7] - 数字分身概念兴起,未来或协助处理工作与生活事务[8]
揭秘数字人赛道成功密码:优秀运营商做对了什么?
搜狐财经· 2025-05-09 13:04
由于每一个创业者的优势不同,资源不同,针对客户群体的独特优势,铭顺科技这边会提供全面的目标群体用户画像,和变现思路。从平台获客到、到客户 转化再到私域运营以及销售转换全流程赋能,同时更需要创业者自我总结。 "与其做万金油,不如成为垂直赛道的专家。"与铭顺科技合作教培行业数字人服务商坦言。该团队凭借创始人深耕教育领域十年的资源,专注只为教培行业 提供数字人服务系统,将铭顺数字人系统与课件生成、AI讲课深度结合,也获得了大量客户。 02:商业模式,从工具售卖到生态价值挖掘 铭顺科技优秀客户坦言:不只是单纯售卖数字人系统的利润,而是"基础功能+增值服务+资源整合"的复合模式更有盈利空间。 合作一年的江西运营商的做法极具代表性: 1基础层。按账号数收取年费 数字人赛道持续火爆,有人一年喜提豪车,有人合作两个月就是爆款不断,客户不断。也有客户觉得没有达到预期效果。为何同样的项目,结果却天差地 别? 01:精准定位用差异化撕开市场缺口 3生态层。对接商品供应链,通过数字人直播实现佣金分成。 这种模式使其客单价翻了3倍,续费率超73%。 对于多样化的盈利模式变现,铭顺提供的不仅是系统,还有商业模式的进化路径。《商业模式手册 ...
爱尔眼科2024年净利润35.56亿元 毛利率下降5.27个百分点
犀牛财经· 2025-05-08 19:12
财务表现 - 2024年实现营业收入209.83亿元,同比增长3.02% [2] - 归母净利润35.56亿元,同比增长5.87% [2] - 扣非净利润30.99亿元,同比下降11.82% [2] - 基本每股收益为0.38元/股 [2] - 毛利率为48.12%,同比下降5.27% [4] - 加权平均净资产收益率为17.89%,同比下降0.99个百分点 [4] - 经营活动现金净流入48.82亿元,同比下降16.86% [4] - 期末资产负债率为34.41%,同比微增0.75个百分点 [4] - 流动比率为1.45,速动比率为1.26,短期偿债能力保持健康 [4] 业务板块 - 屈光项目收入76.02亿元,同比增长2.31%,收入占比36.23% [4] - 视光服务收入52.78亿元,同比增长6.42%,收入占比25.16% [4] - 白内障项目收入34.89亿元,同比增长4.87%,收入占比16.63% [4] 研发与创新 - 研发投入3.2亿元,研发费用率为1.53% [4] - 推出眼科大模型AierGPT,智能客服系统处理201万人次咨询,服务效率提升30% [4] - 数字人"爱科"覆盖200余家医院,实现虚拟导诊、健康科普等功能 [4] 股东回报 - 拟向全体股东每10股派发现金红利1.6元(含税) [4]
AI大家说 | 从“形似”到“神似”,我们离完美数字人越来越近了
红杉汇· 2025-05-06 18:12
这是内容产业的一次重要转变。接下来,让我们更深入地走入数字人行业,了解它的核心技术与未来发展趋 势。 从静态形象到智能交互的技术演进 想要制作一个会说话的面孔,模型需要学习逼真的"音素到视素" (phoneme-to-viseme) 映射关系:也就是语 音 (音素) 与其对应的嘴部动作 (视素) 之间的关联。如果这个映射"跑偏"了,嘴型和声音就会看起来不 同步,甚至完全脱节。 想象一下你说话的样子:说话时动的不仅仅是嘴,你的整个面部、甚至上半身和手,都会随之而动;而 且,每个人说话都有自己独特的风格,即使说的是同一句话,不同的人的嘴部动作也会不同。如果你试图 把你的口型同步数据套用到其他人脸上,效果会很怪异。 还记得《西部世界》里栩栩如生的仿生人吗?如今,这场赛博朋克的幻想正在照进现实。数字人正在为AI的下 一个重大飞跃提供可能——将面孔与声音结合,创造出会说话的角色——并不是简单地让图片上的人物动起来 再配音,而是能真正像人类一样进行创作与互动。 而这个领域研究已经在过去几年里发生了翻天覆地的变化: 早期技术(2017-2020): 依赖CNN (卷积神经网络) 和GAN (生成对抗网络) ,通过单张图片生 ...