数字人
搜索文档
李彦宏对话“罗永浩”:你下一次带货的方向是什么?
新浪科技· 2025-11-12 20:38
公司动态 - 百度创始人李彦宏在2025百度世界大会前视察展区布局、文心大模型及AI眼镜等前沿创新成果 [1] - 李彦宏与百度与罗永浩团队共同打造的"罗永浩"数字人进行互动,讨论带货方向 [1] 产品与技术 - 公司展示了文心大模型及AI眼镜等前沿创新成果 [1] - 公司展示了与罗永浩团队共同打造的"罗永浩"数字人 [1] - 数字人互动中提及未来带货方向可能包括智能手表等科技产品 [1]
2025年世界互联网大会|数字人闪耀乌镇峰会 中国电信以技术+场景能力竞逐产业赛道
搜狐财经· 2025-11-11 01:33
行业技术发展 - 百度“剧本驱动多模协同的高拟真数字人技术”荣获2025世界互联网大会领先科技奖,该技术突破多模态实时协同、复杂动态交互等难题,实现语言、声音和形象协调一致,效果超过真人[1][3] - 科大讯飞推出具备高度多模态交互能力的数字人导览“小飞”,可实现多人自由对话、多语种交流并具备个性化记忆能力[3] - 数字人技术正从“形似”迈向“神似”,在交互自然度、场景适配性上实现飞跃,加速渗透商业直播、场景服务及文化传播等多元领域[3][4] 中国电信技术布局 - 公司构建算力、模型、平台三位一体的技术支撑体系,总算力规模超77EFLOPS,建成国产化全液冷单集群万卡智算中心[5][6] - 自主研发千亿参数星辰大模型,支持30种方言混说语音交互和文生4K视频,幻觉率降低40%,并打造“AI数智人创作平台”降低开发门槛[6] - 通过星辰AaaS、TaaS体系推动技术接口标准化,联合23家单位成立“AI投资联盟”,并与中国煤科、联想集团等开展跨界合作构建产业生态[7] 数字人应用场景 - 在文旅领域,3D数字熊猫“苏琳”荣获“正能量网络传播AI精品案例”,支持多方言识别且无网络环境也能稳定服务[8] - 在文化传播场景,新疆图书馆“AI馆员古丽图”依托专属知识库担任数字主持人,上海电信数字人“娜姐”和江苏电信AI“媒婆”分别在劳模讲堂和传统节庆中提供互动服务[9] - 数字人已形成多形态、广覆盖的应用格局,在形象逼真度、交互智能性及行业适配性上持续升级[10]
2025中国国际智能传播论坛-AI数字人论坛在无锡举办
江南时报· 2025-11-10 15:01
论坛概况 - 2025中国国际智能传播论坛-AI数字人论坛于11月7日在江苏无锡举办,主题为“构建数字人产业创新生态” [1] - 论坛由央视网、中国互联网协会、无锡市人民政府联合主办,吸引了政府部门、行业专家、企业领军者、高校代表及投资机构负责人等数百位嘉宾参会 [1] 政策与战略支持 - 无锡市已为人工智能产业构建完整的政策支持体系,覆盖关键技术攻关、场景开放应用到企业梯度培育等关键环节 [2] - 江苏省将人工智能创新发展作为主攻方向,全面实施“人工智能+”行动,全力打造“数实融合”强省 [2] - 数字人技术正深度融入无锡政务服务、城市治理、数字消费、教育医疗等多个领域,成为赋能千行百业的新兴力量 [2] 行业发展趋势与核心命题 - AI数字人发展的核心命题已从“如何打造”转向“为何打造” [2] - 数字人与智能体和智能终端相互融合,对产业链上下游的连接、嵌入、聚合作用不断增强,带动作用不断凸显 [3] - 行业一致认为AIGC对文化产业发展带来前所未有的挑战,同时也是巨大的机遇 [7] 企业战略与业务布局 - 央视网从“媒体+”、“文化+”、“生态+”三个方向开展AI数字人应用的探索与实践,推动构建开放共赢的产业共同体 [2] - 央视网科普频道正式上线,整合中央广播电视总台资源打造权威科普生态 [4] - 央视国际网络无锡有限公司与青岛尘元科技联合发布“元视智能-空间网络IA视觉处理平台”,使视频数据分析摆脱对GPU算力的依赖 [4] 产业合作与生态构建 - 论坛期间共有5项合作协议落地,覆盖央地媒体数字化升级、全流程产业招商体系共建等领域 [4] - 3组校企签约开展产教合作项目,包括共建“AIGC漫剧创作实践基地”和《AIGC大宋印画短剧制作》项目 [4] - “长三角AI数字人产业联盟”、“长三角AIGC产教融合共同体”、“中国互联网协会数字人应用(无锡)联合实验室”等一批机构同步揭牌 [5] 技术创新与平台发布 - “元视智能-空间网络IA视觉处理平台”仅使用X86架构服务器即可高效处理视频拆条、节目版权监测、视频检索、广告监播等多场景需求 [4] - 该平台实现了系统简单、高效、能耗低,能高效处理视频舆情、智能审核等任务 [4] 应用场景与成果落地 - 无锡正致力于推动数字人从“场景试点”走向“体系化赋能”,通过“政策+要素+生态”的组合拳培育产业森林 [7] - “数字人+AIGC”在文化IP开发、短剧创作、文旅场景创新等领域取得成果 [7] - 10个院校和企业负责人代表共同启动“人工智能赋能教育高质量发展长三角推进行动”,旨在构建“技术研发-场景落地-实训赋能-就业衔接-生态共建”的全链条推进体系 [5][6] 人才培养与产教融合 - 论坛设置AIGC产教融合研讨会,进一步细化人才培养校企合作方案 [8] - “人工智能赋能教育高质量发展长三角推进行动”探索共建人工智能产业学院、联合实验室和实训基地,形成“研发-试点-推广-就业”闭环 [5][6] - 参会嘉宾实地考察数字媒体应用落地场景,推动论坛成果转化为产业发展成果 [8]
高拟真数字人直播带货有多强
科技日报· 2025-11-10 07:41
核心技术优势 - 百度自主研发的剧本驱动多模协同高拟真数字人技术获得世界互联网大会领先科技奖 [1] - 该技术通过剧本驱动实现多模态协同 解决传统数字人语音、语言、视觉多模态割裂的问题 如台词生硬、情感匹配不佳、表情手势单一等 [1] - 基于大模型生成直播剧本 剧本自带视觉标签和语音标签 指导系统生成相应动作 [2] - 采用文本自控的语音合成方案 使数字人语音能精准传递调侃、得意、强调等细微情绪 提升自然度和感染力 [2] - 高一致性超拟真数字人长视频生成技术能对多模态信号进行分析 生成高表现力片段、复杂人—物—场交互片段及大动作大表情片段 并实现长时间跨度的统一调度 确保语音、口型、表情与动作高度一致同步 [3] 行业应用与经济效益 - 数字人是融合大语言模型与多模态技术的创新应用 电商直播是其落地的极佳场景 [1] - 数字人技术使商家无需投入大量人力物力进行现场直播 显著降低场地租赁、设备采购、人员培训等费用 [1] - 数字人可以24小时不间断直播 增加商品曝光时间和销售机会 提升经济效益 [1] - 数字人正逐渐从实验室走向各类应用场景 商业化进程显著加快 [3] 技术实现细节 - 台词生成需贴合主播人设与语言风格 确保个性化与一致性 在多主播场景中实现语义逻辑、语调节奏和情感风格的整体协调 [2] - 为提升台词内容深度 引入内容规划、知识增强与事实校验机制 以降低人工智能幻觉风险 [2] - 系统能对输入的历史视频数据、剧本脚本、语音信息以及骨骼驱动等多模态信号进行分析与理解 [3]
会写剧本、能凹人设,还顺带站上领奖台,这数字人包“会”的
猿大侠· 2025-11-09 12:11
文章核心观点 - 百度“剧本驱动多模协同”高拟真数字人技术实现了重大突破,能够生成具备“人味”的数字人,其不仅能说会演,还能有效进行商业转化 [2][4][7] - 该技术已从演示阶段进入大规模实际应用,在电商直播等领域显著降低了成本并提升了转化效率 [29][31][37] - 数字人正成为内容产业的新型基础设施,提供了一种更稳定、可控的内容生产路径 [39][40] 技术原理与创新 - 技术核心是“剧本驱动多模协同”,包含五项创新技术,旨在解决数字人语言、动作、表情协同问题,使其能像真人一样“说、演、动、听、想” [5][7] - 基于文心大模型,技术可扮演资深编剧角色,自动生成包含说话内容、方式、时机及动作表情配合的全流程直播剧本 [9][11] - 在罗永浩直播案例中,系统调用知识库超过1.3万次,生成了9.7万字的讲解内容 [13] - 采用自研文本自控语音合成大模型和上下文编码器,使数字人语音合成具备语气、节奏和情绪,并能实现自然的双人对话接梗 [23] 应用效果与数据 - 罗永浩数字人直播持续6小时,吸引观众超1300万,实现GMV超5500万元 [1][32] - 该技术已孵化超过10万个数字人,活跃于电商、教育、法律、政务等数十个行业 [29][30] - 应用该技术可使商家开播成本降低80%,转化率提升31% [31] - 具体案例显示,知识博主艾弥儿数字人将用户停留时长提升101%,蒙牛悠瑞数字人使转化率提高33%,山东夏津县助农直播1个月卖出3.3万斤农产品 [32] 行业影响与趋势 - 数字人解决了真人主播的疲劳问题,能保持长时间直播的状态、语气和人设一致性,成为品牌塑造IP和流程可控的新解法 [24][27][28] - 技术带来了“绿色降本逻辑”,通过算法驱动减少碳排放,并促进产业链协同创新 [33] - 该技术已成为百度电商生态的“默认选项”,支持24小时不间断直播,显著增加商品曝光和用户触达机会 [34][35] - 数字人不再仅是演示,而是在真实场景中拉动业绩、带动节奏、撬动增长的新型生产力 [37][38]
硅基智能递交港股IPO,8万个数字人今年开始赚钱了
21世纪经济报道· 2025-11-07 08:09
公司概况与市场地位 - 南京硅基智能科技集团股份有限公司于2017年成立,是国内市场份额第一的数字人智能体提供商,累计为电信、金融等行业提供超8万个“硅基劳动力”[1][3] - 根据灼识咨询报告,2024年公司在国内数字人智能体行业市场份额为32.2%[3] - 公司已完成D轮融资,估值达31.5亿元[2] 财务表现与业务转折 - 公司营收从2022年的2.23亿元持续增长至2024年的6.55亿元,但这三年均处于调整后亏损状态,亏损额分别为4622万元、2941万元和3524万元[3] - 2025年上半年公司首次实现扭亏为盈,营收3.26亿元,经调整净利润529万元[1][3] - 盈利转折得益于策略性地将更多资源集中于大型客户,减少对业务前景不明或资金流不稳定客户的投入[3] 客户结构与相关风险 - 公司收入高度集中于少数大客户,2025年上半年前五大客户贡献了87.5%的总收入,其中最大客户(某国内领先的电信运营商)收入占比达64.4%[2][4] - 自2024年起,公司新客户数量明显下滑,从2023年的890个减少至461个,2025年上半年仅新增145个[4] - 为维持大型客户,公司采取更具竞争力的定价模式,导致数字人解决方案毛利率从2023年的45.8%降至2025年上半年的31.6%[5] 业务模式与技术核心 - 核心业务是为B端企业提供数字人解决方案,技术核心来自自研的多模态大模型DUIX ONE,可在外貌、声音、表情等维度模拟真实人类[3] - 数字人主要应用于四个场景:AI电话语音客服、AI克隆视频生成、AI直播和AI智能交互[3] - 标准数字人劳动力解决方案售价一般在0.55万至2.5万元之间[5] 行业监管与市场环境 - 各大直播平台对数字人直播态度不一并加强监管,抖音要求AI背后的真人使用者需实名注册和认证,腾讯拟禁止非真实直播内容,快手反对利用AIGC生产低质量内容,淘宝要求数字人服务商必须通过官方认证[6][7] - “AI复活”等应用引发隐私和伦理争议,行业面临技术滥用风险[8] - 公司回应称在提供相关服务时会确保获得本人或家属授权,并对生成内容进行严格审核[9] 分销渠道演变 - 公司销售结构更偏向直销模式,分销渠道占比萎缩,分销商收入从2023年的约两千万元下滑至2025年上半年的五百万元,仅占总营收的1.7%[5] - 2023年数字人直播风靡时,公司分销商数量达到巅峰(251家)[5] - 部分分销代理商的不合规操作导致平台规则收紧,客诉出现,公司被指有虚假宣传嫌疑[6]
三年揽入14亿,“数字人”这门生意赚钱吗?
新浪财经· 2025-11-06 15:39
公司业务与商业模式 - 公司核心业务是提供全环节的硅基劳动力解决方案,包括硅基智能语音、数字人视频、数字人直播及数字人智能交互,本质是为企业提供“数字员工”[3] - 公司将AI视为一种新型劳动力,并创新性地命名为“硅基劳动力”,以区别于人类“碳基劳动力”,公司名称“硅基智能”即源于此理念[3] - 截至2025年10月24日,公司已向电信、金融、医疗、教育及公共服务等多个行业客户提供超过80000个硅基劳动力[4] - 2025年6月30日后,公司进军硅基全自动内容生产领域,并打造了“大司马IP系列”,全网累计获取逾1100万关注者[8] 财务表现 - 公司营收从2022年的2.2亿元增长至2024年的6.6亿元,2025年上半年营收为3.3亿元[4] - 公司毛利率在2022年至2025年上半年期间分别为38.5%、45.8%、34.3%、31.6%[4] - 2022年至2024年公司持续亏损,经调整后亏损额分别为4622.1万元、2941.2万元、3524.2万元,但2025年上半年实现扭亏为盈,经调整后净利润为528.9万元[4] 市场地位与行业 - 根据灼识咨询资料,以2024年提供数字人智能体解决方案产生的收入计算,公司在中国所有数字人智能体提供商中排名第一,市场份额达32.2%[5] - 数字人应用场景广泛,包括电商直播间、电话推销、客服等,行业应用越发广泛[3] 客户与销售 - 公司销售以直销为主导,2022年至2025年上半年,直销收入占比均超过96%,2025年上半年达到98.3%[6] - 公司战略聚焦于深化与大型客户合作,平均客户价值从2022年的38万元显著提升至2025年上半年的113万元[6] - 公司客户集中度较高,2022年至2025年上半年,前五大客户收入占比分别为56.4%、57.7%、78.9%及87.5%,其中最大客户A(一家领先电信运营商)同期收入占比分别为16.6%、36.8%、64.4%及64.4%[7] 公司治理与股东背景 - 公司创始人、董事会主席兼行政总裁为司马华鹏,于2003年毕业于南京航空航天大学,在创立本公司前曾创立另一家网络科技公司[8] - 公司自2017年12月至2025年6月完成了八轮融资,股东包括林芝腾讯、红杉智胜、招银基金等知名机构[9] - 林芝腾讯持有公司16.59%的股份,是除创始人外最大的单一股东[9]
科大讯飞发布AI软硬一体方案,实测抗噪能力远超iPhone 17 Pro
格隆汇· 2025-11-06 12:08
公司产品发布 - 公司在2025年1024开发者节上发布AI软硬一体解决方案,旨在通过AI与硬件深度融合提升复杂环境下的感知能力[1] - 讯飞智能办公本X5采用首创的上4下4环八麦克风阵列,在远场高噪环境下实测效果远超iPhone 17 Pro[1] - 讯飞AI翻译耳机在复杂噪声环境下识别准确率高达97.1%[1] - 讯飞双屏翻译机2.0在90dB的工厂轰鸣声中实现98.69%的识别率[1] 技术创新与应用 - 公司发布基于星火语音大模型的“百变声音复刻”技术,用户仅需一句录音即可高保真复刻任意音色[1] - 该技术通过一条指令便可创造任意声音风格,为数字人、有声读物、内容创作等领域带来新变革[1]
中邮消费金融科技创新赋能消费金融服务提升
搜狐财经· 2025-11-06 02:55
公司战略与技术应用 - 公司充分发挥业务场景优势和应用研发能力,与浙江大学联合研发数字人员工“邮小宝” [1] - 公司战略以科技为先,积极引入数字人、大模型等新技术赋能业务创新和运营升级 [2] - 公司理念以客户为中心,旨在提升服务效率和客户体验 [1] 数字人员工“邮小宝”的功能与特点 - “邮小宝”具备灵动逼真的虚拟形象和专业自然的交互能力 [1] - 与传统在线客服相比,“邮小宝”能高度模拟真人的形态、行为和情感表现,增强服务互动性 [1] - “邮小宝”可提供24小时不间断服务,实现快速响应和及时解决客户问题 [1] 业务场景应用与成效 - “邮小宝”广泛应用于客户服务、风险面审、知识科普、新闻播报等业务场景 [1] - 在风险面审、优客贷首次提现等场景中,“邮小宝”能完成视频语音认证、人脸识别等动作,提升防欺诈能力 [2] - 通过化身虚拟讲师和新闻主播,“邮小宝”能生动科普产品知识并自动生成新闻播报 [2] 行业发展趋势 - 金融与科技融合的新时代到来,推动金融服务向个性化、智慧化、便捷化方向发展 [2]
昆仑万维全新SkyReels正式焕新上线
证券日报网· 2025-11-04 15:41
产品发布与定位 - 昆仑万维旗下AI视频创作平台SkyReels于11月4日正式上线Web端与移动端App [1] - 平台核心定位为一站式与多模态AI创作平台 独家优势在于聚合全球顶尖AI多模态模型 [1] - 平台集成图片生成 视频生成 数字人 音乐生成等多种AI创作方式 [1] 核心技术能力 - 此次更新搭载自研模型SkyReels V3 代表一系列多模态视频生成模型 [1] - 模型基于Multi-modal In Context Learning框架预训练 并通过子任务精调优化 [1] - 核心更新能力包括无限画布 数字人 模板功能 专家Agent 视频延长和风格化 [1] - 所有AI功能和全球顶尖模型集成于同一创作空间 实现多模态内容无缝融合 [2] - 用户可通过AI编辑 Agent Chat和拖拽三种方式在无限画布上自由组合素材 [2] 智能系统与交互创新 - 平台推出Agentic Copilot模式 提供双核智能系统支持多模态输入输出 [2] - 未来将实现Super Agent(1个全能创意助手)与Expert Agents(28位行业专家)的相互协作 [2] - SkyReels V3是业内首个支持单镜头多人多轮对话的数字人模型 [2] - 模型能精确控制每个角色的说话时机与节奏 实现多角色自然流畅互动 [2] 数字人功能与应用场景 - 数字人功能覆盖全场景对口型 支持单人图片驱动 视频驱动及多人多轮对话的图片驱动对口型 [3] - 支持最长4分钟的连续对口型 并具备丰富的运镜组合 [3] - 模型可应用于影视级对话场景 电商双人口播 游戏素材创作等多种专业场景 [3] - 音频驱动的视频生成模型首次具备多人场景的生成能力 [3] 行业趋势与未来展望 - 视觉/音频等生成模型预计保持高速迭代与更新 [3] - 模态之间的融合创作将进一步加速 模型效果与可控性将持续提升 [3] - 内容生成成本预计持续降低 [3]