Workflow
数字人技术
icon
搜索文档
618全平台GMV突破21亿,交个朋友控股(01450)“AI+数字人”酝酿增长新动能
智通财经网· 2025-06-25 14:22
交个朋友在618大促中的优异表现,不仅验证了其直播电商业务的持续增长动能,更凸显了其前瞻性布局AI技术的战 略价值。而此次交个朋友在数字人直播上取得的商业化成功,更将成为驱动未来业绩增长的重要引擎。 AI多模态协同技术赋能直播电商新范式 公开数据显示,此次交个朋友与百度优选联合推出的罗永浩数字人直播创下数字人直播带货新纪录,累计观看人次突 破1300万,总成交额(GMV)高达5500万元,其中3C数码、食品饮料等核心品类表现甚至超越5月真人直播同期数据。 今年618大促期间,交个朋友控股(01450)交出了一份喜人的成绩单:截至6月20日,交个朋友的618全平台GMV达21亿 元,同比增长17.2%;订单量超600万单,场观人数突破7.5亿人次。其中,淘宝订单量同比增长65%,抖音增长42%,新 入驻的百度优选平台两场直播GMV突破1.05亿元,数字人直播更凭借超强"技术力"成为行业焦点。 智通财经APP了解到,本次数字人直播的核心技术架构包含五大模块:由"剧本"驱动的数字人多模协同技术、融合了 多模规划和深度思考的"剧本"生成技术、场景中动态决策的实时交互技术、文本自控的语音合成技术和高一致性超拟 真数字人 ...
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
机器之心· 2025-06-25 08:46
技术概述 - TaoAvatar是阿里巴巴淘宝Meta技术团队研发的3D真人数字人技术,支持手机和XR设备上的实时渲染与AI对话[1] - 该技术基于3D高斯泼溅技术,能通过多视角视频输入快速生成高逼真度数字人形象,精准捕捉面部表情、手势动作及衣物细节[8] - 已在中国三维视觉大会上入选"最佳演示Demo候选",并宣布开源3D数字人应用MNN-TaoAvatar[2][9] 核心技术 - 采用3D高斯泼溅技术实现全身互动式数字人解决方案,显著降低建模成本并提高效率[8][9] - 集成语音识别(ASR)、大语言模型(LLM)、语音合成(TTS)和数字人渲染(NNR)等核心模块[11] - 支持端侧实时对话与渲染,ASR模型RTF优化至0.18,TTS模型RTF优化至0.58,A2BS模型RTF优化至0.34[16][17][18] - 自主研发NNR渲染器实现25万点云模型60FPS流畅渲染[18] 性能优势 - 在骁龙8 Elite芯片手机上实现端侧运行,ASR模型281.65M,LLM模型838.74M,TTS模型1.34GB[16] - MNN-LLM在骁龙8 Gen3芯片上预填充速度达165 tokens/s,解码速度41.16 tokens/s[16] - 相比云端方案,可在手机端完成所有算法处理,无需高端显卡支持[13][14] 架构优化 - 采用StyleUnet+MLP混合建模降低计算成本,动态高斯点云技术提升渲染稳定性[50] - 数据同步优化实现GPU内存直接读取,免去数据拷贝时间[40] - 调度优化引入"Dirty机制",仅处理变化数据,将部分模型运行频率降至20fps[41] - 模型量化技术将Qwen2.5-1.5B模型从5.58GB压缩至1.2GB[31] 应用部署 - 推荐配置为骁龙8 Gen3或同级CPU,8GB内存,5GB存储空间[51] - 单个数字人ID存储空间控制在100-200MB,25万高斯点云为最佳平衡点[46] - 支持Android和iOS平台,已开源在GitHub供开发者体验[2][52]
真·罗永浩直播干不过假·罗永浩?网友:不是老罗在演AI吧?
量子位· 2025-06-18 15:49
看视频效果,和真人直播不能说一毛一样吧,那也是 真假 难辨 的程度! 西风 发自 凹非寺 量子位 | 公众号 QbitAI 罗永浩,干不过罗永浩??? 今年618大促, 罗永浩数 字人 百度电商直播上岗,"一不小心"就创造了个纪录—— 带货单 量 超 5月罗永 浩 真人 百度 电商直 播首秀同期数据 ! 只见交个朋友直播间中,不单单罗永浩一个数字人现身,还有 朱萧木 (交 个朋友直播间副主 播) 数字人 担任"助播"。 俩"人"全程互动配合默契,说话、动作、神态那叫一个自然。 甚至有人在评论区问老罗" 你是不是真人在扮演AI,要是被威胁了就眨眨眼 "。 就连罗永浩本人"罗氏幽默"的 特色直播风格,数字人也能高度复刻 。 比如罗永浩数字人卖花生油: 有人问吃花生油会不会变胖,胖也没关系,我们有一款T恤可以穿到200斤,你在我直播间就能形成闭环。 各种花式回答,让人眼前一亮又一亮,自嘲式回复网友问"棉柔巾脸大得用几张",be like: 你脸大有多大?能有我210斤的脸大吗?我也就使用一张就够了。 一场直播下来俩数字人真的是赢麻了,战绩斐然: 不仅 直播吸引了超1300万人次观看 , GMV (商品交易总额) 突 ...
罗永浩数字人直播背后,也许是一种新商业模式的开始
搜狐财经· 2025-06-18 15:45
6月15号晚上,地球上出现了两个罗永浩。 一个,在屏幕前卖力的直播。另一个,或许翘着二郎腿,躺在沙发上,看着自己卖力的直播。 我还记得,大概就是去年这个时候。刘强东也开了一场数字人直播。虽然数据不错,但也有不少批评。吐槽人物不像、吐槽动作僵硬、吐槽没什么感情。 我甚至看到一条热评:东哥你但凡把那牛奶拿起来嘬一口,我马上就下单。 我们视频号也用过一段时间数字人,被无数观众吐槽,只能默默停掉。确实,去年的数字人技术,还不够成熟。 比如,动作单调。来回来去,就是那么几个动作。 比如,容易识别。判断数字人的方法,就是让他挥挥手挡脸。当时的技术,还做不到"渲染一半的脸型"。 比如,恐怖谷效应。这种"挺像,但又没那么像"的状态,最容易让人产生"生理性恐惧"。 但仅仅一年时间,老罗这场直播,真的惊讶了无数人。 直播卖了多少多少钱,我就不报菜名了。新闻稿里都能看到。我朋友圈的小声比比同学直接震惊了。连不文明用语都快飙出来了。 到底有多像?我放一段你感受一下。 公司小伙伴看完也特别激动,找到我说,咱们写篇文章聊聊感受吧。 我合上电脑,一声感叹。我没有什么具体的观点,但却有一种模模糊糊的感受: 好家伙。 让我嘬一口?那哪过瘾,老 ...
解密数字老罗带货“账本”
北京商报· 2025-06-17 22:34
6月15日17:00,锤子科技CEO罗永浩和搭档朱萧木的数字人在百度开播带货,看完自己的分身直播,老罗吓了一跳,讲解产品、跟弹幕互动甚至讲段子, 真假难辨。这场直播中,由AI生成的剧本式产品讲解9.7万字,动作8300个,GMV(商品交易总额)超5500万元。6月17日,百度优选宣布和交个朋友达成 战略合作,罗永浩入驻百度优选,将以真人+数字人的形式不定期开播。 对于老罗而言,数字人给自己减轻了不少工作量,对交个朋友来说,可加快直播间复制、"出海"的节奏,百度数字人的样本则多了一个头部主播。其实5月 下旬罗永浩真人在百度已开播一场,交个朋友副总裁吴加录告诉北京商报记者,"两场所带商品部分重合,在介绍这些重合的商品时,数字老罗的话术不一 样,百度把内容重新扩充了,还结合了热点以及互动"。 超5500万元 "如果没有数字人,这得把我累成啥样!",数字人下播后,老罗感慨并第一时间分享了成绩单:GMV突破5000万元,没有令人失望。 6月17日,百度副总裁、电商总经理平晓黎和百度电商商业业务部负责人、数字人创新业务部负责人吴晨霞披露了更多维度的数据,超1300万用户观看了直 播、3倍用户互动量、用户观播时长超30%、 ...
闪电快讯|官宣罗永浩为首席体验官,百度电商官宣两大计划培育数字主播生态
新浪财经· 2025-06-17 17:46
6月12日,罗永浩官宣将启用数字人直播;三天后的6月15日,直播如期开始,"数字人罗永浩"与"数字人朱萧木"同时出现在直播间讲解商品。 未来百度电商计划持续推进数字人解决方案落地,并官宣将推出两大计划。 其中,梦蝶计划将通过超头主播数字人打造、流量和预算扶持,实现百度优选超头主播的数量倍增;繁星计划则将再次追加10万个慧播星免费 数字人,投入1亿元数字人消费补贴,增加千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。 罗永浩微博透露称,该场直播GMV最终突破了5000万,该罗永浩数字人由百度电商慧播星团队打造。6月17日百度举办AI Day活动,分享了罗 永浩数字人所采用的技术和解决方案。 具体而言,罗永浩数字人所采用的解决方案基于文心 4.5T实现了融合多模规划与深度思考的剧本生成功能,并可由剧本驱动数字人多模协 同,实现动态决策的实时交互,使数字人的"神、形、音、容、话"达到高度统一。 百度称其为"业内首个多模态高度融合的数字人",后者在多任务复杂场景下的数字人带货效果可媲美真人,还可以进行24小时不间断直播。 活动现场,平晓黎还官宣罗永浩将担任百度慧播星首席体验官,入驻百度优选平台,不定期进 ...
腾讯混元推出AI数字人技术:一张照片配音频即可生成唱歌视频
凤凰网· 2025-05-28 17:23
腾讯发布开源语音数字人模型HunyuanVideo-Avatar - 公司正式发布并开源语音数字人模型HunyuanVideo-Avatar 该技术仅需用户提供一张人物图像和一段音频文件即可自动生成包含自然表情、精准唇形同步以及全身动作的动态视频内容 [1] - 该模型基于腾讯混元视频大模型与MuseV技术深度融合开发 具备强大的多模态理解能力 能够自动识别输入图像中的人物环境信息以及音频所承载的情感内容 [1] - 模型突破了传统数字人技术仅支持头部驱动的局限性 全面支持头肩、半身与全身三种景别模式 同时覆盖多种艺术风格和多物种角色驱动 并具备双人或多人互动场景的处理能力 [1] 技术架构与应用场景 - 模型采用多模态扩散Transformer(MM-DiT)作为核心架构 通过角色图像注入模块确保视频中人物的一致性表现 音频情感模块能够从声音和图像中提取情感特征 [2] - 针对多人场景 模型配备面部感知音频适配器 利用人脸掩码技术实现多角色的独立精准驱动 [2] - 该模型已在腾讯音乐娱乐集团多个核心产品中实现落地应用 包括QQ音乐的AI虚拟形象同步演唱 酷狗音乐的AI虚拟人讲故事 以及全民K歌的用户专属MV生成功能 [2] 技术优势与开放计划 - 在主体一致性和音画同步准确度方面已达到业内领先水平 超越现有开源和闭源解决方案 在画面动态性和肢体自然度表现上与其他主流闭源方案处于同等技术水准 [2] - 单主体功能已在腾讯混元官方网站开放体验 用户可通过"模型广场-混元生视频-数字人-语音驱动"路径访问相关功能 当前支持不超过14秒的音频文件上传 [3] - 公司将逐步开源更多高级功能模块 此次开源举措将推动AI视频生成技术的普及应用 为短视频创作、电商营销、广告制作等垂直领域提供低成本的技术解决方案 [3]
硅基智能砸1000万美元换DUIX域名,贵且难记或注定翻车?
36氪· 2025-05-12 12:54
近日,有这么一条ai圈子里的消息,着实引起了我的注意和兴趣。AI数字人科技公司硅基智能以1000万美元的高价收购了稀缺的四字母.com域名 DUIX.com,并同步上线了同名数字人实时交互平台。 高价收购域名作为提升品牌形象和影响力的动作之一,也比较常见,算不上什么大惊小怪的事,但是至于硅基智能买的这个域名,那就一言难尽了。 此举是品牌战略上的大胆创新,还是在域名选择上的一次失误?1000万美元的投入能否转化为相应的品牌价值和市场认可? 我们也试图从其业务背景、DUIX平台的定位、域名选择的利弊,及潜在的品牌策略调整等多个维度,深入剖析这一决策的得失,探讨DUIX.com是否"贵 且难记,或注定翻车"。 硅基智能:AI数字人赛道的老牌玩家 硅基智能,圈子里的人应该不会陌生。一家成立于2017年的中国AI科技公司,专注于数字人技术的研发与应用。 作为一家深耕人工智能领域的企业,其核心技术涵盖自然语言处理(NLP)、多模态交互、知识图谱及情感计算,致力于打造高度拟真的数字人交互体 验。公司此前已在智能客服、虚拟助手等领域取得一定市场份额,而此次推出的DUIX平台则是其在数字人技术上的最新力作。 DUIX的全称是D ...
短视频时代,如何让数字人脱颖而出?专业团队揭秘核心拍摄法则
搜狐财经· 2025-05-09 11:39
针对常见的"网红脸僵化"问题,技术团队通过2000组对比实验发现:后置镜头拍摄的面部微表情细腻度提升38%,而将机位控制在腰部高度,可使人物姿态 更舒展自然。合作的知识博主实测调整机位后,视频评论区"亲切真实"的反馈量激增3倍。 在短视频流量红利持续释放的当下,数字人技术正成为品牌营销的新蓝海。近日,深耕数字人技术研发的铭顺科技向行业公开其核心拍摄方法论,为从业者 提供可落地的解决方案。 一、场景选择决定内容势能 根据铭顺科技的实测对比中,相同脚本下,公园实景拍摄的数字人短视频完播率比绿幕棚拍高出42%。"外景自带的动态光影和空间层次,能自然赋予数字 人生活气息。"铭顺科技技术总监指出,咖啡厅的书架光影、公园的树影婆娑,这些真实场景细节能让观众在3秒内建立情感连接。 二、设备运用暗藏技术玄机 三、动态捕捉重构交互体验 "数字人不是虚拟雕像,而是有温度的内容载体。"在铭顺科技服务的教育机构案例中,讲师数字人通过加入手势互动、眼神交流等自然动作,使课程转化率 提升27%。其自主研发的动作捕捉系统可精准还原15种微表情,配合AI算法实现神态自适应调整。 值得关注的是,铭顺科技提出的"技术交付+运营赋能"双轨模式正在 ...
2025年客易云数字人技术革新与生态赋能,重塑行业TOP标准
搜狐财经· 2025-04-13 14:48
文章核心观点 - 2025年客易云凭借生物级细节还原能力、全链路智能工具及全球化生态布局稳居行业头部阵营,重新定义数字人服务行业标准,引领行业迈向新时代 [1][11] 核心技术 - 唇齿联动引擎基于解剖学原理构建唇部运动模型,支持68种细微动作与牙齿咬合状态实时联动,唇部运动与真实演员吻合度达99.3% [3] - 动态光照补偿通过环境光智能分析,自动调整唇部高光与牙齿反光效果,确保不同光照条件下视觉一致性 [3] - 牙齿形态库建立12种标准牙齿模型库,支持个性化调整,牙齿还原度较行业平均水平提升40% [3] 功能延展 - AI口播生成基于“数字分身”技术,用户录制3 - 5分钟真人视频可克隆高保真数字人形象,支持一键生成口播视频,60秒完成脚本撰写、配音、剪辑全流程 [5] - 智能剪辑系统集成AI热点分析、多语言智能字幕等功能,支持100 + 国家语言的短视频自动化生产,“悬浮窗 + 特效 + 智能组件”编辑模块可将素材制作效率提升300% [5] - 数字人具备实时语音应答、微表情反馈能力,结合自然语言处理技术,实现跨语言场景下的精准互动 [5] 生态优势 - 系统支持APP、小程序、H5等多终端运行,实现多国语言一键切换,助力企业拓展全球市场 [7] - 用户可无限克隆数字人形象,开通子账号实现团队协作,支持按需充值算力,灵活匹配业务需求 [7] - 开放代理招募计划,通过云服务订阅制提供基础版至旗舰版梯度选择,企业定制成本压缩至行业均价的40%,支持按路包年付费模式 [7] 行业趋势与公司未来角色 - 数字人技术从“工具”向“基础设施”演进,客易云通过API技术开放与行业解决方案定制推动技术普惠 [9] - 客易云私有化部署能力与模块化设计可满足金融、政务等高合规场景需求,“数字人 + AI大模型”融合为创新奠定基础 [9] - 客易云“无限克隆 + 无限算力”商业模式或将加速行业从“高成本定制”向“工业化生产”转型 [9]