快手(01024)
搜索文档
从「对口型」到「会表演」,刚进化的可灵AI数字人,技术公开了
机器之心· 2025-09-15 20:19
技术框架 - 采用多模态大语言模型赋能的两阶段生成框架 通过多模态导演模块将音频 图像和文字提示组织成结构化故事线 [6][7][8] - 首先生成蓝图视频明确整体节奏和风格 然后基于首尾帧条件并行生成子段落视频 最后拼接完整视频 [10][11][12] - 引入音频对齐插帧策略保证口型与声学节奏的帧级同步 并通过负向CFG抑制身份漂移模式 [12][17] 数据与训练 - 从演讲 对话 歌唱等语料库收集数千小时视频 通过专家模型筛选嘴部清晰度 音画同步等维度 再经人工复核得到数百小时高质量训练数据 [14] - 构建包含375个"参考图-音频-文本提示"的测评基准 涵盖多语言 多情感 多动作场景 未来将开源 [14] 性能表现 - 在GSB测评体系中总体效果对比OmniHuman-1达2.39 对比HeyGen达1.37 在口型同步维度对比HeyGen达2.35 [16][24] - 在英语演讲场景对比OmniHuman-1的口型同步指标为1.00 中文演讲场景对比OmniHuman-1达3.90 [24] - 支持分钟级长视频生成 总生成时间理论上与单段生成相当 在1分钟视频中保持身份一致性和动态性 [28] 应用功能 - 能够准确还原高难度音节口型(如"truth"的[u:]发音)和高频语音中的静音段落口型状态 [25] - 精准响应情绪 动作 镜头三类文本控制 包括"兴奋"情绪和"镜头缓慢上移"等指令 [26] - 已集成至可灵平台开启公测 支持用户通过图像 音频和文本生成数字人视频 [2][31]
以史为鉴,美联储降息周期港股科技表现突出!聚焦AI龙头,港股互联网ETF(513770)连涨7日
新浪基金· 2025-09-15 20:17
港股市场表现 - 恒指和恒科指分别收涨0.22%和0.91% 呈现低开高走再转跌回升的震荡走势 [1] - 大型科技龙头多数上行 阿里巴巴-W涨超2% 哔哩哔哩-W涨近5% 小米集团-W和快手-W涨逾1% 腾讯控股平盘报收 [1] - 个股表现突出 狮腾控股涨25.34% 哔哩哔哩-W涨4.93% 阿里巴巴-W涨2.32% 心动公司涨1.92% [2] 港股互联网ETF表现 - 港股互联网ETF(513770)收涨0.32% 为连续第7日上涨 成交额5.99亿元 [2] - 基金规模突破110亿元创历史新高 年内日均成交额近6亿元 支持T+0交易且不受QDII额度限制 [13] - 标的指数中证港股通互联网指数年内涨41.94% 最大涨幅60.89% 显著优于恒生科技指数的27.29%和48.64% [12][13] 资金流向 - 港股互联网ETF近5日连续获资金净流入7.9亿元 近20日累计净流入超28亿元 [4] - 基金重仓港股科技龙头 前四大权重股小米集团-W(15.65%)、腾讯控股(14.35%)、阿里巴巴-W(13.87%)和美团-W(10.87%)合计占比54.74% [11] 流动性环境改善 - 美联储即将公布利率决议 市场预期"大幅降息" 鲍威尔鸽派表态缓解港币流动性压力 [6] - 历史数据显示美联储降息阶段恒生科技绝对收益表现突出 [6] - 人民币兑美元汇率升值利好港股资产 科技及创新药板块直接受益 [8] AI业务进展 - 阿里巴巴旗下钉钉开售首款AI硬件DingTalk A1 布局AI生态获取数据及用户新渠道 [8] - 阿里使用自主设计芯片训练AI模型 通义千问发布Qwen3-Next架构实现模型计算效率突破 [8] - 芯片供给和模型迭代成为云计算加速核心基础 驱动互联网板块估值重估 [9] 估值水平 - 中证港股通互联网指数PE为25.07倍 处于近10年26.43%分位点历史低位 [9] - 估值显著优于美股和A股科技板块 低于恒生科技指数31.09%的历史分位水平 [9]
快手入选《麻省理工科技评论》\"50家聪明公司\"名单
格隆汇· 2025-09-15 19:07
公司入选与荣誉 - 公司入选《麻省理工科技评论》2025年度"50家聪明公司"名单 [1] - 一同入选企业包括阿里巴巴 DeepSeek 宇树科技等 [1] 技术平台特性 - 公司推出创意生产力平台"可灵 AI"提供视频和图片生成与编辑能力 [1] - 平台将复杂AI视频生成技术转化为易于操作 可控性强且具备规模化商用能力的工具 [1] - 可灵AI生成效果处于行业领先水平 [1] 市场认可与应用 - 平台获得海内外用户广泛认可 [1] - 技术已广泛应用于不同行业场景中 [1] 评选标准解读 - 聪明公司需具备聪明地研发和使用新技术的特征 [1] - 聪明公司需具备聪明地理解市场和商业机会的特征 [1]
9月19日8:00上快手 iPhone 17 系列新品现货发售
中国新闻网· 2025-09-15 18:50
iPhone17系列新品发售 - 快手电商将于9月19日8:00开启iPhone17系列新品现货发售通道 [1] - 平台推出多项购机福利 包括以旧换新服务最高2500元补贴 指定机型分期免息及“国家补贴”优惠立省500元 [1] - 平台提供正品保障等多重权益 用户可通过搜索“苹果新品”或“Apple产品天远数码旗舰店”提前预约 [1] 平台营销策略 - 快手电商将利用直播间、短视频等内容场域进行新品种草 触达潜在用户 实现从内容场到电商场的热点流量联动 [3] - 平台升级打造“快手超级新品日”品牌营销IP 通过全域资源及精细化运营帮助品牌提升新品发布期的市场声量和销售业绩 [5] - 新品运营成为快手电商手机行业的年度重点专项 平台希望与手机品牌共创 利用流量及营销资源延长新品生命周期并实现GMV增长 [5] 用户与平台数据 - 2025年第二季度快手总流量创新高 平均日活跃用户达4.09亿同比增长3.4% 平均月活跃用户达7.15亿同比增长3.3% [5] - 用户总使用时长同比增长7.5% 增长得益于高质量用户增长策略、优化流量分配机制、良好社区互动氛围及差异化内容社区生态 [5] 平台发展战略 - 快手电商将持续发挥全域经营优势 丰富细分类目商品供给 跨场域满足用户多元化消费需求 [5] - 平台将充分利用AI能力赋能商家全链路经营 降低商家在内容电商平台的经营成本 [5] - 以Apple为代表的标杆品牌在快手取得显著增长 众多手机品牌已将快手作为长期经营阵地 [3]
快手双11激励政策:将投入20亿用户红包及10亿商品补贴
新浪科技· 2025-09-15 18:19
平台激励政策 - 双11蓄水期阶段投入180亿流量补贴 [1] - 全周期流量补贴达数千亿 [1] - 正式期阶段提供20亿用户红包及10亿商品补贴 [1] 大促支持措施 - 帮助用户、达人、商家抓住双11大促红利 [1]
快手联合健康中国发起心理健康问题征集 将邀请专家直播解答
央广网· 2025-09-15 17:58
活动详情 - 快手联合健康中国及中国健康教育于9月15日发起线上心理健康问题征集活动 邀请全国网友提问 并在10月10日第34个世界精神卫生日由专家进行直播答疑 [1] - 网友可通过快手官微活动页留言 点击调查问卷或搜索"种太阳计划"参与问题征集 平台还会通过站内信随机向部分用户发送私信征集问题 [1] - 这是该计划首次在直播前面向全国网友征集问题 并根据普遍关心的问题针对性设计直播内容 [1] 平台举措 - 公司2021年8月正式组建心理危机干预社会救助小组 通过AI预警系统识别 建立安抚干预标准流程 并联动全国各地警方实行7X24小时在线干预 [1] - 2024年5月上线的"种太阳计划"利用平台技术优势识别和干预有轻生倾向人群 同时发挥内容优势联动媒体 心理健康专家和专业创作者 [2] - 计划通过心理健康知识科普直播帮助公众走出心理阴霾 延续了借助短视频+直播形式传播心理健康科普知识的做法 [2]
多款大模型更新,游戏传媒ETF(517770)涨超1.5%,捕捉港股AI应用发展机遇
新浪财经· 2025-09-15 13:19
指数及ETF表现 - 中证沪港深游戏及文化传媒指数强势上涨1.59%至931580点,成分股完美世界上涨10.01%、中国电影上涨8.83%、三七互娱上涨7.43% [1] - 游戏传媒ETF上涨1.57%至1.29元,紧密跟踪中证沪港深游戏及文化传媒指数 [1][2] 大模型技术突破 - 阿里巴巴发布Qwen3-Next-80B-A3B双模型,训练成本较Qwen3-32B降低90%,推理效率提升10倍 [1] - 字节跳动上线"即梦图片4.0"支持直出4K图,文生图审美与可控性更优 [1] - 快手AIGC超级员工Kwali开启内测,可实现从文案到发布的短视频全流程生成 [1] 行业应用前景 - 大模型迭代推动AI在内容创作/社交/广告/电商/教育/金融等领域加速商业化 [2] - 指数覆盖游戏、影视、广播电视、营销、出版、教育及文化演出等领域上市公司 [2] - 前十大权重股合计占比54.14%,包括快手-W、腾讯控股、分众传媒等头部企业 [2]
快手“国补合伙人”徐小米:信任的根本始终来自于产品和服务
中国新闻网· 2025-09-15 12:45
主播成长历程 - 主播徐小米2019年进入直播行业从零起步 迅速成长为快手头部主播 粉丝量超2835万[1] - 早期从事多份职业包括食品厂记账 电子厂零件安装 幼师 红木家具销售 修理厂合伙 均未长期持续[2] - 2018年9月首次开播带货 销售额从1700元起步 不到一年突破百万元[4] 2020年双十一单场GMV破亿[5] - 目前最高单场销售额突破一亿元 成为快手千万粉丝量级顶级主播[5] 直播风格与用户关系 - 采用山东方言"拉呱"(闲聊)式直播 分享生活经历与情感 营造朋友式互动氛围[1][6] - 粉丝因真诚自然风格产生信任 用户主动分享生活形成双向交流[6] - 强调"信任即责任"理念 认为信任基础来自产品与服务品质[1][6] 选品与供应链管理 - 从服饰主播转型综合品类主播 所有产品需经团队初筛 试用及主播最终拍板[6] - 要求主播跟随学习至少两年方可独立开播 选品原则为"自身满意才推荐" 拒绝高佣金低质产品[8] - 聘请专业顾问 明确运营分工 目标为粉丝提供高性价比产品与专业服务[8] 政策红利利用策略 - 2025年成为快手"国补合伙人" 借助国家以旧换新补贴政策推动消费升级[1][9] - 联合海尔 海信等品牌举办以旧换新专场 将政策转化为直观利益计算[10] - 通过"国补+平台补贴+品牌优惠"三重补贴机制 提升产品性价比[12] - 团队密切跟踪政策进度 协调平台与品牌方优化直播内容安排[10] 行业影响与定位 - 直播电商行业头部主播具备强议价能力 单场销售上万件产品可获取品牌更优价格[12] - 通过内容与商品高效链接 降低用户决策成本 实现省钱省心购物体验[12] - 主播职业生命周期达7年 持续通过内容专业化与供应链优化巩固行业地位[12]
8月快手酒水销售,价格下探趋势持续扩散
新浪财经· 2025-09-15 11:22
核心观点 - 即时零售价格战导致酒水产品均价全面下探 各价格带热销产品均出现价格下跌[1] - 快手平台酒水消费呈现明显价格下移趋势 100元以下和800元以上价格区间占比上升[2] - 名酒品牌在快手平台存在巨大蓝海市场 但需通过价格让步换取市场份额[3] 白酒品类表现 - 100-800元价格区间销量占比全面下降 其中100-300元区间占比38.36%下降5个百分点 300-500元区间占比13.12%下降7个百分点 500-800元区间占比5.04%下降1个百分点[2] - 100元以下价格区间占比从20.92%上升至26.52% 上涨6个百分点 800元以上区间占比从8.76%上升至16.96% 上涨8个百分点[2] - 800元以上热销SKU以金徽酒和五粮液为主 500-800元区间以汾酒产品热销 300-500元区间有习酒和舍得等品牌[3] - 五粮液普五价格被压低至840元/瓶 与电商渠道940元/瓶平均售价存在百元差价[3] 啤酒品类表现 - 100元以下价格区间销售占比从63.11%上升至81.16% 上涨18个百分点 100-300元区间占比从36.67%下降至17.42% 下滑19个百分点[4] - 华润啤酒因价格乱象问题对即时零售平台停止销售 勇闯产品售价跌破30元/件[5] - 品牌啤酒以青岛啤酒、崂山啤酒、喜力啤酒为核心 销售单位多为件或多件 精酿品牌主打保鲜概念 销售单位多为桶或瓶[5] 葡萄酒品类表现 - 300元以下价格带为主要销售区间 100元以下占比41.49%较上月39.27%略有上升 100-300元区间占比从51.19%下降至45.98%[6] - 拉菲品牌在800元以上价格区间热销TOP5中占有四席 300-500元区间也是其舒适区[6] - 张裕品牌出现在500-800元价格区间TOP5中 各价格带热销榜单多为小众进口品牌[6] 黄酒品类表现 - 100元以下价格区间销售占比从15.73%上升至21.13% 上涨5个百分点 100-300元区间占比从82.80%下降至75.74% 下降7个百分点[7] - 500元以上价格区间热销榜由古越龙山统治 100元以下区间频繁出现烹饪用酒[7] 行业趋势分析 - 即时零售渠道崛起对酒水价格影响明显 各品类消费均受到波及[7] - 互联网平台取得绝大多数消费者关注 消费者习惯全网比价[7] - 啤酒巨头华润雪花、青岛啤酒和白酒巨头茅台等重要品牌都在布局即时零售渠道[8] - 即时零售是取悦年轻消费人群和非餐饮消费的重要补充 行业趋势变化将淘汰部分传统经销商[8]
快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破
机器之心· 2025-09-13 16:54
文章核心观点 - 快手可灵团队提出MIDAS框架 通过自回归视频生成结合轻量化扩散去噪头 实现多模态条件下实时流畅的数字人视频合成 具备低延迟 多模态控制与长时序一致性三大核心优势[2] - 该系统支持音频 姿态 文本等多种输入信号 通过统一多模态条件投影器编码到共享潜在空间 实现语义和空间一致的数字人生成[5] - 在双人对话 多语言歌唱合成和交互世界建模等任务中表现优异 生成延迟低于500ms 支持长达4分钟的连续生成且质量衰减显著低于基线方法[13][14] 技术架构 - 采用因果潜在预测加扩散渲染设计 嵌套类似大语言模型的自回归架构逐帧预测潜在表示 再由轻量级扩散头进行去噪和高清渲染[7] - 使用高压缩率自编码器DC-AE 压缩比高达64倍 每帧图像最多用60个令牌表示 支持最高384×640分辨率图像重建[8] - 基于Qwen2.5-3B作为自回归主干网络 扩散头采用PixArt-α/mlp结构 支持分块流式生成每块6帧[12] 性能表现 - 端到端生成延迟低于500ms 扩散头仅需4步去噪 在效率与视觉质量间取得最佳平衡[4][14] - 支持双人实时对话交互 生成与语音同步的口型 表情和倾听姿态[13] - 实现中文 日文 英文歌曲的唇形同步 生成视频可达4分钟无显著漂移[13] - 在Minecraft数据集训练后展现出良好场景一致性与记忆能力[13] 数据与训练 - 构建约2万小时大规模多模态对话数据集 涵盖单人 双人对话场景及多语言多风格内容[10] - 引入可控噪声注入训练策略 通过20级噪声桶和对应嵌入缓解自回归模型推理阶段的曝光偏差问题[12] 应用前景 - 为虚拟人直播 元宇宙交互 多模态AI智能体等应用奠定技术基础[16] - 模块化设计允许灵活扩展至更多模态与控制信号[16] - 未来将探索更高分辨率 更复杂交互逻辑下的生成能力 并推进系统在真实产品环境中的部署[17]