Workflow
可灵2.6模型
icon
搜索文档
筹资20亿美元!快手科技拟发首单离岸债券
新华财经· 2026-01-15 11:31
公司融资动态 - 公司正在推进其历史上首次离岸债券发行计划 拟筹资总额约20亿美元[2] - 计划通过发行5年期及10年期美元计价债券募集15亿美元 同时发行5年期点心债券募集约5亿美元资金[2] - 发债所得资金将主要用于一般公司用途及增强境外现金储备 以支持其持续扩张的全球战略[2] - 此次离岸债券发行有助于优化公司的债务结构、降低融资成本 并彰显出其在国际资本市场的信用认可度提升[3] 资本支出与AI战略 - 2025年公司总资本支出预计将超过140亿元人民币 其中逾三分之二已明确投向其自主研发的人工智能平台“可灵”[2] - 2026年公司将继续维持相似的资本支出结构 坚定加码AI基础设施建设[2] - “可灵”AI平台作为公司技术战略的核心 正驱动内容推荐、视频生成、广告投放等多场景智能化升级[2] AI业务进展与商业化 - 旗下“可灵”AI在2025年12月的月收入突破2000万美元 对应年化收入运行率约2.4亿美元[2] - 2025年12月以来 “可灵”AI旗下产品迭代加速 先后发布了全球首个大一统多模态视频模型可灵O1、具备“音画同出”能力的可灵2.6模型 并上线了全新的动作控制功能[3] - 2026年以来“可灵”AI日均收入较12月1日至12月17日均值增长171% 下载量增长1385%[3] 财务与业务展望 - 预计2026年公司主业继续稳健增长 收入端同比增长9%至1549亿元[3] - 预计2026年公司广告业务同比增长10%、其他业务同比增长21%[3] - 预计2026年公司利润端经调整利润225亿元 同比增长10%[3]
快手午盘收涨5.48%,可灵 AI 商业化再提速,12 月 ARR 达 2.4 亿美元
智通财经· 2026-01-14 13:35
公司股价表现 - 2025年1月14日,快手科技(01024)开盘走强,盘中涨幅一度超6%,截至午盘收盘报82.75港元,涨幅5.48% [1] 可灵AI商业化进展 - 2025年12月,可灵AI单月收入突破2000万美元,对应年化收入运行率(ARR)达2.4亿美元,商业化进展持续提速 [1] - 可灵AI上线不到两年即实现ARR达2.4亿美元,此前于2025年3月(上线第10个月)ARR突破1亿美元,短短9个月内ARR实现翻倍以上增长,速度快于市场预期 [1] - 花旗认为,可灵12月单月收入略高于此前预期,指向2026年全年收入仍存在上修空间 [2] - 摩根士丹利测算,2025年第四季度可灵AI收入约为3.5–4亿元人民币,明显高于公司此前3亿元人民币的指引 [2] - 杰富瑞指出,可灵在上线19个月内实现ARR达2.4亿美元,商业化节奏显著加快 [2] 产品与技术迭代 - 2025年12月以来,可灵AI进入密集迭代周期,先后发布全球首个大一统多模态视频模型可灵O1,以及具备“音画同出”能力的可灵2.6模型,并同步上线全新的动作控制等功能 [1] - 相关能力在海外创作者市场获得积极反馈,被视为推动当月收入快速放量的重要因素 [1] - 持续的模型突破与产品创新,是公司AI业务收入长期增长的核心驱动 [2] 市场观点与公司影响 - 多家国际投行指出,可灵AI的商业化已逐步进入兑现阶段 [2] - 市场普遍认为,AI业务的确定性正在对冲快手传统业务的周期波动,并逐步成为公司估值体系中的重要增量变量 [2]
快手(01024)午盘收涨5.48%,可灵 AI 商业化再提速,12 月 ARR 达 2.4 亿美元
智通财经网· 2026-01-14 12:25
公司股价表现 - 2025年1月14日,快手科技(01024)开盘走强,盘中涨幅一度超6%,截至午盘收盘报82.75港元,涨幅5.48% [1] 可灵AI商业化进展 - 2025年12月,快手旗下可灵AI单月收入突破2000万美元,对应年化收入运行率(ARR)达2.4亿美元 [1] - 可灵AI上线不到两年即实现此关键节点,其商业化进展持续提速 [1] - 此前于2025年3月(上线第10个月)ARR突破1亿美元,在随后9个月内ARR实现翻倍以上增长,商业化爬坡速度显著快于市场预期 [1] 产品迭代与市场反馈 - 2025年12月以来,可灵AI进入密集迭代周期,先后发布全球首个大一统多模态视频模型“可灵O1”及具备“音画同出”能力的“可灵2.6”模型,并同步上线全新动作控制等功能 [1] - 相关能力在海外创作者市场获得积极反馈,被视为推动当月收入快速放量的重要因素 [1] 机构观点与业绩评估 - 花旗指出,可灵12月单月收入略高于此前预期,认为这一表现指向2026年全年收入仍存在上修空间 [2] - 摩根士丹利测算,2025年第四季度可灵AI收入约为3.5–4亿元人民币,明显高于公司此前3亿元人民币的指引 [2] - 杰富瑞指出,可灵在上线19个月内实现ARR达2.4亿美元,商业化节奏显著加快,持续的模型突破与产品创新是其收入长期增长的核心驱动 [2] - 市场普遍认为,AI业务的确定性正在对冲快手传统业务的周期波动,并逐步成为公司估值体系中的重要增量变量 [2]
快手科技(01024)旗下可灵AI12月收入超过2000万美元 ARR突破2.4亿美元
智通财经网· 2026-01-13 22:47
公司财务表现 - 快手科技旗下可灵AI在2025年12月的当月收入突破2000万美元 [1] - 对应年化收入运行率(ARR)达到2.4亿美元 [1] - 可灵AI的ARR在2025年3月(正式上线第10个月)突破1亿美元,显示收入增长迅速 [1] 产品与技术进展 - 2025年12月,可灵AI发布全球首个大一统多模态视频模型“可灵O1” [1] - 同期发布具备“音画同出”能力的可灵2.6模型 [1] - 产品上线了全新的动作控制等功能,保持高速迭代 [1]
可灵AI 12月收入超过2000万美元,ARR突破2.4亿美元
格隆汇· 2026-01-13 22:36
公司财务表现 - 可灵AI在2025年12月的当月收入突破2000万美元 [1] - 对应年化收入运行率(ARR)达到2.4亿美元 [1] - ARR从2025年3月突破1亿美元增长至12月的2.4亿美元,显示收入增长迅速 [1] 产品与技术进展 - 2025年12月,公司发布全球首个大一统多模态视频模型可灵O1 [1] - 同期发布具备“音画同出”能力的可灵2.6模型 [1] - 上线全新的动作控制等功能,产品保持高速迭代 [1] 业务发展里程碑 - 可灵AI在2025年3月,即正式上线第10个月时ARR突破1亿美元 [1] - 2025年12月ARR达到2.4亿美元,较3月实现显著增长 [1]
所想即所见,所言即所闻,可灵AI打开全民创作新入口
北京商报· 2025-12-30 14:51
核心观点 - 可灵AI通过发布大一统多模态模型“可灵O1”和2.6版本的“音画同出”能力,实现了视频创作流程的革命性简化,将视频创作从专业技能转变为人人可及的日常表达 [1][3][9] 技术突破:大一统多模态模型“可灵O1” - 可灵O1是全球首个大一统多模态视频模型,基于MVL理念,打破了传统单一视频生成任务的模型边界 [3] - 该模型将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务融合于同一个全能引擎,实现一站式创作流程 [3] - 用户只需输入自然语言指令,模型即可完成像素级语义重构,例如“把这张白天的照片改成夜晚”、“给主角换一条红裙子” [3] - 模型具备“导演思维”,能记住角色的特征,确保在镜头切换时主体特征稳定,并支持自由组合多个不同主体或与参考图混搭 [3] - 同步升级的可灵图像O1模型也主打特征高度一致,支持纯文本生成或上传最多10张参考图进行融合再创作,确保主体元素稳定和画面氛围统一 [4] - 该系列模型对系列短剧、广告电商、品牌IP等用户是刚需,实现了从灵感构思到最终输出的“一站式闭环” [4] 技术突破:“音画同出”能力 - 可灵2.6模型的“音画同出”能力让角色不仅能动作精准,更能开口说话、发出环境音效,且声音与画面节奏严丝合缝 [5][6] - 该能力重构了传统“先生成无声画面,再人工配音”的割裂工作流,用户输入文本或图片加提示词,即可一键生成包含人声、音效、环境声的完整视频 [6] - 语音当前支持中英文,单次生成最长10秒 [6] - 突破体现在三大维度:音画协同,实现深度语义对齐;音频质量接近专业混音效果;语义理解能准确把握复杂剧情与口语表达 [6] - 模型具备音色控制能力,支持生成说话、对话、旁白、唱歌、Rap等多种声音类型,并可混合环境音效,让创作者能控制角色的语气、情绪和背景音乐 [6] 行业影响与创作范式转变 - 技术将视频创作从专业技能变为人人可及的日常表达 [1] - 图灵奖得主指出,AI本质是“模式识别”的强大工具,不会取代艺术家,但会改变他们工作的方式 [7] - 公司的愿景是“让每个人都能用AI讲出好故事”,其主语是人,旨在通过提升基础模型能力定义人类与AI交互的新方式 [8] - 公司赋予创作者更高自由度的控制权,如调节动作幅度、修改镜头节奏、删除帧、叠加多段生成结果,让声音和画面“同频” [8] - 在艺术节上展映的三支短片由艺术家与可灵超级创作者联动完成,是对未来创作范式的预演 [9] - 此次技术升级可能标志着“用一张图讲一个有声有色故事”时代的开始 [9]
5天连更5次,可灵AI年末“狂飙式”升级
量子位· 2025-12-10 12:26
公司近期产品发布概览 - 12月初,公司在5天内密集发布了5次产品更新,包括全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型以及可灵数字人2.0等功能 [1][2] - 这一系列更新显著提升了生成式AI领域的竞争激烈程度 [2] 可灵O1模型的核心创新 - 可灵O1基于创新的多模态视觉语言交互理念,将所有生成和编辑任务融合于一个全能引擎,为用户提供从灵感到成品的一站式闭环创作流程 [3] - 视频O1模型打破了传统单一视频生成任务的边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务融合于同一引擎,解决了主体一致性和视频画面可控性等难题 [6] - 图像O1模型实现了从基础图像生成到高阶细节编辑的全链路无缝衔接,用户可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作 [7] - 有行业人士将可灵O1评价为“视频界的Nano Banana” [4] 可灵2.6模型的“音画同出”能力 - 可灵2.6模型上线了里程碑式的“音画同出”能力,改变了传统AI视频生成“先无声画面、后人工配音”的工作流程 [10] - 该模型能在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频,极大提升了创作效率 [11] - 目前支持生成最长10秒的视频,语音部分支持中文和英文,更多语言及固定声线功能正在研发中 [12] - 该模型在音画协同、音频质量和语义理解上表现亮眼,能够支持说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成 [12][27] 技术性能与市场应用 - 根据公司内部测评,在“图片参考”任务上,可灵AI对Google Veo 3.1的整体效果胜负比为247%;在“指令变换”任务上,与Runway Aleph对比的整体效果胜负比达到230% [18] - 公司目前覆盖的企业用户数超过2万家,涵盖影视制作、广告、创意设计、自媒体、游戏、电商等诸多领域 [26] - 数字人2.0功能允许用户上传角色图,添加配音并描述角色表现,即可生成表现力生动的自定义数字人视频,视频内容最长可达5分钟 [27] 行业影响与发展愿景 - 自2024年6月正式推出以来,公司的每一次迭代都引发了业界的广泛关注和讨论,从早期案例到获得特斯拉创始人马斯克点赞,公司已成为视觉生成技术走向成熟过程中的关键角色 [20] - 公司高级管理层表示,其初心是让每个人都能用AI讲出好的故事,并希望这一天更快到来 [28] - 通过年末的系列更新,公司正朝着这一愿景加速迈进 [29]
徐新成为张一鸣“新股东”,以3.4万亿估值拿下字节跳动部分股权;任正非强调AI重在应用;理想AI眼镜重量仅36g丨AI产业周报
创业邦· 2025-12-07 09:08
文章核心观点 文章汇总了2025年11月29日至12月5日期间全球人工智能领域的重大新闻与投融资动态,核心观点在于展示AI技术在多领域(如机器人、大模型、芯片、应用)的快速迭代与商业化进程,以及资本市场对AI产业持续且高强度的关注与投入 [5][6] 行业动态与公司进展 机器人领域 - **美的集团**首次官宣布局三类机器人,包括工业机器人智能化、家电机器人化、人形机器人价值化,并特别提出“超人形机器人”概念,旨在突破人形极限以在特定场景实现最高效率和最低成本 [7][8] - **众擎**发布全尺寸人形机器人T800,身高1.73米,自重75公斤,续航4-5小时,公司称其性能超越80%的1.7米男性,综合运营成本仅为人力成本的1/3,定价18万元起 [15] - **特斯拉**人形机器人“擎天柱”团队发布了其跑步视频,刷新了实验室个人纪录 [25] - **宇树科技**已完成IPO辅导工作,该公司是全球首家公开零售高性能四足机器人并最早实现行业落地的公司 [20] - **商汤科技**联合创始人王晓刚出任大晓机器人董事长,该公司将于12月18日发布产品及国内开源商业应用的“开悟”世界模型3.0 [20] - **清华大学**正式成立具身智能与机器人研究院 [24] 大模型与AI应用 - **字节跳动**发布120亿参数视频理解大模型Vidi2,新增精细时空定位功能,能处理数小时原始素材并生成片段,其视频理解能力据称超越Gemini3 pro [18] - **OpenAI**为应对竞争进入“红色警戒”状态,推迟广告业务以集中资源改进ChatGPT,同时正在开发代号为“大蒜”的新模型,据称在编程与逻辑推理测试中优于谷歌Gemini3.0及Anthropic Opus4.5 [13][29] - **可灵**推出视频生成2.6模型,提供“音画同出”能力,能在单次生成中输出带音效的完整视频,视频长度最长可达10秒 [11][12] - **阶跃星辰**开源了GUI Agent技术套组GELab-Zero及4B参数模型,该模型在手机、电脑端GUI任务榜单上取得SOTA成绩 [18] - **豆包手机助手**计划对AI操作手机能力进行规范化调整,将限制刷分、金融类应用及部分游戏场景的使用 [9] - **蔡浩宇旗下AI公司**上线聊天软件AnuNeko,功能包括聊天、查资料、解答问题,但无法生成表格PPT且数据库停留在2023年 [11] - **京东**宣布数字人直播免费向所有商家开放 [17] - **京东、美团、拼多多等8家平台企业**签署全国首份《促进AI技术规范应用承诺书》,以规范AI技术在电商领域的应用 [21] - **小鹏汽车**就AI生成的虚假低俗视频正式报警,谴责滥用AI技术抹黑公司形象的行为 [27] 芯片与基础设施 - **亚马逊云科技**推出定制AI芯片Trainium3,运算速度是上一代的四倍,与使用同等GPU的系统相比,可将训练和操作AI模型的成本降低多达50% [30] - **清微智能**完成超20亿元人民币C轮融资,资金将投向下一代可重构芯片研发及智算场景落地 [18] - **英伟达CFO**反驳“AI泡沫论”,指出新增算力在不断叠加,全球经济处于向AI数据中心基础设施转型的“早期阶段”,并预测到2030年末全球AI投资将达3万亿至4万亿美元 [24][25] 企业战略与资本市场 - **Anthropic**已启动IPO筹备工作,最早或于2026年上市,据传其在一轮私人融资谈判中的估值将超过3000亿美元 [12] - **徐新掌管的今日资本**以约3亿美元收购字节跳动部分股权,对应估值高达4800亿美元(约合人民币3.4万亿元) [19] - **三星电子**成立AI研究院,并任命30多岁的常务李康旭为首任负责人,以引领下一代AI技术研究 [21] - **Meta**聘请了苹果资深人机界面设计负责人Alan Dye担任首席设计官 [22] - **朱啸虎**评论OpenAI上市,认为其在一级市场募资非常容易,估值3000亿美元的融资远超市,上市没有必要性 [22] - **理想汽车**发布AI眼镜Livis,重量仅36克,比行业主流轻20%,续航达18小时 [9] - **Mistral AI**正式发布基于Apache 2.0开源协议的Mistral 3模型系列 [32] - **Anthropic**收购开发工具初创公司Bun,将其作为AI编码产品的基础架构 [32] - **谷歌联合创始人布林**捐赠了价值逾11亿美元(约77亿元人民币)的Alphabet股票,主要流向其创立的非营利机构 [29] 投融资概览 整体情况 - 本周期全球披露AI融资事件22起,较上一周期减少9起,其中14起披露金额,总融资规模为76.48亿元人民币,平均融资金额为5.46亿元人民币 [35] - 融资阶段分布:早期14个、成长期4个、后期4个 [38] - 本周国内AI领域已披露融资总额为4.22亿元人民币,融资额最高的为具身智能机器人研发商**戴盟机器人**,完成1亿元人民币A轮融资 [44] - 本周海外AI领域已披露融资总额为72.27亿元人民币,融资额最高的为AI图像生成模型开发商**Black Forest Labs**,完成3亿美元B轮融资 [53] 地区分布 - 本周国内获投AI企业地区主要集中在广东(6起)、上海(2起)、安徽(2起)、北京(2起)、山东(1起) [41] 其他融资事件 - **他山科技**(AI触觉感知)在三季度连续完成A3、A4轮数亿元融资,共有13家资方入局 [19][20] - **超智**(上海智能机器人研发商)完成天使轮融资,投资方包括卡倍亿、宏润建设 [49] - **美酷瑞**(上海AI游戏开发商)完成天使+轮融资 [49]
可灵2.6模型推出“音画同出”能力 重构AI视频创作工作流
央广网· 2025-12-05 14:47
可灵2.6模型核心升级 - 公司推出视频生成2.6模型 提供里程碑式的“音画同出”能力 能够在单次生成中输出包含自然语言、动作音效以及环境氛围音的完整视频 彻底改变了传统“先无声画面、后人工配音”的工作流程 [1] - 该模型升级了文生音画、图生音画两大功能 输入文本或图片结合提示词文本均可直接生成带语音、音效及环境音的视频 生成视频长度最长支持10秒 语音当前支持生成中文以及英文 [4] 技术性能与优势 - 通过对物理世界声音与动态画面的深度语义对齐 模型在音画协同、音频质量和语义理解上表现亮眼 [6] - 音画协同方面 生成的视频在语音节奏、环境音与画面动作上紧密呼应 实现了对画面动态与声音节奏的深度对齐 避免了音画割裂体验 [6] - 音频质量方面 在支持人声、音效、环境声等多类型声音生成的基础上 生成的音频音质更干净、层次更丰富 整体听感更接近真实的混音效果 [6] - 语义理解方面 模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力 能够更准确地把握创作者意图 输出逻辑更严密的内容 同时 在中文语音生成效果上保持全球领先 [6] 应用场景与行业影响 - 模型支持的声音类型包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成 能够广泛应用于广告营销、自媒体、电商等行业视频内容创作 [7] - 在广告营销行业 模型可一键生成含有旁白介绍、演员对白、商品展示音效等综合声音效果的广告短片 极大降低广告片拍摄成本并提升效率 [7] - 在自媒体领域 通过多人对白能力 创作者可以创作访谈节目、剧情演绎、搞笑短剧等内容 借助音乐表演能力可进行唱歌、说唱表演、乐器演奏等类型的内容创作 大幅度降低创作成本与难度 [7] - 在电商领域 通过单人独白、旁白解说等能力 能够完成商品展示、产品讲解等视频内容创作 提升商家的经营效率 [8] - 模型的推出进一步降低了内容创意行业视频创作的成本与难度 [8]
AI进化速递 | 可灵首个“音画同出”模型上线
第一财经· 2025-12-04 20:46
阿里巴巴集团动态 - 阿里巴巴旗下源头厂货平台1688推出跨境电商AI智能体“遨虾” [1] - 阿里巴巴旗下可灵2.6模型上线,提供“音画同出”能力 [1] 人工智能模型与训练技术进展 - OpenAI收购Neptune,旨在强化AI模型训练监控能力 [1][3] - Anthropic与Snowflake达成2亿美元协议,就AI智能体展开合作 [1][4] 人工智能硬件与解决方案合作 - 瀛通通讯与蒙通智能签署合作协议,共同开发AI眼镜整机解决方案 [1] - Palantir发布面向美国人工智能基础设施的操作系统Chain Reaction,创始合作伙伴包括英伟达 [1][4] 人工智能基础设施投资与建设 - 亚马逊计划到2030年在印度AI基础设施领域累计投资127亿美元 [1] - Palantir发布面向美国AI基础设施的操作系统 [1][4] 人工智能行业应用与研讨 - 国际原子能机构举办首届AI与核能研讨会 [1]