Workflow
通义万相
icon
搜索文档
中金公司 _ 阿里云深度:AI驱动下的全栈布局与全球扩张机遇
中金· 2026-01-19 10:29
行业投资评级 - 报告未明确给出对阿里云或行业的投资评级 [1][2][3][4][5][6][7][8] 核心观点 - 阿里云凭借全栈技术布局构建了AI时代的核心竞争壁垒,AI渗透与国际化扩张将驱动其未来三年收入复合年增长率超过30%,利润率有较大提升空间 [4][5][6][7][8] 发展历程与组织架构 - 阿里云发展分为四个阶段:技术破冰(2009-2013)、商业扩张(2014-2017)、加强底层研发与商业转型(2018-2022)、AI重振(2023至今)[10] - 组织架构确立“三驾马车”驱动商业化,并设立基础设施委员会推动产研闭环,达摩院作为AI技术创新的源头 [12][13][14] 竞争壁垒与行业地位 - 在大模型迭代、场景适配、2B客户理解、云基础设施等维度处于行业领先,中短期内头部地位稳固 [15] - 模型层面:通义大模型通过开源策略深耕2B赛道,与竞争对手形成差异化 [15] - 基础设施层面:全球布局广泛,规模效应显著,叠加自研底层硬件降本并形成技术代差 [15] 大模型技术矩阵与生态 - 通义系列模型构建了覆盖大语言模型、图像、视频、代码、推理等全品类技术矩阵 [22][23] - 截至2025年9月,通义系列模型生态衍生模型超17万个,开源模型300多个,下载量破6亿,深度服务全球超100万企业客户 [23][26] - 通义千问采取开源策略,截至2025年9月全球下载量超6亿次,是全球最受欢迎的开源模型矩阵之一 [26][29] - 通义万相(视觉)和通义百聆(语音)完善了多模态技术矩阵,其中通义万相2.5在文生视频和图生视频全球排名中位列前十 [35][39][42][43] - 通过魔搭(ModelScope)开源社区构建开发者生态,截至2025年6月,开发者规模突破1600万,模型总量超7万个 [45][46] 云基础设施与算力投入 - 基础设施已覆盖全球29个公共云地域、92个可用区,拥有超过3200个边缘节点 [4][52][53] - 在东亚地区的数据中心物理区域数量(17个)和可用区数量(65个)领先于国内主要云厂商 [54][55][58] - 公司提出未来三年投入超过3800亿元人民币用于云和AI硬件基础设施建设,并表明该目标会提升 [4][60] - 自研AI芯片PPU(平头哥)性能对标英伟达H20,已在中国联通三江源绿电智算中心项目中获得16384张算力卡的大订单 [4][67][69] 商业模式与增长驱动 - 核心商业模式为“模型引流、算力变现、生态增值”,通过开源大模型降低使用门槛,吸引开发者与企业用户,最终通过GPU算力租赁和AI解决方案实现变现 [4][45][78] - 收费模式包括按token计费的模型服务(MaaS)、按需或包年包月的GPU服务器租赁、AI开发平台销售及项目制的解决方案交付 [79][80] - 国内市场:2025年上半年中国AI IaaS市场规模达198.7亿元,同比增长122.4%,其中GenAI IaaS市场规模166.8亿元,同比增长219.3% [81][83] - 阿里云在2Q25中国公有云IaaS市场份额升至26.8%,实现连续5个季度份额增长 [84][87] - 通过“标杆案例复制+Cross-sell+Marketplace生态”策略深耕国内互联网、金融、汽车、能源等行业 [7][88][92] - 海外市场:依托中企出海浪潮,已累计服务超22万家中国出海企业,并加速全球基础设施扩建与AI产品国际化 [7][64][93][98] 财务预测与估值 - 预计FY25-FY28e阿里云收入复合年增长率(CAGR)超过30%,FY28e收入预计达到约2623亿至2670亿元人民币 [5][111][113] - 驱动增长的两大关键要素是AI业务贡献和海外业务拓展,预计FY28e AI业务收入占比将达到50% [111][113] - 随着AI收入占比提高、海外高毛利业务占比提升及成本端规模效应显现,预计FY28e EBITA利润率有望突破15% [6][121] - 基于FY27e收入2094亿元人民币,给予8倍市销率(P/S),估算阿里云估值约为1.7万亿元人民币 [124][125][126]
跳出手机屏幕,千问正在改变物理世界
经济观察报· 2026-01-12 19:48
文章核心观点 - 人工智能正从生成文本与图像的虚拟交互,走向与真实世界交互的“物理AI”时代 [2] - 以阿里云通义千问大模型为代表的“智能大脑”,正渗透进超过1500件形态各异的硬件产品,推动“物理AI”从逻辑推演变为现实 [1][3] - 中国庞大的硬件供应链体系,特别是深圳的创新生态,正凭借大模型的开源与赋能,在全球AI硬件创新中实现快速落地与量产,成为物理AI的重要试验场 [6][19][21] 硬件突围:AI在重新定义产品形态与创新模式 - 阿里云通义智能硬件展汇集了76个品类、200多个品牌、上千件已投入量产的AI硬件设备,涵盖手机、眼镜、耳机、机器人、宠物用品等 [2] - 展会焦点从传统的硬件参数比拼,转向展示各自在AI生存形态上的突围,产品更聚焦于切实融入生活与工作场景 [2][6] - 中国智造展现出“上午设计、下午打样、次日量产、一周出海”的极速创新与落地能力 [6] - 例如,华强北商家一周内“拼”出AI翻译器直供拉美市场;接入千问模型的血压手表能自动生成健康周报并给出调理建议 [7] - 创新方向在于捕捉碎片化刚需场景,例如支持60秒语音速记并自动梳理信息的AI硬件,能形成极强的用户黏性与壁垒 [9] - 传统上以“白牌”和“平替”著称的义乌商城硬件,通过接入大模型在“价廉”基础上获得了强大的“灵魂”,在细分市场找到生存空间 [10] 底层逻辑:降低门槛与“端云结合”的技术架构 - 千问推出面向AI硬件的多模态交互开发套件,通过拖拽式界面和预置Agent,让不会写代码的硬件商也能整合语音识别、对话等功能 [11] - 计费方式从按Tokens计费改为按硬件终端License计费,降低了硬件创业者的成本不确定性,使其创新产品更易量产和销售 [11] - 模型策略以“最容易被用起来”为核心,采用“端云结合”的灵活架构:小尺寸模型在端侧处理意图识别,复杂任务则交由云端大模型 [13] - 该架构支持从几块钱的智能水杯到几十万元的纯电轿车,都能找到合适的“大脑” [13] - 通义千问多模态套件已主动兼容超过30款主流芯片平台,包括ARM、RISC-V和MIPS,被硬件厂商比喻为“AI时代的Android” [15] - 全面开源策略使千问成为全球开发者采用率最高的开源模型之一,让越来越多的创新组织、创业团队甚至个人开发者能够低门槛参与硬件创新 [15] 应用场景:从消费电子到复杂产业的广泛渗透 - 在汽车领域,比亚迪腾势通过通义万相实现“AI壁纸”功能;零跑汽车通过云端大模型让语音助手具备秒级行程规划和文生图能力 [15] - 在运动健康领域,基于通义千问VL大模型的设备能“看到”用户运动姿态并像真人教练一样即时纠错;视觉模型能实现篮球轨迹追踪和精彩剪辑 [16] - 在辅助与工业领域,硬件能实时“看见”环境并描述给视障用户听;大模型正在取代传统高度定制、难以迁移的计算机视觉质检方案 [17] - 交互逻辑发生变革,例如在车载场景中,用户无需唤醒词,仅通过看一眼云台即可直接下达指令 [16] - AI设备在家庭中开始承担记忆、整理、陪伴等更复杂的角色,而非仅执行简单指令 [17] 中国制造:成为物理AI发展的核心试验场与推动力 - 深圳具备极度现实的需求、极低的试错成本以及灵活可重组的产业链,为AI硬件快速落地提供了肥沃土壤 [19] - 当大模型能力像云服务一样被开源释放,硬件创新参与者更关心如何更快落地、产品能否销售及下一代推出时间,而非空谈未来 [19] - 在“大模型+强硬件+深场景”的组合下,中国制造正在实现AI新时代的跃迁,某些细分领域的创新密度已超越硅谷 [19][22] - 阿里云通义千问大模型像Android系统一样渗透进各类硬件,让中国庞大的供应链体系率先完成“智慧大脑”的植入 [21] - 中国的开发者凭借千问的开源生态,在极短时间内实现了AI应用从适配到量产的跨越 [21] - 物理世界的AI化被视为一场“谁是数字底座”的终极博弈,其核心是生产力变革,而不仅仅是设备联网 [17][21]
为什么深圳硬件圈都在谈论千问?
雷峰网· 2026-01-12 11:34
文章核心观点 - AI正从单一功能插件蜕变为可靠、高效且经济的底层系统能力,成为硬件的“默认能力”而非“可选功能”,开启了向现实世界的“大迁徙”[3][4][9][11] - 行业驱动力正从“模型炫技”转向“系统工程”,工程化能力的成熟彻底扭转了行业格局,极大加快了创新节奏[9][11] - 阿里云通义千问通过提供标准化、全栈的AI能力,正成为AI硬件的“通用底座”,降低了行业门槛并推动了规模化落地[10][14][16][21] AI硬件产业的现状与转折 - **展会盛况与产业信号**:2026年初的阿里云通义智能硬件展汇聚了超200家主流硬件厂商,覆盖AI眼镜、手机、汽车、机器人、芯片、出海新锐及玩具等多个领域[3],展示了跨越76个品类、超过1000款接入大模型(千问)的智能设备,标志着大模型正通过硬件向现实世界迁移[4] - **历史困境与当前突破**:过去十年AI硬件多次陷入“概念先行、落地遇冷”的怪圈,受限于模型能力不可控、商业逻辑难闭环及工程复杂度过高三大难题[7][8],当前转折点已至,行业驱动力转向“系统工程”,AI成为可靠的底层系统能力[9] - **市场规模**:中国AI硬件市场规模已突破1.1万亿元,标志着AI硬件正式从概念探索迈入规模化落地的新阶段[12] 工程化能力如何改变行业 - **提供标准化开发套件**:阿里云提供了多模态交互开发套件,将核心大模型能力与交互技术深度整合成标准化“智能基座”,并广泛适配超30款主流芯片,大幅降低了硬件选型与适配门槛[10] - **降低风险与加速创新**:厂商可直接调用稳定、优化过的能力,将技术风险转化为可控的工程集成,开发者得以快速组合功能,聚焦应用创新[11],这使AI从“卖点”升级为“门槛”[11] - **加速产业链响应**:工程化成熟极大加快了行业创新节奏,在深圳华强北,AI化已可“上午提需求,下午调参数,明天量产”,华强北正加速向AI硬件创新中心转型,相关入驻企业超过350家[11] - **引发“存量革命”**:大模型能力标准化、工程化后,影响迅速从前沿品类蔓延至全行业,一场“存量革命”正在传统硬件领域展开[12] 阿里云通义千问作为“通用底座”的竞争力 - **全栈AI能力与战略定位**:阿里云凭借多年构建的全栈AI能力(覆盖模型、算力、工程平台与生态体系)系统性地解决了AI硬件落地痛点[16],其战略是将千问打造为“AI时代的操作系统”,与AWS、Azure、GCP等全球巨头竞争生态高地[14] - **“全尺寸”与“全模态”模型矩阵**:千问提供了从云端超大规模参数模型到端侧轻量模型的完整梯队,为千差万别的硬件形态提供极致灵活性[17],同时具备对视觉、语音等多模态信息的认知能力,为硬件装上理解世界的“眼睛”和“耳朵”[17] - **底层算力与云端协同**:底层算力与云端协同是千问规模化落地的基础保障[18] - **开源策略与生态构建**:千问通过开源实现“技术降权”,将产品定义权交还给产品专家,降低了研发门槛[19],其衍生模型数量已突破18万,全球下载量超7亿次,据彭博统计已超越Meta的Llama成为全球第一AI开源模型[19],开源生态形成了从“用模型”到“用云”的良性循环[19] - **行业权威认可**:Gartner报告显示,阿里云在GenAI云基础设施、工程、模型及应用四大维度均跻身新兴领导者象限,是唯一入选全部四项的亚太厂商[20] AI硬件发展的未来产业影响 - **AI从数字世界走向物理世界**:超1000款智能硬件接入千问是一个清晰信号,表明AI正在通过智能硬件这一关键入口深度连接现实世界[23] - **形成感知与进化的闭环**:分布在家庭、出行与生产场景中的智能硬件持续感知环境、生成数据,推动模型理解物理规律和人类行为逻辑,而进化的模型又反过来驱动硬件变得更智能,形成加速演进的闭环[23] - **创新重心转移**:技术逐渐退居幕后,智能成为硬件的默认能力,创新从写字楼下沉到工厂车间,真正走向前台的是产品定义与工程实现[23] - **通向ASI的现实路径**:当各类智能硬件规模化普及,AI将不再只是信息处理工具,而是通过无数物理入口持续学习与进化,这正是通向ASI(人工通用智能)的现实路径[23],此刻被视为“AI走向物理世界的Android时刻”[24]
拓宽百年奥运「赛场边界」,阿里云AI让人人皆可上场
机器之心· 2026-01-08 17:34
AI视频生成技术发展现状 - AI视频生成技术进化迅速,真实与AI生成内容的界限已变得模糊,越来越多“真实”视频被质疑为AI生成,而AI生成内容被误认为真实拍摄[1][2] - 技术超越不应仅在于对现实的复刻,更应在创新应用中想象更美好的未来[4] 阿里云与米兰冬奥会AIGC大赛 - 作为2026年米兰冬奥会官方云服务合作伙伴,阿里云联合国际奥委会及米兰冬奥组委会,在冬奥会倒计时30天之际发起全球AIGC大赛[5][6] - 大赛Slogan为“YOUR EPIC VIBE”,与本届冬奥口号“IT's Your Vibe”相呼应[8] - 大赛规则要求参赛者使用阿里云“万相大模型”,在花样滑冰、短道速滑、高山滑雪、单板滑雪四个经典项目中任选其一生成冬奥视频[9] - 阿里巴巴AI产品生态为大赛提供全栈式支持,包括开源开发者社区Modelscope、AI创作工具通义万相和堆友[9] - 国际奥委会将从四个项目中各选25个最佳作品,纳入奥林匹克博物馆收藏,并组合成奥运史上首个AIGC数字艺术影像作品集《YOUR EPIC VIBE》[9] - 这是自1896年现代奥运首次举办以来,AI首次以这种方式被写进奥运历史[10] - 大赛Top 100中将评选出10位在叙事创意、情感深度和美学构图上表现最好的获奖者,他们将获得米兰冬奥会现场门票[11] 万相大模型Wan2.6的技术能力 - Wan2.6于去年12月登场,面向专业级影视制作和图像创作场景[15] - 该模型提升了画质、音效、指令遵循能力,并新支持多镜头叙事及最长15秒视频生成[18] - 在国内首次支持角色扮演功能,用户本人可以入镜,并用自己的声音出演AI视频[18] - 模型在冬奥冰雪项目上表现出高可玩性,能生成如雪人滑雪、毛绒怪兽滑雪、小王子滑雪等富有童趣和想象力的场景[20][21][23] - 角色扮演功能允许指定角色生成视频,例如让奥特曼进行速滑,或让马斯克表演花样滑冰[25][26] - 在动态表现和视觉冲击力上表现突出,能自动实现稳定、贴近动作的动态运镜,模拟低机位跟拍带来的速度感与冲击力[28][29] - 能处理高难度慢镜头,清晰展现高速运动中的细节[29] - 能够稳稳驾驭高难度的多人场面,保持人物间相对位置、运动方向与节奏清晰,无混叠或错乱[30] - 在高速运动、多人互动及音画同步等关键场景下性能超高,能自然融入虚构角色或真人形象,完成连贯表演[31] - 生成过程中镜头会随运动推进自动调整视角并切换,具备基本的分镜逻辑与节奏变化[31] Wan2.6的核心技术突破 - 实现了超真实还原,解决了物理规律准确模拟、时序一致性、细节高度还原、原生音视频逻辑一致等技术挑战[35] - 提供音画一体的多模态参考生成能力,通过对输入参考视频进行多模态联合建模与学习,实现从画面到声音的全感官一致性保持与迁移[35] - 能输出衔接连贯的多镜头,可一键完成单人、多人、人与物合拍的视频,并自动实现多镜头切换,保持主体像素级统一[36] - 保证叙事完整不偏离主题,解决了AI的时间记忆和逻辑常识挑战,最长支持15秒1080P视频生成,能轻松搞定完整叙事的Vlog视频[37] - 一系列底层能力突破使其打破视觉、听觉与物理规律之间的藩篱,成为生产力级别的视觉生成引擎[38] AI技术普及与奥运应用的意义 - 全球AIGC大赛成为“AI for all”理念的实践阵地,AI赋予了普通人更沉浸的奥运体验[42] - 在高山滑道、花滑冰场或单板U型场,普通人可以成为主角,这是奥运级AI科技首次大规模应用于粉丝互动[42] - 阿里云以万相大模型为主导的交互范式变革,正将“智能技术无处不在、人人可及”的愿景落地[42]
外卖大战升温 消息称阿里将引入视觉AI降低餐馆成本
凤凰网· 2026-01-05 08:59
公司战略与产品发布 - 阿里巴巴集团即将推出一项新服务,帮助餐馆利用AI技术生成3D图像以展示店内环境[1] - 该服务由阿里巴巴旗下地图和本地服务部门高德推出,允许餐馆仅通过上传视频或照片即可生成3D图像[1] - 该技术基于阿里巴巴的视觉生成大模型“通义万相”,旨在降低商家的营销和推广成本[1] - 阿里巴巴计划将该技术免费开放给部分商家,让他们试用一段时间[1] 行业竞争格局 - 阿里巴巴正在外卖领域与美团展开竞争,此次推出AI服务是公司整体布局的一部分[1] - 美团在外卖、点评及餐馆预订等本地服务市场占据领先地位[1] - 过去几年,阿里巴巴在外卖等领域输给了规模较小的竞争对手[1] - 2025年,阿里巴巴为旗下热门在线服务投入数百亿元人民币进行激励与补贴,以应对美团和京东的竞争[1] - 这场“三强争霸”挤压了行业利润空间,并引发了监管层面的警告[1] 技术趋势与行业动向 - 阿里巴巴CEO吴泳铭已设定AI战略,要将AI融入旗下所有业务,利用新技术推动增长[1] - 此举与谷歌、腾讯等大型科技公司的布局方向一致[1] - 中国企业正越来越多地尝试利用AI提升现有业务并开拓新市场[1] - 高德的最新举措表明,阿里巴巴正试图在美团主导的领域进行扩张,并利用AI和更雄厚的资金储备夺回市场份额[1]
北京大学:AI视频生成技术原理与行业应用 2025
搜狐财经· 2025-12-09 14:48
AI视频技术概览 - AI视频属于狭义AI范畴内基于学习的生成式AI,是AIGC的重要分支,核心任务包括视频生成、编辑与理解,典型生成方式为文生视频、图生视频、视频到视频 [1] - 技术演进从2016年前的GANs探索阶段,到2020-2024年扩散模型实现商业化突破,再到2024年Sora发布开启“AI视频元年”,行业进入分钟级高清视频量产阶段 [1] - 国内外主流工具平台包括OpenAI Sora、快手可灵AI、字节即梦AI、Runway、Pika等,各平台在时长、画质、风格上各具特色 [2] 技术原理与架构 - 扩散模型因训练稳定、生成多样性强成为主流技术范式,其架构分为U-Net和DiT两类,U-Net易训练但一致性弱,DiT成本高但长视频一致性强 [3] - 关键技术组件包括:Transformer的自注意力机制保障时空一致性,VAE实现像素空间与潜空间的压缩转换,CLIP完成文本与视觉的语义对齐,时空补丁统一数据格式降低计算成本 [3] - 训练数据的规模、质量和多样性决定模型上限,主流数据集包括WebVid-10M等文本-视频对数据集,以及UCF-101等类别级数据集 [4] 技术能力发展与突破 - 主流模型已实现1080p/4K分辨率、最长2分钟时长的生成,部分模型支持原生音画同步,国产模型在中文语义理解和可控性上优势显著 [5] - 现存核心瓶颈包括时序一致性、物理逻辑合理性、细节情感表达,且算力成本制约技术普及 [5] - 已形成VBench、SuperCLUE等评估体系,VBench2.0更聚焦“内在真实性”,谷歌Veo 3、快手可灵AI等模型在榜单中表现突出 [5] 行业应用案例与价值 - 在影视娱乐领域,AI实现从前期概念设计、中期虚拟制片到后期智能剪辑的全流程介入,催生了AI短剧、AI重制长片等新业态,大幅降本增效 [6] - 在短视频与营销领域,AI视频成为应用最广泛领域,可快速生成品牌广告、UGC创意内容、虚拟主播带货视频,实现低成本规模化内容量产 [6] - 在文旅行业,AI用于制作城市宣传片、打造AI文旅推荐官、结合VR/AR实现沉浸式体验,助力文化IP传播与旅游营销 [7] - 在教育培训领域,AI用于批量生成微课视频、打造AI虚拟教师、定制个性化学习内容,解决教育资源不均问题 [8] - 在新闻媒体领域,AI虚拟主播实现24小时播报,AI生成沉浸式新闻叙事,但面临内容真实性、版权合规等伦理挑战 [9] 工具选用建议 - 建议根据场景化选型:专业影视选Runway或可灵AI,短视频运营选即梦AI或Pika,动漫动态化选海螺AI或Pixverse,国风内容选Vidu等国产工具 [10] - 使用门槛分级:国内工具零门槛直连,海外工具需科学上网和外币支付,Sora/Veo等生态绑定工具门槛最高 [11] - 核心原则是采用多工具协作工作流,以“导演思维”驾驭工具,而非依赖单一平台 [12] 市场格局与厂商动态 - 代表性厂商及产品包括:OpenAI Sora、快手可灵AI、字节即梦AI、Runway、Pika Labs、生数科技Vidu、Luma AI、阿里通义万相等 [49] - 可灵AI支持生成长达2分钟、1080p、30fps的视频,其Kling 2.5 Turbo版本成本降低30%,全球用户已突破4500万 [49] - 即梦AI背靠抖音与剪映生态,打通从“AI生成”到“剪辑发布”全链路,月活5400万,2025年10月网站访问量达1000万 [49] - 通用大模型通过集成顶尖视频模型获得强大视频生成能力,例如ChatGPT集成Sora,Gemini生态集成Veo,Meta AI集成Emu Video,通义千问集成通义万相,豆包与抖音/TikTok和剪映形成闭环 [51] 发展前景与核心观点 - AI视频最终将走向“人机共创”范式,成为像互联网一样的基础设施,人类需聚焦创意与判断力,实现与AI的协同进化 [13] - AI视频正从实验性“技术炫技”阶段迅速发展为影视预演、广告创意、短视频制作和在线教育的实用工具,行业变革的临界点已清晰可见 [37] - 2024年初Sora模型凭借一分钟长度、高清画质及物理世界连贯性理解,重新定义了AI视频生成能力 [37]
易点天下联袂阿里云 共筑AI漫剧出海新引擎
证券时报网· 2025-11-24 10:15
合作事件概述 - 易点天下与阿里云正式达成AI漫剧出海框架合作协议,旨在打造业内首个面向该赛道的全链路加速增长引擎[1] - 合作将提供从算力支持、内容生产到营销变现的一站式解决方案,助力中国动漫内容走向全球市场[1] 行业背景与市场数据 - 2025年以来,国内AI漫剧周均在投剧目已突破110部,累计上线作品达3000部,环比增幅高达603%[1] - 中国动漫出口规模预计将在2025年突破200亿元,海外用户总量从2020年的2000万跃升至5000万,其中东南亚市场占有率已达35%[1] - AI内容产业正迎来爆发式增长,用户播放量与点赞量呈现近翻倍增长[1] 合作目标与解决痛点 - 合作旨在解决AI漫剧出海面临的技术门槛高、工具分散、本土化适配难、变现渠道有限等行业痛点[1] - 双方将整合资源、互补优势,系统性地解决AI漫剧从产能提升到商业闭环的关键挑战[3] 易点天下的核心优势 - 公司早在2023年便洞察短剧出海潜力,已成功服务ReelShort、Dreame、Soul等多家行业头部客户[2] - 旗下AI驱动的程序化广告平台zMaticoo通过数据挖掘与技术创新,为WeTV、芒果TV等平台优化海外广告变现效率[2] - 公司在出海营销领域深耕十余年,积累了丰富的内容创意与投放经验[2] 阿里云的技术能力 - 阿里云在全球布局了29个公共云区域、覆盖70多个国家,在AI算力的本地化部署与合规服务方面具备深厚积累[2] - 其千问模型与“通义万相”AI绘画创作模型,在视频生成与多语言支持等方面达到行业领先水平,为内容生产提供技术底座[2] 战略意义与未来展望 - 此次合作是易点天下在“AI+内容+出海”战略上的重要落地,标志着中国AI内容产业从单点突破迈向生态协同[3] - 随着AI漫剧出海引擎的构建与完善,公司有望在高速增长的全球AI内容赛道中占据先机,巩固其领军地位[3]
世界互联网大会博览会开幕,阿里巴巴展出全栈AI成果和最新智能硬件
搜狐财经· 2025-11-06 18:25
阿里巴巴AI硬件产品创新 - 公司推出首款自研夸克AI眼镜 配备双芯片和双光机双目显示 支持导航、支付、翻译、拍照等多项功能 并首创可换电设计以提升续航 [3] - 公司旗下钉钉发布AI录音卡片DingTalk A1 机身轻薄可磁吸于手机 支持长达45小时连续录音 具备内容转写、翻译、总结和分析功能 并推出支持统一设备数据管理的企业版本 [3] 医疗AI技术应用突破 - 公司达摩院展示"平扫CT+AI"医疗检查方案 利用AI识别平扫CT图像中人眼难以发现的微小差异 实现癌症、慢性病的"一扫多查" [6] - 该医疗AI方案已在胰腺癌、食管癌等高发癌症及骨质疏松等慢性病诊断上取得突破 服务全球超过1000家医疗机构和5000多万人次 [6] AI基础设施与开源生态建设 - 公司阿里云今年以来在全球启用8个新的AI云数据中心和可用区 目前已在全球运营29个公共云地域和92个可用区 拥有超过3200个边缘节点 网络覆盖70多个国家和地区 [7] - 公司开源模型家族"通义千问"已开源超过300个模型 全球下载量突破6亿次 衍生模型超过17万个 其旗舰模型Qwen3在多项基准测试中斩获五项全球第一 综合排名位居全球前三 [7]
Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。
数字生命卡兹克· 2025-10-30 09:33
模型核心功能与效果 - 阿里开源模型Wan2.2 Animate能够通过一张人物照片和一段自录视频,生成极其自然的换脸视频,表情和动作复刻效果良好 [1] - 模型不仅能用于生成娱乐内容,其技术上限很高,能够复刻复杂的表情,实现高度自然的效果 [4][6] - 当前模型存在局限性,例如在手部动作较多的场景下,手指部分容易出现崩坏 [12] 技术应用场景 - 模型可用于生成虚拟形象舞蹈视频,相较于传统MMD技术更为便捷 [11] - 在影视二创领域有广泛应用潜力,例如实现角色替换,让不同演员出演经典影视片段 [12][13] - 结合变声工具如海螺和剪映,可以同时替换形象和声音,生成高度逼真的合成内容 [9] 技术优势与行业影响 - Wan2.2 Animate为开源模型,区别于Runway、Viggle等非开源方案,降低了使用门槛 [14] - 该技术将过去需要昂贵动捕设备和专业动画师才能实现的表情和动作捕捉,变成了普通人点几下鼠标即可完成的任务,极大降低了创作门槛和成本 [25] - 技术为电影制作、特效、数字替身及虚拟演员等领域打开了全新的想象空间,未来或能看到已逝演员在新电影中"复活" [25][26] 使用方式与技巧 - 用户可通过通义万相官网在线使用该模型,选择角色替换或动作模仿功能,上传参考图和参考视频即可生成内容 [14] - 模型提供两种主要模式:动作模仿是让参考图中的主体在原有背景中模仿视频的动作;角色替换则是用参考图中的主体替换视频中的主体,并保留视频背景 [15][16] - 为实现只换脸不换背景的效果,可采用额外流程:从视频中截取一帧,结合角色图在其他工具上生成与视频背景完全一致的图,再将此图作为参考图输入模型 [17][18][20]
Sora2生成已故名人视频引亲属不满,OpenAI面临版权麻烦
21世纪经济报道· 2025-10-11 20:25
AI视频生成技术发展与市场表现 - OpenAI最新视频生成大模型Sora 2于9月底发布,同步上线独立应用,首周下载量便超过了ChatGPT,登顶美国App Store免费榜单 [1] - Sora APP在发布五天内下载量已超过百万次,爆发速度比当初的ChatGPT还要快 [5] - AI视频生成技术门槛和成本变得极低,例如通义万相、谷歌Veo 3今年都能够免费生成视频同步音频 [6] AI“复活”逝者引发的伦理与版权争议 - 已故演员罗宾·威廉姆斯的女儿在社交媒体上恳请人们停止发送其父亲的AI视频,认为这是对逝者遗产的操纵 [1] - 罗宾·威廉姆斯在遗嘱中明确禁止在2039年前将其形象用于任何电影或宣传,是好莱坞对肖像和声音权要求最严格的名人之一 [5] - 国内平台出现“AI复活”李玟、张国荣、高以翔、乔任梁等已故艺人的视频,但国内社交平台审查严格,目前抖音、小红书等平台搜不到相关AI复活视频 [6] 法律视角下的侵权界定与平台责任 - 在我国法律框架下,逝者的肖像权并未随生命终止而消失,近亲属可依据《民法典》第994条主张民事责任 [8] - 判断“AI复现人物”侵权的两个关键标准是:是否违反本人或近亲属意愿,以及行为是否带有商业性质或属于公开发布 [8] - AI技术平台有义务采取保护措施,包括在处理逝者形象时获得近亲属授权,以及在用户协议中明确风险提示 [9] OpenAI的版权策略调整与行业压力 - OpenAI将Sora的版权策略从“选择退出”机制调整为“选择加入”机制,即除非版权方明确授权,否则不会使用受版权保护的形象 [14] - OpenAI推出“客串”功能,允许公众人物通过面部扫描将自己的形象嵌入Sora生成的视频,并承诺用户可随时撤销授权和拥有审核权 [14] - OpenAI面临来自美国演员工会、美国电影协会及好莱坞艺人经纪公司的强烈抗议,反对用AI生成演员,认为这是对版权内容的剥削 [13] 行业挑战与未来方向 - 国际上尚无针对“AI复活”的统一伦理准则,未来可能需要建立强制知情同意机制,并对人格性信息采取加密存储或定期销毁措施 [9] - OpenAI计划与版权方共享收入,建立更细致的分成体系,但具体实施细节,如IP定价和多方授权问题,尚不明确 [15][16] - 尽管存在反对过度版权审查的声音,但在法律边界不明晰的阶段,大公司的严格限制实践方案被认为对行业有积极的示范意义 [16]