阿里通义万相Wan2.1

搜索文档
全球AI周报:微信推出首个AI助手“元宝”,OpenAI发布o3满血版和o4mini-20250421
天风证券· 2025-04-21 22:49
报告行业投资评级 未提及 报告的核心观点 - OpenAI及国内模型大厂相继发布最新模型,模型在COT思维链基础上持续优化,本轮OpenAI更新增强模型多模态思考能力,拓展AI应用场景广度,提升模型在复杂任务中的实用性与落地深度;近期中美科技巨头密集布局MCP协议,有望统一行业标准,提升行业整体效率,推动整体AI生态完善;2025年有望成为AI Agent商业化元年,看好模型能力、生态构建与产品落地能力的AI应用企业迎来估值重估 [4] 根据相关目录分别进行总结 全球AI产品更新 - 微信推出AI助手“元宝”,集成混元和DeepSeek双模引擎,无缝衔接微信生态,支持解析公众号文章、图片和文档(100M以内),提供智能互动和日常陪伴功能,初始语气活泼逗趣可调节 [4] - 快手“灵感成真”发布会推出可灵AI 2.0,宣布基座模型升级,面向全球发布可灵2.0视频生成模型与可图2.0图像生成模型,两款模型在团队内部评测中居业内首位,可图2.0领先Midjourney V7等行业头部模型 [4] - 字节跳动旗下火山引擎发布豆包1.5深度思考模型,对文生图模型3.0、视觉理解模型进行升级,推出OS Agent解决方案及垂类应用Agent(国内首个AI IDE——Trae) [4] - 阿里通义万相Wan2.1视频生成大模型正式开源,在处理复杂运动、还原真实物理规律、提升影视质感、优化指令遵循上优势显著 [4] - OpenAI线上发布o3和o4 - mini,在AIME、Codeforces等测试中全面超越前代,图像思维链首次融入,同步开源轻量级终端编码Agent——Codex CLI,启动百万美元支持计划 [4] - 谷歌发布首款混合推理模型Gemini 2.5 Flash,引入“思考预算”,可自定义推理深度控制思考模式,在复杂任务中表现更优异 [4] 重点公司业绩情况 - 台积电2025年Q1营收255.3亿美元,同比+35.3%,毛利率58.8%,略超越彭博一致预期;预计2025年AI加速器收入翻倍,2024年至2029年AI加速器营收将实现约45%复合增长率 [4] - 奈飞一季度营业收入105.42亿美元,同比+12.51%,每股盈利6.61美元,大幅超出彭博一致预期;预计2025年第二季度收入增长15%,全年广告营收有望大致翻倍 [4] 投资建议 - 建议关注中国AI企业腾讯控股、阿里巴巴、快手、美团,因其本土AI技术能力持续提升,互联网生态优势巨大,且互联网板块受外部政策影响相对小、宏观关联度相对低,短期估值或超跌,基本面短期维持相对强势 [4] - 建议关注海外AI企业英伟达、微软、特斯拉、Roblox、Netflix、Shopify、赛富时、多邻国、ROBINHOOD、APPLOVIN,近期美股波动加剧但AI技术迭代节奏依旧快速,本周AI产品能力进一步升级,市场关注点转向商业化兑现与财务表现,叠加财报季来临,需关注AI相关标的财务端表现及AI落地商业化进展动态,同时关注互联网娱乐板块在AI赋能下的收入表现与用户增长情况 [4] 全球AI动态更新 中国AI动态更新 - 微信推出AI助手“元宝”,搭载混元和DeepSeek双模引擎,无缝衔接微信生态,核心功能包括解析公众号文章、图片和文档(100M以内),进行智能互动和日常陪伴互动,针对微信场景优化,确保用户数据仅在本地处理,暂时不支持聊天问答之外的复杂功能,初始语气活泼逗趣可调节 [11] - 快手举办“灵感成真”可灵AI 2.0模型发布会,宣布基座模型升级,面向全球发布可灵2.0视频生成模型与可图2.0图像生成模型,可灵AI完成超20次迭代,全球用户规模突破2200万,月活用户量过去10个月增长25倍,累计生成超1.68亿个视频及3.44亿张图片,两款模型在团队内部评测中居业内首位,可灵2.0大师版升级可控生成与编辑能力,上线多模态视频编辑功能,可图2.0领先Midjourney V7等行业头部模型 [16] - 字节跳动旗下火山引擎发布豆包1.5深度思考模型,对文生图模型3.0、视觉理解模型进行升级,推出OS Agent解决方案及垂类应用Agent(国内首个AI IDE——Trae);豆包在专业领域推理能力测试中达或接近全球第一梯队水平,文生图模型Seedream3.0跻身全球第一梯队,视觉理解模型实现突破;Trae将AI与集成开发环境深度融合,具有交付化、智能化、协作化三大核心特质 [21] - 阿里通义万相Wan2.1视频生成大模型正式开源,在处理复杂运动、还原真实物理规律、提升影视质感、优化指令遵循上优势显著,支持中英文文字特效生成,在权威评测集VBench中总分位居榜首;基于主流视频DiT结构,利用Full Attention机制建模长时程时空依赖,噪声采样采用线性噪声轨迹Flow Matching方法,通过多项技术创新提升生成能力,已在GitHub、Hugging Face、魔搭社区开源,支持多种主流框架 [25] 海外AI动态更新 - OpenAI线上直播发布o3和o4 - mini模型,在AIME、Codeforces等测试中全面超越前代,首次在思维链中用图像进行推理,实现视觉感知重大突破,o3在编程、数学等领域表现优异,o4 - mini优化快速、低成本推理;推出轻量级终端编码Agent——Codex CLI,已在GitHub开源,启动100万美元计划支持相关项目并接受2.5万美元API积分资助申请;预计本月陆续发布DeepSeek R2、Anthropic的Claude 4以及马斯克剧透的「GroK - 3.5」 [29] - 谷歌发布Gemini 2.5 Flash,引入“思考预算”,可自定义推理深度控制思考模式,关闭思考模式时成本下降600%,开启后性能提升,在复杂任务中表现更优异,以超高性价比领跑,兼具最优性能和极低成本优势;在多项基准测试中成绩优异,大模型排行榜上位居第二,在数学等基准测试中碾压Claude 3.7 Sonnet,与o4 - mini相当,在模型输入/输出价格上更具性价比,在LMArena其他评估项目中多次夺冠 [35] 重点公司业绩情况 - 台积电2025年Q1营收255.3亿美元,环比-5.1%,略不及彭博一致预期;毛利率58.8%,环比-0.2 ppt;营业利润率48.5%,环比-0.5 ppt;净资产收益率32.7%,环比-3.5ppts;3纳米占晶圆收入22%,5纳米占36%,7纳米占15%,7纳米及以下先进制程技术占营收73%;高性能计算(HPC)业务占一季度营收59%,环比+7%;智能手机业务占28%,环比-22%;收入受智能手机市场季节性回落影响,部分被AI相关需求增长抵消;预计2025年AI加速器营收翻倍,2024年至2029年AI加速器营收将实现约45%复合增长率;全力扩大CoWoS封装产能,计划在2025年实现翻倍;预计第二季度收入284亿至292亿美元,该季度毛利率57%至59%,营业利润率47%至49% [38] - 奈飞一季度营业收入105.42亿美元,略超出预期,同比+12.51%;每股盈利6.61美元,大幅超出预期;营业利润33.47亿美元,同比27.12%;预计2025年第二季度收入增长15%,全年广告营收有望大致翻倍;预计全年运营利润率维持在29%,下半年因热门节目回归内容制作成本攀升,加上销售和营销费用增加,运营利润率将下滑;在美国和加拿大推出的低成本广告套餐能维持用户对娱乐的强劲需求,增强业务韧性 [38]
速递|阿里通义万相Wan2.1,向全球免费开放AI视频生成模型
Z Potentials· 2025-02-27 12:09
图片来源:阿里巴巴 阿里正在开源其 Wan2.1 系列中的四个模型,这是该公司基础 AI 模型的最新版本,能够根据文本和图像输入生成图像和视频。 开源与 OpenAI 等创建的专 有模型形成对比。 自 DeepSeek 在一月份震撼全球市场以来,开源 AI 技术便成为了焦点。阿里巴巴于2月26日周三表示,已将其视频生成人工智能模型免费开放使用,进一 步加剧了与 OpenAI 等竞争对手的竞争。 图片来源:阿里云 其 Wan2.1 系列模型将通过阿里云的 Model Scope 和 Hugging Face (一个庞大的 AI 模型库)提供,全球的学术界、研究人员和商业机构均可访问。 阿里巴巴在香港上市的股票收盘上涨近 5% 。 目前围绕 AI 模型是否会商品化的问题正展开激烈讨论。 中国企业尤其积极推动开源模型的发展,阿里巴巴和 DeepSeek 的模型如今跻身全球最受欢迎之列。阿里巴巴于 2023 年 8 月发布了其首个开源模型,而 Meta 在美国则以其 Llama 模型引领开源潮流。 阿里巴巴的股票今年表现强劲,其香港上市股票截至 2025 年已上涨 66%。 本文翻译自: CNBC https://w ...