Veo3.1

搜索文档
海内外模型持续上新,关注世界模型最新进展
国金证券· 2025-10-19 19:36
投资建议 - 建议关注国内生成式大模型龙头科大讯飞[3] - AI硬件有望成为应用落地的新载体,建议关注海康威视、虹软科技、禾赛等[3] - AI相关功能打磨能够带动付费率、Arpu值提升,建议关注迈富时等[3] 核心观点 - 计算机板块处于主业回暖改善,AI应用落地加速的周期,基本面强度对市值贡献度提升[10] - 下半年在低基数和新技术落地加快背景下,预计总体经营强度会好于上半年,毛利率提升,费用率下降,净利率保持修复,利润端弹性大于收入端,现金流端改善可能更明显[10] - 除国产替代和红利板块外,大的主线预计还是集中在AI产业链相关方向,下半年AI落地进展预计环比上半年有进一步的倍数增长[10] - 三季度总体业绩强度预计弱于AI上游相关度高、业绩兑现强度大的电子半导体、通信的相关环节,流动性/风险偏好等估值波动是板块波动的主要影响因素[10] 行业动态与技术创新 - 蚂蚁集团开源万亿参数思考模型Ring-1T,该模型在数学、编程、逻辑推理等多个基准测试中达到开源SOTA水平,并在IMO测试中展现出对标人类银牌的解题能力[10] - 百度对其AI视频生成平台“百度蒸汽机”进行重大更新,推出实时流式生成功能,支持图生视频等模式[10] - 谷歌发布旗舰AI视频生成模型Veo的更新版本Veo3.1,实现视频画面与音频的原生同步生成,视频延展功能可扩展至最长148秒[10] - 斯坦福大学李飞飞创业公司WorldLabs推出生成式世界模型RTFM,该模型无需显式3D表示,能在单个H100 GPU上实时运行[10] 细分板块景气度展望 - 高景气维持的赛道:AI算力、激光雷达(8月/1-8月国内ADAS激光雷达装机量约为25.9/158.0万颗,YoY+101.0%/+88.7%)[10][13] - 加速向上的赛道:AI应用[10] - 稳健向上的赛道:软件外包、金融IT、量子计算、数据要素、EDA、出海、信创[10] - 拐点向上的赛道:教育IT、网安、企业服务[10] - 底部企稳的赛道:智慧交通、政务IT、安防、建筑地产IT[10] - 略有承压的赛道:工业软件、医疗IT[10] 市场表现回顾 - 2025年10月13日至10月17日,计算机行业指数(申万)下跌5.61%,跑输沪深300指数3.38个百分点[14] - 在31个申万一级行业指数中,本周计算机行业排名中位数靠后[14] - 2025年10月13日至10月17日共5个交易日,三市股票日均成交额为2.2万亿元,同比上升5.0%,环比下降15.8%[21] - 截至2025年10月16日,两融余额为2.5万亿元,同比上升44.5%,环比上升0.48%[21] 重点事件前瞻 - 2025年10月28日,第十届中国国际人工智能大会暨人工智能算力算法高峰论坛将在上海举办[27] - 2025年11月14日,第二十七届中国国际高新技术成果交易会将在深圳举办,预计展示面积40万平米[27]
东方证券:多模态技术、产品、商业化均边际向上 看好多模态投资机会
智通财经网· 2025-10-19 18:40
智通财经APP获悉,东方证券发布研报称,今年来多模态行业迭代势头迅猛,技术上底模上下限能力均 有提升,作用于产品和商业化落地。竞争激烈的同时产品路径呈现出分化态势,如谷歌Veo系列和快手 可灵系列更专注专业内容创作者、Sora则更偏重C端用户,不同产品路线演绎下对应商业应用均有加速 趋势,B端向制作难度更高的内容领域渗透、C端产品商业模式后续落地,共同作用于多模态行业整体 规模扩容向上提速。该行认为应重视垂类多模态AI应用机会,看好技术突破、成本优化带来产业趋势 加速发展,带动用户增长、付费渗透和商业化再上台阶。 东方证券主要观点如下: 技术层面,10月海外厂商模型相继迭代,今年来行业的技术下限、上限同步提升。 海外主要厂商来看,10月OpenAI和Google陆续更新视频模型,其中:①OpenAI的Sora2相较前代模型进 步显著,物理运动规律和画面真实感大幅提升,差异化亮点在于分镜能力和叙事性达到SOTA,且对多 语种内容的产出支持最好,时长上也实现突破(Pro用户可生成25秒视频,vs其他模型5~10秒);②Google Veo3.1则是小版本迭代,音频生成效果、画面质感较前代模型进一步提升,且开始具备 ...
季度AI视频生成产品:多模态输入成标配,角逐一站式生成能力 | 量子位智库AI 100
量子位· 2025-10-18 15:33
AI视频生成行业动态 - Sora2在五天内下载量突破百万次,显著提升AI视频生成领域热度[3] - 谷歌推出对标产品Veo3.1,重点布局音频生成技术[4] - 国际厂商竞争聚焦电影级创意能力,国内企业追求秒级生成高清稳定视频并深耕垂直场景[5][6] - 视觉模型与世界模型深度融合,推动3D物理场景逼真化,实现无限一致视频生成[6] 技术演进趋势 - 多模态输入成为行业标配,支持文生视频、图生视频及音画同步生成[7] - 部分产品实现Agent一站式生成,构建全流程视频生成体系[7] - 输出视频时长从数秒延长至数分钟,分辨率提升至2K/4K级别,帧率达60fps[7] - 角色一致性、分镜设计、关键帧控制及口型同步等技术稳定性显著增强[7] 用户数据表现 - 5款产品访问量超20万,包括即梦AI、可灵AI、RoboNeo、海螺AI和Vidu[8] - 即梦AI下载量突破1100万,访问量增长27%至约950万[9] - 可灵AI网页端月访问量超100万,RoboNeo紧随其后[9] - 豆包、通义万相等综合类AI产品均集成视频生成功能[10] 头部产品功能特性 - 即梦AI支持3分钟视频生成,具备首尾帧控制、镜头运动及数字人口型同步功能[15] - 腾讯混元3D通过世界模型实现360°沉浸场景生成,支持物理仿真[18] - 可灵AI提供首尾帧稳定衔接及多图参考角色生成,拥有百余种风格模板[20] - 海螺AI实现2D插画转动态视频,30秒内生成6秒短视频,支持2K高清输出[24] - 绘想提供五种模型选择,支持音视一体化生成及11种特效,适配中文语境[25][27] 创新产品技术突破 - 白日梦Agent可将2000字文案转为6分钟连贯视频,支持角色DNA库与智能分镜[37][39] - Vidu最快10秒生成视频,提供4秒/8秒时长选项,分辨率达1080P[43][44] - SEELE实现零代码3D游戏生成,支持角色控制、场景构建及物理效果[60] - FilmAction支持最高16K视频生成,整合从剧本创作到视频合成的全流程[62][63]
Veo3.1和Sora2同题竞技来了
量子位· 2025-10-16 17:34
文章核心观点 - 谷歌发布视频生成模型Veo3 1 对标OpenAI的Sora2 两者在音视频一体化生成领域形成直接竞争关系 [1][4][5] - Veo3 1的核心改进在于增强创意控制和物理真实性 旨在为电影制作人和艺术创作者提供更完整的叙事工具 [7][15][31] - 实测对比显示 Veo3 1与Sora2各有优劣 Veo3 1在画面真实性和光线处理上更佳 而Sora2在故事情节和娱乐性方面表现更好 [20][25][28][29][30] Veo3 1的主要功能更新 - 新增音频生成能力 将其整合到原有的“成分到视频”、“帧到视频”和“扩展”功能中 实现音视频一体化生成 [3][11] - “成分到视频”功能允许用户使用多张参考图像控制角色和画面风格 并整合生成带完整音频的场景 [11] - “帧到视频”功能通过提供首尾帧图像 由模型自动补充中间细节 适用于画面转场 [12] - “场景扩展”功能可基于视频最后一秒延续生成长达一分钟或更久的片段 并保持人物动作一致性 [13] - 新增“插入”功能 可向任意场景添加新元素 并对场景阴影 照明等复杂环境进行优化 确保添加自然 [14][15] - 具备删除不需要的对象或字符的能力 并能重建周围环境 [16] Veo3 1与Sora2的对比分析 - 在“生成飞天汽车”的测试中 Veo3 1在画面真实性和车辆细节刻画上效果更佳 并能合成明显的汽车发动引擎声 [20][21] - 在“大猩猩和猴子唱英文歌”的测试中 Veo3 1画面饱和度更高 有好莱坞动画风格 但在角色动作一致性上出现小bug Sora2则更偏向短视频娱乐风格 [23][24] - 在动漫风格测试中 Sora2的故事情节和表情自然度完成度更高 [28] - 网友评价认为Sora2更擅长处理人物位置关系 想象力更丰富 而Veo3 1在文生视频方面更优 [29] - 谷歌模型强调物理现实世界 Sora模型优先考虑娱乐性 二者各有优劣 [30][31] 发布背景与用户反馈 - Veo3 1是谷歌基于过去五个月的用户反馈进行的更新 期间其平台Flow生成了超过2 75亿个视频 [9] - 用户集中反映Veo3版本真实性尚可但艺术性欠佳 Veo3 1的更新旨在解决此问题 [9][10] - 模型已上线Flow平台 用户也可通过Gemini API Vertex AI和Gemini app抢先体验 [17]
被高估的易中天
搜狐财经· 2025-10-15 09:18
AI视频大模型竞争格局 - Sora2发布即可用,但并未与国产视频大模型(如字节即梦、快手可灵、阿里Wan)形成代差式领先,部分细节甚至不如国产模型[2] - 预测国产视频大模型将在很短时间内对齐Sora2的能力,其中阿里Wan走开源路线,生态建设迅速[2] - Google在Sora2发布后一天推出Veo3.1,在电影级画质视频制作方面优势更大,凭借其强大的基础设施整合能力,未来可能超越OpenAI[2] - AI硬件发展路线不确定性大,OpenAI与英伟达一统天下的模式面临挑战,阿里、谷歌等公司使用自研AI芯片[3] 新易盛2025年上半年财务表现 - 公司实现营业收入104.37亿元,同比增长282.64%[5] - 归属于上市公司股东的净利润为39.42亿元,同比增长355.68%[5] - 基本每股收益为3.97元,同比增长356.32%[5] - 第二季度单季营收63.85亿元,环比增长57.5%,净利润23.7亿元,环比增长50.7%[7] - 业绩爆发式增长主要得益于全球AI算力投资热潮对高速光模块的旺盛需求[5] 新易盛业务转型与市场地位 - 公司从传统光模块供应商转型为AI算力基础设施核心供应商,业务结构发生根本性转变[7] - 4.25G以上高速光模块产品收入占比高达98.91%,传统低速率产品仅占0.87%[9] - 境外收入达985.26亿元,占主营业务收入94.64%,体现全球化战略成功[10] - 公司成功推出基于单波200G光器件的800G/1.6T光模块产品,涵盖VCSEL/EML、硅光、薄膜铌酸锂等多种技术解决方案[8] 行业需求与市场前景 - 亚马逊、微软、谷歌、Meta等北美四大云厂商2025年资本开支预计突破3200亿美元,同比增长30%,主要用于AI数据中心建设[7] - LightCounting预测2025年以太网光模块市场将增长50%,800G市场规模将超过400G,渗透率从25%提升至50%[7] - 800G已成为AI集群标配,预计2025年全球800G需求达1990万只,1.6T需求从200万只调整至100万只[8] 客户结构分析 - 应收账款前五大客户占比72.74%,主要为亚马逊(31.74%)、微软(31.7%)、Meta(18.2%)等国际云巨头[11] - 字节跳动成为国内最大客户,阿里云2025年800G光模块招标量预计达500万只,新易盛获得25%份额[11] - 腾讯份额提升至30%以上,通过拓展国内AI算力客户降低对单一市场的依赖[11][13] - 客户结构优化为公司提供更稳定的增长动力,并与英伟达等AI芯片厂商合作强化竞争力[13] 存货与应收账款风险 - 存货余额59.44亿元,较上年末增长43.86%[14] - 存货跌价损失1.63亿元,同比大幅增长838.72%,存货跌价准备高达5.04亿元[14] - 应收账款50.17亿元,较上年末增长97.59%,99.97%的应收账款账龄在一年以内[15] - 应收账款周转天数为65天,存在一定的坏账风险[15] 技术迭代与行业竞争风险 - CPO(共封装光学)技术可能在2027年后主导Scale-up网络,对传统可插拔光模块构成替代威胁[14][16] - LightCounting预测2025年光模块价格将以每年18%的幅度下滑,800G光模块价格已从2024年的1.2万美元/只降至2025年Q1的8500美元/只[14][18] - 中际旭创已实现硅光模块量产,1.6T产品市占率超35%,而新易盛CPO布局尚处样品阶段[17] - 新易盛研发投入为3.34亿元,低于中际旭创的5.2亿元,在CPO等前沿技术领域的布局相对滞后[18]