Veo 2

搜索文档
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
今天大家都在谈MS的这篇DeepSeek R2分析的报告,提前曝光了R2的性能和参数,我们简单总结一 下这个报告的核心内容: DeepSeek R2 使用了多达 1.2 万亿个参数,采用了新颖的架构,实现了运行成本的显著降低。其采用 混合专家混合(MoE)架构,有 780 亿个活跃参数。 并且R2 使用华为的 Ascend 910B 芯片进行训练,而非 NVIDIA 的芯片。 R2 增强了多语言覆盖能 力,能流畅处理非英语语言;扩展了强化学习,利用更大的数据集,使模型能够进行更具逻辑性和 更像人类的推理;增加了多模态功能,能够处理文本、图像、语音和视频数据;实现了推理时的缩 放,通过采用通用奖励模型(GRM),在推理过程中增加计算资源,从而提高了输出质量。 R2 具有高成本效益,输入成本为每百万代币 0.07 美元,输出成本为每百万代币 0.27 美元,而 R1 的 输入成本为 0.15-0.16 美元,输出成本为 2.19 美元。 由于这篇报告讲的人已经很多了,我们就不赘述了,而且报告也放到了星球中,有兴趣的朋友可以 到星球中看原文。 今天这篇文章来看另一篇AI的分析,Artificial Analysis ...
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
DeepSeek R2分析 - 采用1.2万亿参数混合专家架构(MoE),活跃参数达780亿,显著降低运行成本[1] - 使用华为Ascend 910B芯片训练,非NVIDIA方案[1] - 多语言处理能力增强,支持文本、图像、语音和视频多模态功能[1] - 推理成本优化:输入成本降至每百万代币0.07美元(R1为0.15-0.16美元),输出成本0.27美元(R1为2.19美元)[1] 2025年AI六大趋势 1 AI持续进步 - OpenAI的o4-mini和o3、Google Gemini 2.5 Pro、xAI Grok 3领跑智能水平,开源模型如DeepSeek R1接近专有模型性能[3] - Google通过TPU加速器至Gemini模型的垂直整合形成优势[3] 2 中国AI崛起 - DeepSeek、阿里巴巴等中国实验室开源模型智能水平媲美美国,缩小全球竞争差距[4] 3 推理模型 - 通过生成中间token提升逻辑性,Gemini 2.5 Pro可解决复杂问题如蒙提霍尔问题,非推理模型GPT-40因简化处理而错误[5] 4 AI代理 - 多LLM串联实现端到端任务自主处理,减少人工干预[6] 5 效率与MoE架构 - 小模型智能提升+硬件迭代推动推理成本下降,MoE架构通过部分参数激活提高效率[7] 6 多模态AI - **图像生成**:GPT-40设视觉质量标杆,Google Veo 2超越OpenAI Sora[8] - **语音处理**:OpenAI和ElevenLabs领跑语音转文本,MiniMax Speech-02-HD接近人类对话水平[9] 竞争格局与基准 - 开源模型(DeepSeek R1、Meta Llama 3.1)与专有模型(o4-mini、Gemini 2.5 Pro)智能差距缩小[14] - 美国与中国实验室竞争加剧,模型发布周期缩短至3个月[14] - 推理模型在Artificial Analysis智能指数(MMLU-Pro等7项评估)中表现更优,但消耗更多token[21][31] 成本与架构 - 高性能模型推理价格持续下降,DeepSeek R1成本显著低于前代[34] - MoE架构模型(如DeepSeek R1)在效率与性能平衡上优于密集架构[36] 产业链关键玩家 - **基础模型**:OpenAI、Google、DeepSeek、阿里巴巴[16] - **多模态领域**:OpenAI(语言/图像)、ElevenLabs(语音)、Midjourney(图像)[18] - **硬件**:NVIDIA主导,华为Ascend 910B等挑战者涌现[37]
人工智能行业深度报告:海外大厂:AI云加速商业化,构建Agent生态引领效率革命
浙商证券· 2025-05-29 08:23
报告行业投资评级 - 看好(维持) [5] 报告的核心观点 - AI推动云厂商业绩亮眼,大厂AI云业务盈利能力强且Capex持续高增,行业需求增长可期 [1][2] - 微软AI云营收贡献度加速提升,智能体生态有望引领生产力革命 [3] - 谷歌Gemini大模型升级,Agent生态加速构建,云业务成长迅速 [4][5] 根据相关目录分别进行总结 1 AI推动云厂商业绩亮眼,Capex投入及行业需求值得期待 1.1 海外大厂云业务规模保持快速增长,盈利能力及客户规模持续提升 - 2025Q1亚马逊AWS、谷歌GCP、微软智能云业务合计营收682.78亿美元,同比增20.4%,AI赋能下云业务增长良好 [1][14] - 2025Q1三家厂商经营性利润率分别为39.45%/17.76%/41.48%,同比分别提升1.83pct、提升8.33pct、下降1.50pct [1] - 2024Q4全球云基础设施服务支出同比增22%达910亿美元,亚马逊AWS、微软Azure和谷歌GCP市场份额领先 [19][21] - 2024年亚马逊AWS、谷歌GCP、微软Azure客户数分别达260万、96万和34.5万家,同比分别增长25%、23%和14% [22] 1.2 海外大厂资本开支投入力度不减,全年维持高投入指引 - 2025Q1微软、谷歌等五家大厂合计资本开支770.00亿美元,同比增长67.53%,自2024年Q2以来持续高增 [26] - 2013 - 2024年微软等四家厂商Capex投入持续提升,2024年Capex/OCF比值同比提升,投入力度加大 [30] - 谷歌和Meta预计2025年Capex分别达750亿美元和640 - 720亿美元,微软至2026财年Capex支出将继续增加 [33] 1.3 企业客户积极拥抱AI浪潮,拉动云计算行业规模持续成长 - 2023 - 2029年公有云市场预计保持19.13%复合增速,2029年市场规模有望达1.8万亿美元 [2][35] - 2023年全球公有云SaaS层微软、Salesforce、Google占市场份额前三,IaaS市场亚马逊AWS居龙头 [40][42] - 2023年全球企业IT支出约34%聚焦云服务领域,企业关注云业务效益优化和上云 [44] - 至2029年全球雇员人均SaaS软件年支出有望达220.3美元,AI融合或推动软件付费提升 [46] 2 微软:AI云业务加速成长,Agent引领生产力革命 2.1 云业务营收超预期,AI相关产品增速表现良好 - FY25Q3微软单季度营收700.66亿美元,同比增长13.3%,净利润258.24亿美元,同比增长17.7% [49] - FY25Q3毛利率、净利率分别为68.72%、36.86%,费用率下降,经营效率提升 [52] - FY25Q3经营性现金流净额370.44亿美元,同比增长16.1%,OCF Margin同比提升 [54] - FY25Q3资本开支167.45亿美元,同比增长52.9%,Capex/OCF达45.20%,投入力度加大 [55][57] - FY25Q3智能云、生产力及业务流程、更多个人计算业务营收分别为267.51/299.44/133.71亿美元,智能云贡献主要增量 [60] - FY25Q3核心产品条线营收在AI赋能下保持良好增长,云端大模型吞吐量和Copilot Studio用户数增长 [64][67] - 根据业绩会指引,FY25Q4各业务板块营收有望增长,Azure预计营收增长34% - 35% [72][73] 2.2 微软云业务保持良好增长,AI贡献度实现加速提升 - FY2025Q3智能云业务营收267.51亿美元,同比增长20.8%,商业云cRPO达3150亿美元,同比增长34.04% [74] - FY2025Q3云业务营收424亿美元,同比增长20.5%,Azure & Other Cloud营收增速33%,AI贡献占比提升至16% [77] - Azure AI Foundry可支持企业级AI应用和Agent,包含多项产品服务 [80][83] - 微软宣布智能体平台支持MCP协议,Azure AI Foundry和Copilot Studio支持A2A协议 [90] 2.3 办公应用业务表现亮眼,Copilot产品矩阵加速迭代 - FY2025Q3商业版M365产品及云服务营收218.83亿美元,同比增长11.0%,企业版订阅席位数增长 [92][98] - FY2025Q3消费版M365产品及云服务营收18.21亿美元,同比增长10.5%,订阅用户数增长 [99] - 1%的Office Copilot渗透率可对企业和个人用户业务分别创造15.48亿和2.10亿美元年收入增量 [102] - 微软推动Copilot与软硬件融合,发布“一键执行”功能,Copilot应用功能更新升级 [105][109] - 3月推出Researcher和Analyst两款AI Agent,可提供专业知识和数据分析洞察 [116][117] - Build 2025大会推出Microsoft 365 Copilot Tuning,企业可调整AI模型 [121] 2.4 搜索引擎:Copilot Search有望推动微软市占率提升 - FY25Q3搜索及新闻广告业务营收35.04亿美元,同比增长14.70%,New Bing市占率逐步提升 [124] - 微软发布Copilot Search功能,结合传统与生成式搜索,提升信息获取效率 [127] 3 谷歌:打造Gemini大模型+A2A协议+Agentspace生态 3.1 整体经营质量持续提升,AI加速融合各业务场景 - 2025年Q1谷歌营收902.34亿美元,同比增长12.0%,净利润345.40亿美元,同比增长46.0% [130] - 2025Q1毛利率及经营性利润率分别为59.70%和33.92%,销售费用率优化 [134] - 2025Q1经营性现金流净额361.50亿美元,同比增长25.3%,OCF Margin提升 [137] - 2025Q1资本开支171.97亿美元,同比增长43.2%,保持AI基础设施投入 [139] - 2025Q1谷歌云等业务营收有不同程度增长,旗下多款产品使用Gemini模型 [143][146] 3.2 谷歌云业务快速成长,Agentspace及A2A协议打造智能体生态 - 2025Q1谷歌云业务营收122.6亿美元,同比增长28.1%,经营性利润和利润率提升 [148] - 谷歌云营收规模从2019年到2024年CAGR达37.1%,市占率从2020Q1的6%增长至2024Q1的11% [150] - 初创及小微企业贡献谷歌云绝大部分营收,客户结构和投入有特点 [154] - 谷歌布局AgentSpace,有多种核心功能,定价分三档 [158][160] - 谷歌开源A2A协议,I/O大会发布v0.2版本,更新后协议优势明显 [161][165] 3.3 Google Gemini大模型综合能力大幅升级,关注视频性能突破 - 2025年3月底上线Gemini 2.5 Pro模型,推理和代码能力领先,准确率达业界领先 [167] - 5月7日发布Gemini 2.5 Pro(I/O edition),编程能力大幅提升,可构建多种应用 [170] 4 建议关注标的 - Agent应用:科大讯飞、焦点科技等 [7] - AI垂类应用:金山办公、福昕软件等 [7]
通信行业周报:谷歌AI亮眼,坚定看好全球AIDC产业链
开源证券· 2025-05-25 12:25
报告行业投资评级 - 看好(维持)[1] 报告的核心观点 - 谷歌开发者大会发布多款AI新品,用户量持续攀升,大厂陆续宣布支持MCP,助力AI Agent加速发展,持续看好国产AI算力产业链、卫星互联网、6G等七大产业方向 [3][4][5] 根据相关目录分别进行总结 周投资观点 谷歌开发者大会发布多款AI新品,用户量持续攀升 - 2025年5月21日,谷歌I/O开发者大会发布多款AI模型、AI应用、AI Agent等产品,Gemini系列模型全面升级,Imagen 4和Veo 3等多模态模型功能增强,Gemini模型将登陆多平台赋能终端产品,AI Agent产品功能丰富且计划扩展平台 [11][13][15] - 截至5月21日,谷歌每月token处理数量达480万亿,同比提升超50倍,超700万名开发者用Gemini搭建AI应用,是去年的5倍,Gemini应用有4亿月活用户,使用2.5 Pro模型的用户活跃度上涨45% [13] - 谷歌搜索方面,截至5月21日,AI Overviews月活用户达15亿,新上线“AI Mode”功能强大,可用于多方面 [14] 大厂陆续宣布支持MCP,助力AI Agent加速发展 - 5月19 - 22日,字节、微软、谷歌、OpenAI等大厂陆续宣布支持MCP协议,随着A2A协议和MCP生态完善,AI Agent开发效率和交互能力有望提升,加速AI应用落地 [16] 投资建议 - 展望2025年,看好国产AIDC算力产业链、海外AIDC产业链以及AI应用、运营商、卫星互联网&6G等板块投资价值,建议重视七大产业方向,包括AIDC机房建设、IT设备、网络设备、算力租赁、云计算平台、AI应用、卫星互联网&6G,并给出各方向推荐标的和受益标的 [17][18][19] 市场回顾 - 本周(2025.05.19 - 2025.05.23),通信指数下跌2.3%,在TMT板块中排名第三 [24] 通信数据追踪 5G - 2025年3月底,我国5G基站总数达439.5万站,比2024年末净增14.5万站;3月,三大运营商及广电5G移动电话用户数达10.68亿户,同比增长22.20%;3月,5G手机出货1942.4万部,占比85.3%,出货量同比增长9.52% [25] 运营商 - 云计算方面,2024年中国移动、中国电信、中国联通云营收分别达1004亿元、1139亿元、686亿元,同比分别增长20.4%、17.1%、17.1% [41] - 三大运营商ARPU值方面,2024年中国移动、中国电信移动业务ARPU值分别为48.5元、45.6元,同比分别略减1.6%、略增0.4%;2023年中国联通移动业务ARPU值为44.0元,同比略减0.7% [41]
通信行业周报:谷歌AI亮眼,坚定看好全球AIDC产业链-20250525
开源证券· 2025-05-25 11:41
报告核心观点 - 看好通信行业,谷歌发布多款AI新品且大厂支持MCP,持续看好国产AI算力产业链、卫星互联网、6G等七大产业方向 [1][3][5] 周投资观点 谷歌开发者大会发布多款AI新品,用户量持续攀升 - 2025年5月21日谷歌I/O开发者大会发布多款AI产品,Gemini系列语言模型全面升级,如Gemini 2.5 Pro Deep Think强化推理能力、Gemini 2.5 Flash注重效率成本、Gemini Diffusion文本生成速度快,还引入新功能 [11][12] - 多模态模型方面,Imagen 4支持高分辨率和定制,Veo 2和Veo 3新增功能且Veo 3可直接生成有声视频,截至5月21日谷歌月处理token量同比提升超50倍,超700万开发者用Gemini搭建应用,Gemini应用月活4亿,2.5 Pro模型用户活跃度涨45% [13] - AI应用上,Gemini将登陆多平台,谷歌搜索AI Overviews月活15亿,新上线“AI Mode”功能强大,可用于多方面 [14] - AI Agent方面,Google Beam可将2D转3D,Project Astra功能丰富,Project Mariner能协作完成多任务,未来将扩展平台 [15] 大厂陆续宣布支持MCP,助力AI Agent加速发展 - 5月19 - 22日,字节、微软、谷歌、OpenAI等大厂宣布支持MCP协议或完善相关版本,随着A2A和MCP协议完善,AI Agent开发效率和交互能力有望提升,加速应用落地 [16] 投资建议 - 看好国产AIDC算力产业链、海外AIDC产业链及AI应用、运营商、卫星互联网&6G等板块,建议重视七大产业方向,包括AIDC机房建设、IT设备、网络设备、算力租赁、云计算平台、AI应用、卫星互联网&6G,并给出各方向推荐和受益标的 [17] 市场回顾 - 本周(2025.05.19 - 2025.05.23)通信指数下跌2.3%,在TMT板块中排名第三 [24] 通信数据追踪 5G - 2025年3月底我国5G基站总数达439.5万站,比2024年末净增14.5万站;3月三大运营商及广电5G移动电话用户数达10.68亿户,同比增长22.20%;3月5G手机出货1942.4万部,占比85.3%,出货量同比增长9.52% [25] 运营商 - 云计算方面,2024年中国移动、中国电信、中国联通云营收分别达1004亿、1139亿、686亿元,同比分别增长20.4%、17.1%、17.1% [41] - ARPU值方面,2024年中国移动、中国电信移动业务ARPU值分别为48.5元、45.6元,同比分别略减1.6%、略增0.4%,2023年中国联通移动业务ARPU值为44.0元,同比略减0.7% [41]
AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏
量子位· 2025-05-21 14:31
不仅可以拿捏各种影视风格—— 请看VCR (花式演绎"We can talk!") 。 一水 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌最强视频生成模型Veo 3鲨疯了! 这一次,从画面到对白,全都由AI原生直接生成。 还能搞定大段rap—— 视频中的Flow只需简单一句话就能搞定,比如"让老人谈论宇宙"。 从画面到口型再到音频,完全以假乱真了。 还在发布会现场,谷歌DeepMind CEO哈萨比斯就激动宣布: 我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。 而通过官方demo,我们也看到了Veo 3电影级的音视频能力: 目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放,企业用户可以在Vertex AI平台调用。 虽然距离发布会结束才几小时,但一大波网友试玩已新鲜出炉—— 说唱、洗脑神曲、烹饪节目花式整活 一上来,脑洞大开的网友们就开始搞起了抽象…… 提示词:a video with dialogue of two muffins while baking in an over, the first muffin ...
谷歌I/O超全总结:AI搜索大变样,AR眼镜复活,大模型全家桶升级,史上最贵订阅费1800元
36氪· 2025-05-21 08:48
谷歌I/O开发者大会核心亮点 - 谷歌CEO桑达尔·皮查伊在主题演讲中高频提及"Gemini"(95次)和"AI"(92次),凸显战略重心 [1] - 公司推出Gemini订阅计划:AI Pro(19.99美元/月)含基础功能,AI Ultra(249.99美元/月)开放高级权限 [1] - 终极目标是构建通用AI助手,Gemini被定位为"世界模型",已展示自行车维修等场景的主动服务能力 [3] 模型升级与技术突破 Gemini系列进展 - Gemini 2.5 Pro新增音频输出、深度思考模式,编程能力显著提升(Cursor平台年度增速最快) [9][15] - Gemini 2.5 Flash推理/编程指标优化,生成速度比扩散语言模型慢5倍,6月全面开放 [17][18] - 模型处理能力跃升:月处理token数从9.7万亿增至480万亿(50倍增长),开发者超700万(5倍增长) [12] 多模态模型创新 - 视频模型Veo 3实现有声视频直接生成,支持物理模拟和口型同步 [25] - 图像模型Imagen 4支持2K分辨率,织物/动物毛发渲染逼真,文字排版能力增强 [21] - 音乐生成平台Lyria Realtime支持交互创作,SynthID水印已标记100亿份AI生成内容 [24] 产品生态整合 搜索与购物革新 - AI Mode美国上线:动态生成图表/店铺列表,购物场景支持虚拟试穿、代理结账 [5][36] - 视觉搜索年增65%,累计完成1000亿次搜索,AI Overviews月活达15亿 [34][36] - 查询扇出技术可并发数百次搜索,几分钟生成专业报告,金融分析功能今夏推出 [36][38] 硬件与平台合作 - 安卓XR智能眼镜原型亮相:支持翻译/消息回复/图像检索,与三星/高通深度合作 [7][28][30] - Project Aura智能眼镜采用骁龙XR芯片,视野70度,含OST/VST显示技术 [33] - Google Beam将2D视频转为3D体验(60帧/秒),惠普设备年内推出 [44] 研究项目突破 - Project Astra实现多模态交互:盲人音乐家辅助案例展示实时视觉/语音能力 [48] - Project Marina可监管10项并行任务,计算机使用能力今夏开放 [49][50] - Gemini Live API开放音视频输入控制,支持语调/口音定制 [48] 开发者生态与基础设施 - 第七代TPU Ironwood计算能力达42.5 exaFLOPS,性能提升10倍 [10] - Gemini SDK兼容MCP工具,编程助手Jules处理GitHub任务效率提升至分钟级 [17][50] - Gemini应用月活超4亿,2.5 Pro版本使用量增长45% [8][14]
每月1800元,谷歌发布AI全家桶;马斯克称仍致力于执掌特斯拉丨全球科技早参
每日经济新闻· 2025-05-21 08:03
每经记者|宋欣悦 每经编辑|高涵 |2025年5月21日星期三| NO.1 每月1800元,谷歌发布AI全家桶Google AI Ultra 当地时间5月20日,谷歌在"I/O 2025"全球开发者大会上发布了AI全家桶——Google AI Ultra。Google AI Ultra整合了目前谷歌最好的模型、各种高级功能以及30T的云存储。有如此强的功能,收费方面每月 249.99美元(约合人民币1809元)。通过AI Ultra,用户能体验到最高版本的Gemini应用,该应用在深 度研究领域设置了最高使用权限,支持使用Veo 2进行视频生成,还能让用户提前使用突破性的Veo 3模 型。此外,在未来几周内,AI Ultra订阅用户将能够使用Deep Think 2.5 Pro这一全新增强推理模式。 点评:Google AI Ultra的发布,是谷歌在人工智能领域持续发力的重要体现,有望为不同行业的专业人 士提供更为强大、高效的AI解决方案,在竞争激烈的AI市场中抢占更多份额。 NO.2 马斯克称仍致力于执掌特斯拉 据央视新闻,当地时间5月20日,美国企业家埃隆·马斯克称仍致力于在五年内担任特斯拉首席执行官, ...
每月1800元 谷歌发布AI全家桶—Google AI Ultra
快讯· 2025-05-21 04:53
每月1800元 谷歌发布AI全家桶—Google AI Ultra 金十数据5月21日讯,今天凌晨,谷歌在"I/O 2025"全球开发者大会上发布了AI全家桶——Google AI Ultra。Google AI Ultra整合了目前谷歌最好的模型、各种高级功能以及30T的云存储,以帮助影视、金 融、医疗等人员通过AI提升工作效率节省时间。有如此强的功能,收费方面每月249.99 美元(大约 1809元),这比ChatGPT Pro还贵50美元。通过AI Ultra,用户能体验到最高版本的Gemini应用,该应用 在深度研究领域设置了最高使用限制,支持借助Veo 2进行视频生成。还能让用户提前使用突破性的Veo 3模型,非常适合编程、学术研究和复杂的创意工作,并且在未来几周Ultra订阅用户能使用Deep Think 2.5 Pro这一全新增强推理模式。 (AIGC开放社区) ...
2025年哪款模型最受欢迎?Poe最新报告:DeepSeek降温、可灵成黑马
Founder Park· 2025-05-15 19:34
模型市场份额动态 - DeepSeek R1消息份额从2月中旬7%峰值降至4月底3% [4][7] - GPT-4.1系列和Gemini 2.5 Pro在编程任务中份额分别增长至10%和5% [7] - Claude 3.5 Sonnet仍保持12%总体使用率,但Claude 3.7 Sonnet抢占其份额 [7] 推理模型发展趋势 - 用户发给推理模型的文本消息总份额从2%上升至10% [4][9] - Gemini 2.5 Pro发布后6周内获得30%推理消息份额 [11] - 具备混合推理能力的模型如Gemini 2.5 Flash Preview和Qwen 3占比约1% [14] 图像生成领域竞争 - GPT-Image-1开放API两周内图像生成使用率达17% [4][17] - 谷歌Imagen 3系列使用量从10%增长至30% [17] - FLUX系列图像生成模型市场份额从45%降至35% [18] 视频生成市场格局 - Kling-2.0-Master发布三周内占据21%视频生成请求份额 [4][21] - 谷歌Veo 2模型保持约20%使用份额 [22] - Runway使用份额下降40%至约20% [23] 音频生成领域现状 - ElevenLabs处理约80%订阅用户TTS请求 [4][24] - Cartesia、Unreal Speech等新玩家提供多样化声音选项和价格方案 [24]