Veo 3视频生成模型

搜索文档
AI产业跟踪:海外:德国TNG推出DeepSeek变体模型,DeepSWE开源AIagent
国泰海通证券· 2025-07-09 19:12
报告行业投资评级 未提及 报告的核心观点 报告跟踪AI产业最新趋势,涵盖行业动态、应用资讯、大模型资讯和科技前沿等方面,展示AI领域的多项进展与创新 根据相关目录分别进行总结 AI行业动态 - 戴尔向CoreWeave交付首批英伟达GB300NVL72系统,该系统AI性能超“每秒百亿亿次浮点运算”,每个机架提供40TB快速内存,与上一代相比性能显著提升 [4] - Meta成立超级智能实验室,由前Scale AI CEO等领导,专注AI产品和应用研究,还从多家公司挖来11名顶尖人才 [5] AI应用资讯 - Meta为WhatsApp商业版增添AI功能,未来几周大型企业可通过API接口使用语音通话功能,客户与企业能互发语音消息,目前免费未来或收费 [6] - 亚马逊部署第100万台机器人并推出DeepFleet生成式AI基础模型,可协调机器人行动,缩短10%行动时间,提升配送效率并降成本 [7] - 谷歌推出Veo 3视频生成模型,能生成视频背景音效,可生成1080P、超60秒视频,已向美国地区Gemini Ultra会员开放 [8] - 法国Kyutai开源文本转语音模型Kyutai TTS,支持文本流式传输,延迟低至350毫秒,支持英法双语及长篇文章语音生成 [9] - 谷歌Gemini 2.5 Pro API恢复免费访问,提供每分钟5次请求、每分钟25万tokens及每日100次调用的免费额度 [11] - 谷歌发布Gemini教育版,面向全球教育领域免费开放,有免费和付费两种版本,计划年内推广至更多地区 [12] - Claude Code推出Hooks功能,基于Shell的钩子系统,能将编程会话中的不确定性转化为确定性命令 [13] AI大模型资讯 - 德国TNG推出DeepSeek变体模型R1T2,速度提升200%,是6710亿参数的开源混合模型,但欧洲企业使用或受限 [14] - 智谱开源GLM - 4.1V - Thinking,以90亿参数在28项多模态基准测试中表现惊艳,跨域泛化能力强 [15] - DeepSWE开源AIAgent框架,在SWE - Bench - Verified测试中表现出色,训练方法等全面开源 [16] - 谷歌开源Gemma 3n,原生支持多模态输入及文本输出,在多语言、数学、编码与推理方面均有质量提升 [18] - Grok4在「人类最后考试」拿下45%跑分,在多项基准测试中表现超竞品 [19] 科技前沿 - 欧洲第一台百万兆次级超级计算机JUPITER亮相,位于德国于利希超级计算中心,能效位列全球前五 [20]
产业观察:【AI产业跟踪~海外】德国TNG推出DeepSeek变体模型,DeepSWE开源AIAgent
国泰海通证券· 2025-07-09 17:45
AI行业动态 - 戴尔向CoreWeave交付首批英伟达GB300NVL72系统,AI性能超“每秒百亿亿次浮点运算”,每个机架提供40TB快速内存[8] - Meta成立超级智能实验室,从OpenAI等公司挖来11名顶尖人才[9] AI应用资讯 - Meta为WhatsApp商业版添加AI功能,月活超2亿,目前免费未来或收费[10] - 亚马逊部署第100万台机器人,推出DeepFleet模型,缩短机器人10%行动时间[11] - 谷歌推出Veo 3视频生成模型,已向美国地区Gemini Ultra会员开放[12] - 谷歌发布教育产品Gemini for Education,付费版每月2美元[17] AI大模型资讯 - 德国TNG推出速度提升200%的DeepSeek-TNG R1T2 Chimera模型,参数6710亿[19] - 智谱开源GLM - 4.1V - Thinking,在28项多模态基准测试中表现惊艳[20] - DeepSWE开源AIAgent,Pass@1准确率达42.2%,运用TTS策略后升至59%[21] - Grok4在「人类最后考试」用推理技术后跑分达45%,超OpenAlo3一倍[24] 科技前沿 - 欧洲首台百亿亿次超算JUPITER跻身全球TOP500榜单第四,能效位列全球前五[25] 风险提示 - AI软件销售、研发及capex投资计划可能不及预期[4][26]
TMT行业周报(7月第1周):国内AI软硬件生态持续完善-20250707
世纪证券· 2025-07-07 09:41
报告行业投资评级 未提及 报告的核心观点 - TMT 板块上周除传媒外均跑输沪深 300,看好算力芯片国产化替代进程加速及国产算力产业链带动,关注国产晶圆厂等相关标的 [3] - 随着今夏 GPT - 5 发布,国内外大模型能力边界与生态建设将突破,建议关注大模型、多模态垂直领域应用投资机会 [3] 根据相关目录分别进行总结 市场周度回顾 - TMT 板块内一级行业上周(6/30 - 7/04)涨跌幅为传媒 2.70%、电子 0.74%、通信 - 0.10%、计算机 - 1.28%,除传媒外均跑输沪深 300(1.54%) [3] - TMT 板块内涨幅靠前的三级子行业为游戏Ⅲ(8.36%)、印制电路板(8.31%)、消费电子零部件及组装(2.97%),跌幅靠前的为其他通信设备(- 2.49%)、数字芯片设计(- 2.38%)、通信工程及服务(- 2.36%) [3] - 展示电子、计算机、传媒、通信行业周涨跌幅前五个股情况 [12][13][14] 行业要闻及重点公司公告 行业重要事件 - 7 月有多场行业会议及产品发布、预售等安排,如三星将发布新款折叠智能手机,Meta 与 Oakley 联合推出的 AI 眼镜开启预售等 [15] - AI 模型侧,谷歌、百度等公司有新模型发布,鸿海精密申请注册相关商标 [17] - AI 应用侧,多家机构和企业有开源模型、成立公司、发布计划等动作,预计 2028 年中国安全智能体相关应用市场规模达 16 亿美元,年复合增长率超 230% [19] - AI 算力侧,均普智能、谷歌、华为等公司有新应用、产品或功能上线,恺英网络展示 AI 全流程开发平台 [23] 公司公告 - 阿里云将在马来西亚和菲律宾新增数据中心,2024 年阿里云 AI IaaS 市场份额达 23%,华为云占比 10%,火山引擎占比 9% [24] - 多家公司有股东减持、股份转让、股权收购、中标项目等情况 [24][25]
Meta挖人后,Ilya出任自家公司CEO;《全球人工智能科研态势报告》首次发布,中美AI人才“双强并立”丨AIGC日报
创业邦· 2025-07-05 08:49
人工智能行业人才流动与竞争 - Meta从OpenAI前首席科学家Ilya Sutskever创立的Safe Superintelligence(SSI)挖走联合创始人丹尼尔·格罗斯,任命其为AI产品部门负责人,苏茨克维将亲自出任SSI CEO [1] - Meta近期展开数百亿美元规模的AI招聘潮,包括向Scale AI投资140亿美元并吸引其创始人及核心工程师加入 [1] - SSI回应Meta收购传闻,强调其拥有独立计算资源和团队,专注于安全超智能技术开发 [1] 生成式AI技术发展趋势 - 李开复指出未来5-10年生成式AI驱动的AI 2.0是最重要技术领域,将赋能所有行业,不拥抱AI的企业将被淘汰 [2] - 谷歌向159国推出Veo 3视频生成模型,仅限付费订阅者使用且每日限生成3个视频,计划增加图像转视频功能 [3] - 字节跳动申请注册"即梦灵感助手"商标,扩展AI创意平台功能至图片/视频创作领域,此前已成功注册相关商标 [4] 全球AI科研人才格局 - 中美合计占全球AI研究人员57.7%,中国AI人才数量从2015年不足万人增至2024年5.2万人,年复合增长率28.7% [5] - 中国AI人才第一梯队为中科院(3453人)、清华(2667人)、北大(2123人),腾讯(992人)、阿里(633人)超越部分高校 [5][2] - 美国以6.3万AI研究人员领先全球,斯坦福(2385人)、MIT(2191人)与谷歌(2569人)、微软(2461人)形成产学研双引擎 [2]
率先部署英伟达最新AI芯片,CoreWeave涨近9%;谷歌在全球推出全新Veo 3视频生成模型丨全球科技早参
每日经济新闻· 2025-07-04 08:08
谷歌Veo 3视频生成模型 - 谷歌向159个国家和地区的Gemini用户推出Veo 3视频生成模型 [1] - 新模型仅限Google AI Pro付费订阅者使用 每日最多生成三个视频 [1] - 公司计划为Gemini添加图像到视频生成功能 [1] Safe Superintelligence人事变动 - OpenAI联合创始人Ilya Sutskever出任Safe Superintelligence CEO [2] - 联合创始人兼CEO丹尼尔·格罗斯已于6月29日离职 [2] - 扎克伯格曾试图全资收购该公司 最近估值为320亿美元 [2] CoreWeave部署英伟达AI芯片 - 戴尔科技向CoreWeave交付首批基于英伟达GB300 NVL72平台的系统 [3] - 该系统代表英伟达最新一代AI芯片技术 由戴尔科技制造 [3] - CoreWeave股价当日收涨8 85% [3] DeepSeek人才招聘动态 - DeepSeek数月来首次在领英发布10个职位招聘信息 [4] - 包括三个通用人工智能(AGI)岗位 工作地点位于北京和杭州 [4] 三星美国芯片厂延期 - 三星推迟美国得克萨斯州泰勒市半导体工厂竣工 [5] - 延期主因是难以找到客户 导致设备采购延缓 [5]
火山引擎原动力大会即将召开,恒生互联网ETF(159688)大涨超3.7%,恒生科技ETF指数基金(513580)涨超2.8%
21世纪经济报道· 2025-06-09 10:58
港股市场表现 - 6月9日港股高开高走,恒生指数涨超1%,恒生科技指数涨幅扩大至2 33% [1] - 恒生科技ETF指数基金(513580)盘中涨幅达2 82%,持仓股中金蝶国际涨超6%,腾讯音乐-SW、美团-W、京东集团-SW等大涨 [1] - 恒生互联网ETF(159688)大涨3 77% [1] 字节跳动AI大会 - 6月11日字节将在北京召开火山引擎Force原动力大会·春,内容包括豆包大模型家族全面升级及多场分论坛 [1] - 主论坛内容涵盖火山引擎新品发布、AICoding、AIAgent [1] - 行业分论坛包括AI+金融、AI+汽车、AI+生态、AI+医药大健康专场 [1] - 6月12日为开发者交流日,大会涉及芯片、汽车、智能终端、软件应用等领域的企业合作伙伴 [1] 多模态AI动态 - 5月21日谷歌推出Veo 3视频生成模型,实现AI视频音画同步 [2] - 5月23日豆包上线视频通话功能,支持实时视频交流及屏幕分享 [2] - 6月6日快手宣布可灵AI ARR在2025年3月突破1亿美金,4月和5月月度付费金额均突破1亿人民币 [2] - 6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春召开,多模态模型和端侧AI产品有望加速落地 [2] 投资主线分析 - 投资主线降维为三个方向:Deepseek突破与开源引领的科技AI+、消费股估值修复和消费分层复苏、低估红利崛起 [2] - 红利回撤与AI产业趋势相关,AI产业趋势进展取决于应用端和消费端突破 [2] - 消费板块投资核心因子是估值,当前低估值、利率下行、政策催化下复苏周期抬头 [2] - 恒生互联网板块值得重视 [2]
谷歌微软发布多款AI产品,云计算沪港深ETF(517390)逆势收涨0.74%,资金连续3日净流入
21世纪经济报道· 2025-05-26 17:01
市场表现 - 5月26日市场震荡调整,创业板指领跌,但中证沪港深云计算产业指数逆势收涨0.29%,成分股中润泽科技涨超4%,奥飞数据、二六三、易华录、汉得信息涨超3%,浪潮信息、紫光股份、东方国信等跟涨 [1] - 云计算沪港深ETF上涨0.74%,溢折率0.36%,截至5月23日连续3日净流入资金累计766万元 [1] 行业动态 - 谷歌在I/O大会上发布升级版Gemini 2.5模型、Veo 3视频生成模型及智能眼镜等软硬件产品 [1] - 微软在Build 2025大会上提出"智能体网络"概念并发布50余项AI新产品和服务 [1] - Anthropic推出Claude 4系列,编程能力显著提升 [1] - 国产AI协作平台Manus推出39美元团队套餐降低企业使用门槛 [1] - 浙江政策将智能家居机器人等纳入消费补贴范围 [1] 机构观点 - 国内外科技厂商在模型端持续创新,AI能力与业务体系融合成为重心,AI有望逐渐成为生产力工具 [2] - 计算机行业年初至今涨幅靠前,2024年业绩探底但2025Q1边际复苏,主要受益于成本管控及AI赋能业务 [2] - 算力基础设施、国产自主可控、能源/智能驾驶等细分行业AI应用表现较强韧性 [2] - 超长期特别国债发行与地方化债推进有望改善计算机板块现金流回款情况,2025年利润端将逐步释放 [2]
行业周报:周观点:AI有望持续精彩-20250525
开源证券· 2025-05-25 21:18
报告行业投资评级 - 看好(维持) [1] 报告的核心观点 - AI有望持续精彩,谷歌开发者大会展示AI技术与生态体系全面融合,字节、腾讯等大厂推动AI与业务体系融合,国内外科技厂商将AI能力与自身业务体系融合成重心,AI有望成生产力工具 [5][6][13] 一周市场回顾 - 本周(2025.5.19 - 2025.5.23),沪深300指数下跌0.18%,计算机指数下跌3.02% [4][14] 公司动态 对外投资与中标 - 高伟达以自有资金1000万元增资蓝芯算力,11.15万元计入注册资本,剩余计入资本公积,完成后将持有0.67%股权 [15] - 宏景科技与Y公司签署《智算项目服务合同》,提供服务器等服务及算力服务,合同总金额59699.20万元含税,期限五年 [15] 股权激励 - 格灵深瞳拟授予660万股限制性股票,占股本总额2.55%,首次授予11人,授予价8.05元/股,业绩考核目标2025 - 2026年营收增长率不低于113.68%、156.41%,触发值不低于80.34%、113.68% [16] - 焦点科技拟授予1532.40万份股票期权,占股本总额4.83%,首次授予1153人,行权价29.04元/份,业绩考核目标2025 - 2027年净利润增长率分别不低于20%、40%、60% [16] 其他公告 - 京北方董事赵龙虎拟减持不超52.92万股,占总股本0.061%;副总经理曹景广拟减持不超4.34万股,占总股本0.005% [17] - 青云科技嘉兴蓝驰、天津蓝驰拟减持不超1194992股,占总股本2.50%;横琴昭盛拟减持不超955992股,占总股本2% [17] - 金财互联股东徐正军拟减持不超1538.43万股,占总股本1.97% [18] - 拉卡拉股东孙浩然拟减持不超1927.09万股,占剔除回购股份后总股本2.45% [19] - 并行科技805.76万股股票解除限售,占总股本13.8375%,5月26日可交易 [19] - 纳思达拟出售美国利盟100%股权,预估交易对价0.75 - 1.5亿美元 [19] - 大豪科技控股子公司兴汉网际进入创新层 [19] 行业动态 国内要闻 - 阿里巴巴投资美图2.5亿美元,持股6.85%,双方将进行AI等业务合作 [20] - 小米自研3nm芯片玄戒O1大规模量产,小米15周年发布会发布搭载该芯片的两款旗舰 [21] - 华为发布首款鸿蒙折叠屏电脑MateBook Fold非凡大师,售价23999元起 [22] 国外要闻 - Meta推出激励计划助力初创企业采用Llama AI模型,入选成员每月最高获6000美元补贴,最长六个月 [23][24] - 苹果智能眼镜芯片计划2026年或2027年量产,能耗低于iPhone芯片 [25] - 苹果公布WWDC25日程,6月10 - 14日线上大会免费开放 [26] - 英伟达推出人形机器人基础模型N1.5,开发周期从三个月缩至36小时 [27] - OpenAI推出云端AI编程智能体Codex,提升开发效率 [28] 投资建议 AI应用端 - 推荐金山办公、鼎捷数智等,受益标的包括汉邦高科、海天瑞声等 [7][13] AI算力端 - 推荐海光信息、中科曙光等,受益标的包括优刻得、青云科技等 [7][13]
Google I/O 2025:谷歌杀疯了,把 AI 塞进了每一个缝隙
36氪· 2025-05-21 18:53
谷歌AI生态系统升级 - 公司从搜索业务转型为全栈AI生态系统,涵盖模型、硬件、平台等多维度创新 [1][3] - 推出"AI Mode"重构传统搜索功能,具备自然语言对话、多模态识别和上下文理解能力 [6][7] - 搜索场景可结合用户历史数据(Gmail/日历)实现个性化推荐,例如餐饮推荐自动整合价格/评分/外卖选项 [8][12] Gemini模型技术突破 - 模型月活用户达4亿,年增长50倍至480万亿token处理量,开发者数量同比增长5倍至700万 [5] - 推出三大新模型: - **2.5 Pro Deep Think**:在USAMO数学竞赛得分40.4%,超越GPT-4 Turbo [13] - **2.5 Flash**:token消耗降低30%,输入成本$0.15/百万token,输出$0.6/百万token [14][15] - **Diffusion**:文本生成速度提升5倍达10,000 token/秒,新增方言/语调保留的音频生成功能 [18] - 模型集成至Chrome/Docs/Gmail等全线产品,覆盖工作生活全场景 [19] XR硬件与空间计算 - 发布Android XR平台及两款硬件: - **Project Aura**:轻量AR眼镜,集成Gemini实时感知与语音交互 [22] - **Project Moohan**:对标Vision Pro的沉浸式头显 [23] - 硬件支持实时物体识别(如自行车组装指导)和任务中断续接能力 [25] 内容生成技术进展 - **Veo 3**视频模型实现原生音频输出,支持对白/背景音同步生成 [26][28] - **Imagen 4**支持2K分辨率图像生成,结合Flow平台可完成从脚本到成片的AI影视创作 [30] 开发者工具革新 - **Jules**编程智能体支持异步代码重构/测试编写,运行于私有云实例保障安全 [31] - **Code Assist**支持200万token上下文,集成团队协作规范工具 [33] - **Stitch**实现自然语言生成UI界面,支持Figma/HTML导出 [33] 订阅服务体系 - 推出**AI Ultra**订阅($249.99/月),包含Veo 3/Imagen 4/30TB存储及多任务智能体Mariner [34][36] - **AI Pro**订阅维持$19.99/月价格,覆盖Gemini 2.5 Pro和深度搜索功能 [37] - 教育优惠扩展至日本/巴西等地区,大学生可享1年Pro版免费 [37] 行业影响 - 公司通过产品矩阵实现AI技术从工具到"数字延伸"的范式转变 [38][40] - 技术覆盖搜索/创作/开发/硬件全链条,形成生态级竞争壁垒 [3][19][40]
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:22
谷歌AI技术进展 - 核心观点:谷歌在开发者大会上展示了AI技术的最新进展,包括基础模型升级、生成式内容工具推出和硬件更新,标志着其AI生态系统建设迈出重要一步 [1] Gemini模型升级 - Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话,开发者可通过Live API预览版微调对话体验的音调、口音和说话风格 [2] - Gemini可作为Chatbot登录Chrome浏览器,帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制,显著提升模型在数学、编程和多模态任务中的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成,可为视频添加背景音乐、音效甚至对白,解决AI视频"有影无声"问题 [3] - Imagen 4图像生成模型在细节和文本输出质量上有质的飞跃,支持渲染织物、水滴和动物皮毛等精细细节,可创建2K分辨率图像 [3] AI代理工具更新 - Project Mariner优化工作方式,可一次承担近十几项任务,如购买门票或杂货,无需访问第三方网站 [4] - 推出视频通话平台Google Beam,硬件包括六摄像头阵列和光场显示器,软件通过AI模型实现3D渲染,支持毫米级头部跟踪和60fps视频流 [4] XR智能眼镜 - 与Xreal、Samsung合作推出集成AI助手功能的Android XR智能眼镜,支持实时翻译、导航和信息提示 [5] AI订阅计划 - 推出每月249 99美元的AI Ultra订阅计划,提供Gemini 2 5 Pro的Deep Think模式、Veo 3视频生成工具等高级功能访问权限 [6]