VEO3

搜索文档
甲骨文将与OpenAI在算力方面合作,我们持续看好全球算力产业发展 | 投研报告
中国能源网· 2025-07-08 11:42
核心摘要 平安证券近日发布计算机行业研究报告:甲骨文将与OpenAI在算力方面合作,我们持续 看好全球算力产业发展。甲骨文将与OpenAI在算力方面合作,将在美国各地开发多个数据 中心。百度发布自研视频生成模型MuseSteamer,谷歌在全球推出全新Veo3视频生成模型。 全球大模型竞争依然激烈,将推动算力维持旺盛需求,我们持续看好全球算力产业发展。 以下为研究报告摘要: 投资建议:我们认为,作为新质生产力的重要组成部分,叠加需求端加快修复预期,计 算机行业未来有望迎来业绩和估值的双重提升。我们坚定看好计算机行业未来的投资机会, 建议关注:1)信创板块,推荐龙芯中科、金山办公、达梦数据、太极股份,建议关注中国 软件、中国长城、诚迈科技、星环科技、普联软件、远光软件;2)华为产业链板块,推荐 道通科技、神州数码,建议关注软通动力、拓维信息、麒麟信安、润和软件、卓易信息、海 量数据;3)AI板块,强烈推荐中科创达、盛视科技,推荐海光信息、浪潮信息、紫光股 份、科大讯飞、德赛西威、福昕软件、万兴科技、彩讯股份,建议关注华勤技术、寒武纪、 景嘉微、博思软件;4)金融IT板块,强烈推荐恒生电子,推荐同花顺、宇信科技、 ...
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
钛媒体APP· 2025-07-08 11:37
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型 但被质疑抄袭阿里云通义千问Qwen-2 5 14B模型 注意力参数分布相似性高达0 927 [2] - 华为声明盘古Pro MoE基于昇腾硬件平台开发 部分代码参考业界开源实践 严格遵循开源许可证 [2] - 自称华为员工发文揭露内部团队通过套壳续训阿里千问 Deepseek等竞品模型伪造技术突破 [2][3] 腾讯微信AI搜索争议 - 微信AI搜索功能被指强行开盒 点击推文中蓝色人名链接可浏览AI生成的个人简历及关联推文 [5] - 腾讯回应称AI搜索仅整合公众号及互联网公开信息 不使用用户隐私数据 [5] 百度搜索改版 - 百度搜索框支持超千字长文本输入 集成AI写作 AI画图等功能 为十年来最大改版 [6] 全球AI人才动态 - 全球AI领域Top100人才榜单中华人占主力席位 包括何恺明 张祥雨等就职于国内外企业的研究者 [7] - Meta成立超级智能实验室 引入6名OpenAI前华人员工及Scale AI前CEO等11位行业重量级人物 [28] 大模型开源与进展 - 百度开源文心大模型4 5系列 含47B 3B MoE模型等10款 预训练权重和推理代码完全开放 [15] - 智谱AI开源通用视觉推理模型GLM-4 1V-Thinking 9B参数多模态模型在18项任务中持平GPT-4o等 [10] - 马斯克旗下xAI意外曝光Grok 4模型 定位为旗舰级万能模型 同期完成100亿美元融资 [20][32] 企业级AI应用 - 钉钉多维表新增100+电商行业AI模板 支持AI生成图片 解析文件等功能 产品全面免费 [16] - 微软将AI工具使用量纳入员工考核 GitHub Copilot生成代码比例等成KPI指标 [26][30] - 苹果考虑弃用自研AI模型 转向Anthropic或OpenAI技术为Siri提供支持 [27] 机器人及硬件进展 - 字节跳动两年半量产超千台轮式物流机器人 团队从50人扩至150人 长期目标具身智能 [10] - 宇树科技完成C轮7亿元融资 投后估值120亿元 资金用于加速IPO及技术研发 [35][36] 半导体与EDA动态 - 美国取消对华EDA出口限制 西门子 新思科技 楷登电子恢复中国客户软件访问权限 [17][18] - 国产GPU公司曦望Sunrise融资10亿元 产品线含兼容CUDA生态的S2大模型推理芯片 [38] - 摩尔线程 沐曦科创板IPO获受理 拟分别募资80亿元和39 04亿元 [39] 融资与上市 - Figma提交纽交所IPO申请 2024年营收7 49亿美元 同比增长48% 亏损7 3亿美元 [31] - 云知声港交所上市 募资3 2亿港元 资金用于研发及国际市场拓展 [37] - 智谱AI获上海国资10亿元战略投资 三方合作建设AI新型基础设施 [34] 政策与行业趋势 - 前5个月中国软件业务收入55788亿元 同比增长11 2% 出口227 1亿美元增3 3% [41] - 工信部印发网络安全专项行动方案 目标为800家工业企业开展贯标达标试点 [42] - 北京发布AI+医药健康计划 探索类脑智能 DNA存储等技术在医药领域应用 [43] 海外AI动态 - 谷歌全球开放Veo3 AI视频生成模型 集成音频生成能力 质量与可控性显著提升 [21] - CoreWeave首发英伟达GB300 NVL72服务器 单机架AI性能超百亿亿次浮点运算 [22] - 欧洲44家企业联名呼吁欧盟暂停AI法案 称模糊规则阻碍创新与国际竞争 [29]
可灵悄悄赚了1个亿
36氪· 2025-07-04 07:59
视频生成技术商业化进展 - 视频生成技术在营销推广端已实现收入与投入打平 [1] - 头部视频生成产品年化收入(ARR)预计2024年达1亿美元,2025年可能增长至5-10亿美元 [19] - 快手可灵在推出后10个月实现ARR超1亿美元,速度快于Cursor的12个月 [17] 行业技术突破与产品迭代 - 谷歌Veo3实现音画同步,成为改变创作者生产模式的杀手级产品 [5] - 可灵2.1版本支持的首部AI单元故事集《新世界加载中》被评价为AI版《爱死机》,模型能力显著提升 [5] - 可灵系列视频生成大模型全球使用份额超30%,超越Runway(23.6%)和Veo-2(16.6%) [14] 用户行为与市场反馈 - AI生成ASMR和AI动物运动会等内容在短视频平台爆火,单条视频播放量达数百万 [2][11] - 用户生成100张图的下载率一年内提升3倍至60%,30天留存率从10%+提升至40% [15] - 创作者倾向选择价格最低的工具,缺乏品牌忠诚度,可灵10秒视频成本约20元,即梦AI约6.3元 [20][22] 技术挑战与行业共识 - 当前模型存在短板,需平衡语义遵从、运动表现、人脸清晰度等多维度能力 [20] - 行业普遍认为"多模态的ChatGPT时刻"尚未到来 [26] - 商业化虽取得进展,但部分公司认为模式尚未完全跑通,仍处早期阶段 [25]
大厂正在将AI广告带入“伪人”时代?
虎嗅· 2025-06-24 19:29
行业动态 - TikTok推出全新AI广告功能,可通过图片或文字prompt生成5秒广告视频 [1] - Meta升级图像转视频广告工具,支持20张图片生成多场景视频并添加音乐和文本 [2] - 谷歌Veo3实现提示词一键生成完整视频,已应用于NBA总决赛广告制作,成本降低95% [3][5] - 53.1%广告主已在创意内容中使用AIGC技术,20%广告主视频创作中超半数环节依赖AI [2] 技术应用 - 可口可乐推出首部全AI广告,运用四种AI工具三天完成初稿 [8] - 小型广告公司使用国产模型"可灵"制作汽车变形特效视频,成本从数千元/秒大幅降低 [11] - AI广告公司Icon宣称单条广告成本从200美元降至1美元,流程压缩至1人操作 [6] - 跨境电商团队引入Veo3实现零技术背景生成营销内容,分镜逻辑由ChatGPT辅助完成 [13][14] 市场反应 - 可口可乐AI广告引发负面评价,但获得大量讨论流量 [9] - 某茶饮品牌AI生成人物广告被用户批评"眼睛空空""恶心" [20] - 新加坡财政部AI宣传画面被指"恐怖"后道歉修改 [21] - NIQ报告显示消费者认为AI广告缺乏吸引力且令人困惑 [23] 成本效益 - 传统广告制作需协调多工种,AI广告无需场地布景显著降低成本 [31] - 43%广告主预计2024年营销投入减少,AI成为降本增效首选 [31] - AI广告虽美学质量有限,但可低成本快速铺开加深用户印象 [32] 行业挑战 - AI生成内容存在"恐怖谷效应",拟真风格易引发用户反感 [19][22] - 专业广告领域甲方担忧AI削弱品牌力,部分明确禁用AI素材 [16] - AI广告同质化严重,缺乏差异化与信息价值 [27][28] - 高质量AI内容仍需专业团队后期调整,无法完全替代人工 [12][17]
微软发布Mu模型;特斯拉推出自动驾驶出租车;乔木出轨字节HRBP双双被辞退
观察者网· 2025-06-24 08:48
网易有道开源数学教育模型 - 网易有道开源"子曰3"系列大模型的数学模型Confucius3-Math,是国内首个专注于数学教育的开源推理模型,可在单块消费级GPU上高效运行 [1] 微软发布Mu模型 - 微软发布创新小参数模型Mu,仅有3.3亿参数,性能比肩Phi-3.5-mini但体量是其十分之一,在离线NPU笔记本设备上可达到每秒超过100 tokens的响应速度 [1] - Mu支持在Windows中设置智能体,可将自然语言指令实时转化为系统操作 [1] 抖音上线AI美食产品 - 字节跳动推出AI美食产品"探饭",搭载豆包大模型,主要为用户提供美食相关的智能向导服务,目前仅支持抖音小程序 [2] - "探饭"由字节跳动全资子公司北京有竹居网络技术有限公司开发 [2] AI生成代码研究 - 研究显示2024年美国开发者提交的Python代码中30.1%由AI生成,年创百亿美元价值 [2] - 其他国家AI生成代码比例:德国24.3%、法国23.2%、印度21.6%、俄罗斯15.4%、中国11.7% [2] 谷歌使用YouTube训练AI - 谷歌利用YouTube上200亿条视频训练AI模型包括Gemini和Veo3,但仅使用部分内容并遵守与创作者及媒体公司的协议 [3] - 专家指出这种使用可能引发知识产权危机 [3] 美团优选战略调整 - 美团优选决定进行战略转型升级,继续探索"次日达+自提"模式和社区零售新业态,同时退出部分亏损区域 [3] 文远知行上市动态 - 自动驾驶公司文远知行已秘密提交香港上市申请 [4] - 该公司在全球10个国家30个城市开展自动驾驶业务,运营天数超2000天,拥有5个国家自动驾驶牌照 [5] 非夕科技融资 - 非夕科技完成C轮亿级美元融资,由咏归基金、广发信德联合领投,资金将用于扩产、研发及生态拓展 [5] 哈啰Robotaxi业务融资 - 哈啰Robotaxi业务完成超30亿元融资,引入蚂蚁集团、宁德时代战略投资,新公司"上海造父智能科技"注册资金12.88亿元 [5][6] OMOWAY融资 - 智能电动摩托车品牌OMOWAY完成数千万美元种子轮及天使轮融资,投资方包括真格基金、红杉中国、惠友资本等 [7] 小鹏汇天人事变动 - 杜超出任小鹏汇天首席财务官、副总裁,拥有近20年投行及企业财务管理经验 [8] 特斯拉自动驾驶出租车 - 特斯拉在奥斯汀推出自动驾驶出租车服务,使用仅配备摄像头和端到端AI的Model Y SUV,每次出行固定费用4.20美元 [9] 银河通用融资 - 银河通用完成超10亿元新一轮融资,由宁德时代及溥泉资本领投,创下今年以来具身智能赛道最大单笔融资 [10] - 截至目前公司累计融资金额已超过23亿元 [11] 字节跳动人事处理 - 字节跳动前Seed大语言模型负责人乔木因出轨HRBP被辞退并扣罚全部年终奖 [11]
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
数字生命卡兹克· 2025-06-23 03:12
AI视频爆款现象分析 - 动物奥运会AI视频在Tiktok获290万点赞,引发X和Tiktok平台模仿潮[1][2] - Veo3制作的卡皮巴拉Vlog在6月初爆火,带动大脚怪自拍、三国战地记者等衍生内容[8] - AI ASMR视频8天涨粉17万,播放量达5000万,推动该类型达到高潮[10] - AI唱Rap科普视频成为新爆款形式[12] 爆款复制价值探讨 - 跟风模仿AI视频格式易陷入短期流量陷阱,类似唐朝张大麻追逐潮流却失败的故事[20][24][26] - 流量本质具有不确定性,"流"代表变化性,"量"代表可测量但短暂的状态[33][35] - 表层模仿价值有限,核心在于构建独特叙事能力与IP宇宙,如将动物奥运会升级为连续剧式内容[43][44] 流量获取与留存挑战 - 生产门槛降低导致注意力竞争加剧,仅极少数创作者能持续获取流量[75][76] - 流量本质是情绪博弈,类似股市中散户在情绪高潮时进场却亏损的现象[67][68][71] - 观众忠诚度取决于创作者人格魅力而非内容形式,需建立情感连接[88][90] 长期价值构建路径 - 流量需转化为长期叙事或稳定IP才能产生持续价值,类似股票价格最终回归基本面[83][84] - 人类注意力具有刺激阈值递增特性,需通过独特观点和温度维持吸引力[86][87] - AI工具无法替代创作者的人生底稿与人格化表达[91][92] 行业启示 - 爆款周期缩短反映内容行业加速迭代,但匠人精神仍为核心竞争力[94][96] - 注意力经济下,平台算法与用户疲劳度加剧内容生命周期衰减[73][87] - 成功案例显示AI视频在娱乐、科普等领域的创新潜力[8][10][12]
马斯克:将用Grok 3.5重新编写人类知识;月之暗面首个Agent“Kimi-Researcher”开启内测丨AIGC日报
创业邦· 2025-06-22 08:48
苹果股东集体诉讼 - 苹果公司因涉嫌证券欺诈遭到股东集体起诉 指控其在信息披露中低估了将先进生成式AI整合进Siri所需时间 导致iPhone销量受影响和股价下滑 [1] - 诉讼涵盖截至6月9日一年内蒙受损失的投资者 可能损失达数千亿美元 尽管期间推出新功能和外观更新 但AI进展有限 [1] - 苹果首席执行官蒂姆・库克 现任及前任首席财务官均被列为被告 案件已在旧金山联邦法院立案 [1] 谷歌AI训练数据来源 - 谷歌正利用其YouTube平台上200亿条视频训练AI模型 包括Gemini和Veo3视频音频生成器 [2] - 谷歌证实仅使用部分YouTube内容 并遵守与创作者及媒体公司的协议 但未透露具体使用视频数量或比例 [2] - 专家警告此举可能引发知识产权危机 即便仅使用1%的视频库 也相当于23亿分钟内容 [2] 月之暗面Kimi新产品 - 月之暗面旗下Kimi的首个Agent"Kimi-Researcher(深度研究)"于6月21日开始小范围灰度测试 [3] 马斯克知识库重建计划 - 马斯克宣布将使用具备先进推理能力的Grok 3 5(或4)重新编写人类知识全部内容 补充缺失信息并删除错误 [4] - 计划用修正后的数据集重新训练基础模型 认为现有模型训练数据中存在过多垃圾信息 [4]
8天涨了17万粉,5000万播放,他把AI ASMR带向了最高潮。
数字生命卡兹克· 2025-06-20 03:44
AI ASMR视频现象 - AI ASMR视频近期在X、TikTok、抖音、小红书等平台爆火,内容以高沉浸感的视听体验为主,用户需佩戴耳机收听以获得最佳效果[1][2] - TikTok账号"impossibleais"6月11日发布首个AI ASMR视频,两周内粉丝增长至17万,视频点赞量普遍达数十万,最高单条获250万点赞[2][12] 技术实现与创作方法 - 视频生成工具采用Google Veo3模型,该技术可原生生成与画面同步的ASMR音效,通过Gemini官网即可操作(需境外网络)[13] - 标准化创作模板包含4K画质、特定材质(如玻璃)与动作(如切割)等要素,示例提示词售价9.99美元,中文模板已由用户购买并公开[14][15] - 典型创作案例:刀切蓝色玻璃树莓的4K特写,生成时长约3分钟,组合3-4个片段可制成24-32秒的完整视频[15][17] 用户需求与市场反应 - 目标用户存在显著猎奇心理,AI生成的玻璃材质切割声等非自然音效提供传统ASMR无法实现的刺激感[17][18] - 核心受众包括失眠/焦虑人群,新型AI音效因其陌生化特质成为睡前助眠新选择,部分用户已形成固定使用习惯[17][18] - 该内容形态突破ASMR行业边界,首次实现视听感官的同步创新,开辟"非现实音效"创作赛道[18][19] 行业影响与趋势 - Google Veo3技术降低ASMR内容创作门槛,个人用户可快速生成专业级作品,颠覆传统ASMR依赖实体道具的生产模式[13][15] - AI视频平台流量分配机制显现,具备"材质冲突"(如金属与玻璃交互)元素的视频更易获得算法推荐[17][18] - 该案例标志AI应用从视觉领域向听觉领域扩展,预示"感官合成"将成为下一代内容创业的技术支点[19]
汪华的最新预言:AI时代和移动互联网的最大区别是实现,而非连接
暗涌Waves· 2025-06-19 17:21
移动互联网与AI时代的范式差异 - 移动互联网的核心范式是连接,追求大体量用户群和垄断性平台,而AI时代的核心范式是实现,聚焦垂直领域的高价值交付[4][5] - 大厂在AI领域仍沿用移动互联网打法,争夺10%-20%的连接市场,但80%-90%的实现市场留给创业者[5] - 新旧范式的本质区别在于:移动互联网追求广度(用户规模),AI追求深度(单用户价值)[5][6] 模型红利带来的创业机遇 - 2023年底至今,推理模型和多模态技术突破形成史上最大模型红利,创业者可借此快速实现千万美元级营收[8][9][11] - 模型性能在指令遵循、工具调用等实际应用场景的进步远超榜单体现,半年内多个垂直领域出现从"玩具"到"惊艳"的转折[11][12] - 典型案例包括:医疗笔记公司估值达50亿美元,编程工具Lovable利用Claude3.7实现前端开发革新[11][12] 垂直领域创业策略 - 目标市场选择标准:不需大规模用户,但需高ARPU(toC约200美元/年,toB几十个客户即可达千万美元营收)[17][18] - 成功案例:Rille t用AI重构中小企业财务系统,一年内颠覆传统产品;餐饮管理SaaS通过模型整合实现快速商业化[21][22] - 方法论:聚焦具体痛点,问题定义越细模型效果越好,避免与通用方案(如谷歌搜索)正面竞争[23][24] Agent与多模态的技术窗口 - Agent领域:未来一年工具调用能力将提升10倍,从当前支持十几个工具扩展到上百个工具协同[31][33][34] - 多模态领域:B端应用存在巨大空白,视频生成、运动控制等关键技术将在10个月内显著进步[35][36] - 行动窗口:模型红利黄金期约12个月,之后进入同质化竞争阶段,创业者需抓住技术跃迁期[34][36] 全球化市场机会 - 中国创业者应瞄准全球市场:欧美市场ARR达成速度比国内快5-10倍,且模型能力更成熟[7][21] - 南方创业者优势:强商业化能力、全球化视野与AI实现范式高度契合,有望复制跨境电商成功[37][38] - 行业分布:除互联网外,重点关注医疗、法律、金融、餐饮等传统行业数字化改造[22][24]
终于有AI视频模型,解决了体操难题。
数字生命卡兹克· 2025-06-19 03:08
视频模型技术突破 - MiniMax发布Hailuo 02视频模型,首次实现杂技动作生成能力,肢体表演和动作幅度远超Veo3等竞品[1][4] - 该模型攻克了AI视频领域的"体操难题",能生成包含两次空中旋转的高杠体操动作,且形体保持完整[6][7][21] - 在杂技类动作表现上显著领先,如小丑抛球倒立、双杠倒立等复杂动作完成度远超Runway Gen4等模型[23][24][26] 技术性能对比 - 对比一年前Luma AI生成的体操视频(四肢扭曲变形),Hailuo 02展现出质的飞跃[6] - 与主流视频模型对比测试显示:Veo3生成的运动员触垫后形体碎裂,Runway Gen4出现"面条人"变形,即梦模型产生双头怪等异常[9][11][13][15] - 在跳马测试中,Hailuo 02实现助跑、起跳、谢幕全流程动作,镜头运动自然流畅[19][21] 产品特性与商业化 - 支持原生1080P视频生成,新人赠送500免费积分,768p/6秒视频仅需25积分,1080p视频80积分[45] - 具备多动作连续生成能力,可配合镜头运动指令,如"摄影机快速摇摄并倾斜捕捉轨迹"[7][45] - 在物理效果模拟上实现突破,能准确表现玻璃破碎、物体坠落等动态场景[37][38] 行业影响 - 该模型标志着AI视频技术进入新阶段,解决了运动捕捉和物理规律模拟等核心难题[23][46] - 在表演领域延续优势,情绪表达和复杂动作结合产生"登峰造极"效果,如机甲降落、消防员破窗等场景[34][35][38] - 价格策略具有竞争力,以"便宜又大碗"形成市场差异化优势[45]