视频生成

搜索文档
写了两万字综述 - 视频未来帧合成:从确定性到生成性方法
自动驾驶之心· 2025-07-08 20:45
现在在做 camera ready 版本,如果大家有 insight 或者文献补充欢迎留言 作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1918322086205718663 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 本来是去年想投个IJCAI survey track练手的,一开始只写了七页,结果出了一些事故desk reject 后来修修改改投期刊,补到二十多页,终于可以发表了 希望能比 deep research 自动生成的水平高一些 论文链接:https://arxiv.org/abs/2401.14718 摘要:未来帧合成(Future Frame Synthesis, FFS)的目标是基于现有内容生成未来的帧序列,强调合成方 面,扩展了视频帧预测的范围。本综述全面回顾了FFS领域的现有研究,涵盖了常用的基准数据集和代表性 算法。我们讨论了该领域的关键挑战,并追溯了FFS在 ...
台积电驳斥推迟日本芯片厂建设说法;三星电机因美国关税搁置墨西哥工厂计划丨智能制造日报
创业邦· 2025-07-07 11:21
台积电全球投资布局 - 台积电否认推迟日本芯片厂建设 强调美国亚利桑那州Fab 21工厂投资不影响日本和德国计划 [1] - 媒体报道称台积电可能因美国对中国台湾芯片潜在关税风险调整投资优先级 [1] 三星电机供应链调整 - 三星电机因美国关税不确定性放弃墨西哥工厂计划 已解散当地子公司 [1] - 原计划投资49亿韩元在墨西哥克雷塔罗建设电动汽车摄像头模块生产设施 [1] 蔚来电池技术战略 - 蔚来目标实现电池15年不限里程使用且保持85%健康度 [1] - 通过研发长寿命电池和动态运营策略解决电池寿命与车辆使用周期不匹配问题 [1] 具身智能机器人发展 - 杭州湾具身智能创新中心启用 智元G1机器人展示动态避障与精准抓取能力 [1] - 模拟六大工业场景覆盖搬运/分拣/打包等作业 可快速迁移至汽车/家电制造领域 [1] AIGC技术进展 - 谷歌推出医疗保健领域人工智能计划 [4] - Stability AI发布SV3D工具 可基于单图像生成多视角3D视频 [4] 产业信息服务 - 睿兽分析日报覆盖AIGC/智能制造/企业服务/医疗健康/交通出行五大赛道 [3] - 会员服务提供行业图谱与报告 涵盖人形机器人/商业航天/AGI等热门领域 [5]
TMT行业周报(7月第1周):国内AI软硬件生态持续完善-20250707
世纪证券· 2025-07-07 09:41
报告行业投资评级 未提及 报告的核心观点 - TMT 板块上周除传媒外均跑输沪深 300,看好算力芯片国产化替代进程加速及国产算力产业链带动,关注国产晶圆厂等相关标的 [3] - 随着今夏 GPT - 5 发布,国内外大模型能力边界与生态建设将突破,建议关注大模型、多模态垂直领域应用投资机会 [3] 根据相关目录分别进行总结 市场周度回顾 - TMT 板块内一级行业上周(6/30 - 7/04)涨跌幅为传媒 2.70%、电子 0.74%、通信 - 0.10%、计算机 - 1.28%,除传媒外均跑输沪深 300(1.54%) [3] - TMT 板块内涨幅靠前的三级子行业为游戏Ⅲ(8.36%)、印制电路板(8.31%)、消费电子零部件及组装(2.97%),跌幅靠前的为其他通信设备(- 2.49%)、数字芯片设计(- 2.38%)、通信工程及服务(- 2.36%) [3] - 展示电子、计算机、传媒、通信行业周涨跌幅前五个股情况 [12][13][14] 行业要闻及重点公司公告 行业重要事件 - 7 月有多场行业会议及产品发布、预售等安排,如三星将发布新款折叠智能手机,Meta 与 Oakley 联合推出的 AI 眼镜开启预售等 [15] - AI 模型侧,谷歌、百度等公司有新模型发布,鸿海精密申请注册相关商标 [17] - AI 应用侧,多家机构和企业有开源模型、成立公司、发布计划等动作,预计 2028 年中国安全智能体相关应用市场规模达 16 亿美元,年复合增长率超 230% [19] - AI 算力侧,均普智能、谷歌、华为等公司有新应用、产品或功能上线,恺英网络展示 AI 全流程开发平台 [23] 公司公告 - 阿里云将在马来西亚和菲律宾新增数据中心,2024 年阿里云 AI IaaS 市场份额达 23%,华为云占比 10%,火山引擎占比 9% [24] - 多家公司有股东减持、股份转让、股权收购、中标项目等情况 [24][25]
Meta挖人后,Ilya出任自家公司CEO;《全球人工智能科研态势报告》首次发布,中美AI人才“双强并立”丨AIGC日报
创业邦· 2025-07-05 08:49
2.【李开复:未来5到10年最重要的技术领域就是生成式AI驱动的AI 2.0,如不能及时接纳AI未来会 被淘汰】零一万物CEO、创新工场董事长李开复博士在今日举行的格隆汇中期策略峰会上称:未来5 到10年最重要的技术领域就是生成式AI驱动的AI 2.0,当然也存在其他重要领域,但是他们都必须退 让给AI 2.0,因为AI能赋能每一种技术领域,以及每一个拳头公司。无论个人或公司今天所处的职业 或领域是什么,如果不能及时接纳了解AI,那以后一定会落后甚至被淘汰。(新浪财经) 3.【 谷歌在全球推出全新Veo 3视频生成模型 】当地时间7月3日,谷歌表示,已开始向159个国家 和地区的Gemini用户推出其Veo 3视频生成模型。通过新模型生成视频仅适用于Google AI Pro计划 的付费订阅者,并且每天最多可生成三个视频。谷歌副总裁Josh Woodward表示,公司正在致力于 为Gemini添加图像 到视频生成功能。( 科创板日报) 4. 【字节跳动申请注册"即梦灵感助手"商标】7月4日消息,天眼查财产线索信息显示,近日,北京 字跳网络技术有限公司申请注册"即梦灵感助手"商标,国际分类为通讯服务、网站服务, ...
最重要的搜索阵地,百度想誓死守住
搜狐财经· 2025-07-05 00:41
百度AI搜索转型 - 公司宣布十年来最大一次搜索改版 将搜索框升级为支持千字输入的"智能框" 从"给链接"跨越到"给答案"阶段 [1] - 搜索产品集成AI写作 AI图片/视频生成 视频通话 代码编写 法律咨询等垂直服务 成为多功能集合入口 [1][8][13] - 转型重点从答案生成转向任务解决 通过1 8万个MCP生态调用垂类智能体提供精准服务 [1][9][13] 产品功能升级 - 搜索框输入限制从几十字扩展到千字 新增AI写作和AI生图功能入口 [8] - 实现多模态内容生成 支持图文并茂答案 并可直接附带产品购买链接 [9] - 支持图片 视频 音频等多模态输入 用户可通过拍照搜 视频问等方式与AI交互 [13] 商业化探索 - 传统竞价广告模式受冲击 Q1广告业务收入下滑6% [19][20] - 推出智能体广告新模式 广告主通过智能体推荐植入搜索结果 形成"一键直达"链接 [21][23] - 截至3月已有2 9万家广告主采用智能体广告 覆盖多个商业服务领域 [23] - 智能体广告收入快速增长 代理商创造收入同比增30倍 占核心在线营销收入9% [24] 市场竞争态势 - 阿里夸克 字节豆包等竞品已先行集成深度搜索 智能体 编程等AI功能 [1][16] - 公司3月App月活达7 24亿 同比增长7% 显示AI搜索带来流量增长 [18] - 作为传统搜索头部企业 转型面临市场份额被瓜分与核心业务下滑的双重压力 [16] 战略布局 - 公司于年初建立生成式AI搜索产品框架 正加速AI转型进程 [2] - 选择集成受众最广的AI应用方向 如搜索 AI助手 视频生成等提升用户黏性 [16] - 转型采取渐进策略 从对话框AI功能开始逐步与原有产品融合 [17]
人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破
机器之心· 2025-07-04 10:36
机器之心报道 编辑:杜伟、泽南 大语言模型(LLM)以生成能力强而著称,但如何能让它「听话」,是一门很深的学问。 基于人类反馈的强化学习(RLHF)就是用来解决这个问题的,其中的奖励模型 (Reward Model, RM)扮演着重要的裁判作用,它专门负责给 LLM 生成 的内容打分,告诉模型什么是好,什么是不好,可以保证大模型的「三观」正确。 因此,奖励模型对大模型能力来说举足轻重:它既需要能够准确进行评判,又需要足够通用化,覆盖多个知识领域,还需要具备灵活的判断能力,可以处理 多种输入,并具备足够的可扩展性。 7 月 4 日,国内 AI 科技公司昆仑万维发布了新一代奖励模型 Skywork-Reward-V2 系列,把这项技术的上限再次提升了一截。 Skywork-Reward-V2 系列共包含 8 个基于不同基座模型和不同大小的奖励模型,参数规模从 6 亿到 80 亿不等,它在七大主流奖励模型评测榜单上全部 获得了第一。 Skywork-Reward-V2 系列模型在主流基准上的成绩。 与此同时,该系列模型展现出了广泛的适用性,它在多个能力维度上表现出色,包括对人类偏好的通用对齐、客观正确性、安全性、风 ...
率先部署英伟达最新AI芯片,CoreWeave涨近9%;谷歌在全球推出全新Veo 3视频生成模型丨全球科技早参
每日经济新闻· 2025-07-04 08:08
谷歌Veo 3视频生成模型 - 谷歌向159个国家和地区的Gemini用户推出Veo 3视频生成模型 [1] - 新模型仅限Google AI Pro付费订阅者使用 每日最多生成三个视频 [1] - 公司计划为Gemini添加图像到视频生成功能 [1] Safe Superintelligence人事变动 - OpenAI联合创始人Ilya Sutskever出任Safe Superintelligence CEO [2] - 联合创始人兼CEO丹尼尔·格罗斯已于6月29日离职 [2] - 扎克伯格曾试图全资收购该公司 最近估值为320亿美元 [2] CoreWeave部署英伟达AI芯片 - 戴尔科技向CoreWeave交付首批基于英伟达GB300 NVL72平台的系统 [3] - 该系统代表英伟达最新一代AI芯片技术 由戴尔科技制造 [3] - CoreWeave股价当日收涨8 85% [3] DeepSeek人才招聘动态 - DeepSeek数月来首次在领英发布10个职位招聘信息 [4] - 包括三个通用人工智能(AGI)岗位 工作地点位于北京和杭州 [4] 三星美国芯片厂延期 - 三星推迟美国得克萨斯州泰勒市半导体工厂竣工 [5] - 延期主因是难以找到客户 导致设备采购延缓 [5]
可灵悄悄赚了1个亿
36氪· 2025-07-04 07:59
视频生成技术商业化进展 - 视频生成技术在营销推广端已实现收入与投入打平 [1] - 头部视频生成产品年化收入(ARR)预计2024年达1亿美元,2025年可能增长至5-10亿美元 [19] - 快手可灵在推出后10个月实现ARR超1亿美元,速度快于Cursor的12个月 [17] 行业技术突破与产品迭代 - 谷歌Veo3实现音画同步,成为改变创作者生产模式的杀手级产品 [5] - 可灵2.1版本支持的首部AI单元故事集《新世界加载中》被评价为AI版《爱死机》,模型能力显著提升 [5] - 可灵系列视频生成大模型全球使用份额超30%,超越Runway(23.6%)和Veo-2(16.6%) [14] 用户行为与市场反馈 - AI生成ASMR和AI动物运动会等内容在短视频平台爆火,单条视频播放量达数百万 [2][11] - 用户生成100张图的下载率一年内提升3倍至60%,30天留存率从10%+提升至40% [15] - 创作者倾向选择价格最低的工具,缺乏品牌忠诚度,可灵10秒视频成本约20元,即梦AI约6.3元 [20][22] 技术挑战与行业共识 - 当前模型存在短板,需平衡语义遵从、运动表现、人脸清晰度等多维度能力 [20] - 行业普遍认为"多模态的ChatGPT时刻"尚未到来 [26] - 商业化虽取得进展,但部分公司认为模式尚未完全跑通,仍处早期阶段 [25]
互联网大厂做AI都这么拼了吗?
佩妮Penny的世界· 2025-07-03 18:44
搜索业务升级 - 百度搜索迎来10年来最大改版 核心是突破传统关键词匹配模式 支持上千字口语化提问和多模态输入(语音/图片/视频等) [2][10][15] - 日均搜索量达数十亿次 在中文用户心智中"百度=搜索"的品牌认知已建立25年 [2] - 新版搜索可理解复杂需求 例如"7-8月带娃避暑旅居地推荐 要求杭州5小时交通圈"这类长文本查询 [10] - 支持14种方言语音搜索 AI识图能识别文物并讲解历史 实现"万物皆可搜" [15][19] AI技术赋能 - 搜索业务天然适配AI技术 需处理意图理解/海量数据检索/持续优化等环节 百度早期"All in AI"战略与此相关 [5] - 大模型显著提升交互体验 广告将融入解决方案而非强制展示 改变传统CPC竞价模式 [7][8] - 智能创作功能支持图文/视频生成 例如自动生成小红书封面或3分钟口播视频 [21][22] 生态体系构建 - 百度AI搜索整合MCP协议 已接入1.8万服务模块和220个AI应用 国内接入规模最大 [26] - MCP协议实现跨平台能力调度 例如搜索潮玩直接跳转交易平台 查询基金费率调用理财接口 [26] - 文心大模型4.5Turbo等组件提供MCP支持 与阿里/腾讯/OpenAI等共同推进生态标准化 [26] 多模态创新 - 视频生成模型MuseSteamer在Vbench-I2V榜单持续霸榜 支持10秒1080P视频生成 [31] - 突破传统默片限制 可一体化生成带定制化配音的视频 预计下月上线 [31] - 推出AI创作平台"绘想" 举办视频大赛鼓励用户用图片生成电影短片 [31][32] 行业竞争格局 - 搜索被视为AI时代核心入口 当前一级市场热门项目多聚焦搜索/浏览器/通用Agent领域 [3] - 大厂争夺超级入口控制权 百度通过MCP协议构建开放生态 意图打破APP数据孤岛 [26][27] - 广告收入占比超50%的现金牛业务面临重构 AI驱动商业模式向解决方案集成转型 [4][8]
整理:每日科技要闻速递(7月3日)
快讯· 2025-07-03 07:50
公司动态 - B站原游戏合作部总经理被逮捕 [1] - 阿里与荣耀深化AI生态领域合作 [2] - 特斯拉暂停人形机器人生产并进行设计修改 [3] - 百度商业发布视频生成模型MuseSteamer [4] - 微软计划裁减多达9000名员工 [5] - 雷军回应SU7转单数不足总订单15% [6] - 马斯克将投入数百万美元为得州星链工厂员工建专属休闲设施 [9] 行业数据 - 特斯拉第二季度交付量同比下降13%至38.41万辆 [7] - 预估6月全国新能源乘用车厂商批发销量126万辆 同比增长29% [8] 技术突破 - 世界首台500兆瓦冲击式机组转轮研制成功 [10]