Workflow
Marey
icon
搜索文档
腾讯研究院AI速递 20250801
腾讯研究院· 2025-08-01 00:01
GPT-5泄露与功能曝光 - 大量用户在ChatGPT、MacOS应用、Cursor、微软Copilot及OpenAI API平台发现GPT-5痕迹,预计最快下周发布 [1] - GPT-5将整合GPT系列和o系列,实现多模态和推理能力大一统,包括主模型(代号"nectarine"或"o3-alpha")、mini版(代号"lobster")和nano版(代号"starfish") [1] - GPT-5将支持100万tokens上下文窗口、MCP协议与并行工具调用,其中mini版本Lobster特别强化编程能力 [1] DeepSeek R2核心技术突破 - DeepSeek与北京大学联合完成的《Native Sparse Attention》论文获ACL最佳论文奖,实现模型处理长文本速度提升11倍 [2] - 首创"原生稀疏注意力"机制,将模型从"割裂拼接"推向"有机融合",在不牺牲性能的情况下大幅提升效率 [2] - NSA技术已完成27B、MoE架构上的完整预训练验证,通过三种阅读策略(压缩块、选择性精读、滑动窗口)和门控机制 [2] 谷歌AlphaEarth基础模型 - Google DeepMind推出AlphaEarth Foundations,将多源地球观测数据整合为统一数字表征,实现10米级精度地球观测 [3] - 系统整合卫星图像、雷达扫描、3D激光测绘等多种数据,以10×10米网格分析全球陆地及近海,所需存储空间仅为同类AI系统的1/16 [3] - 多项技术创新包括自适应解码架构、空间密集型时序瓶颈和地理文本精准对齐 [3] Moonvalley视频生成技术 - AI视频生成公司Moonvalley宣布旗舰模型Marey正式支持Sketch-to-Video功能,用户可通过手绘草图一键生成电影级视频 [4] - 该功能支持人物动作或摄像机运动路径定义,自动生成连贯视频 [5] - 目前支持1080p@24fps输出,订阅价格14.99美元/月起 [5] Ollama可视化界面升级 - Ollama 0.10.1版本正式上线可视化图形界面,同步支持Mac和Windows [6] - 新版本提供全新对话界面,支持下载模型、与PDF和文档对话、多模态交互和文档编写功能 [6] - 内置新的多模态引擎,支持发送图片给大语言模型 [6] 1688 AI版转型 - 1688推出全新AI版App,上线免费企业查询工具"88查"和全新商家数字人Agent [7] - 1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等功能 [7] - 商家数字人已有40万商家使用,带动平台GMV和询盘增长18% [7] 逐际动力人形机器人 - 逐际动力推出LimX Oli全尺寸人形机器人,身高165cm、拥有31个主动自由度 [8] - 该机器人软硬件设计贯彻"模块化"与"全开放"理念,提供完整SDK系统 [8] - 推出Lite、EDU及Super三个版本,起售价15.8万元 [8] Meta超级智能愿景 - Meta CEO扎克伯格发布公开信,表示已开始看到AI系统自我改进迹象 [9] - Meta正改变AI模型发布策略,暗示Llama系列不再全部开源 [9] - Meta在第二季度财报中宣布将于2025年斥资高达720亿美元用于AI基础设施建设 [9] a16z AI投资新标准 - a16z合伙人Martin Casado认为AI投资不再看模型性能,而是平台是否能持续交付业务结果 [10] - 平台竞争分化的三要素为组织模式、资源配置与产品策略 [10] - AI估值逻辑回归具体场景,基于悲观、中性、乐观三种场景进行拆解模拟 [10]
特效成本下降90%,它用1.54亿美元,打造合规电影级AI视频
36氪· 2025-07-22 20:07
过去几个月,关于AI将颠覆影视工业的消息不绝于耳。真正点燃这场变革的,是Moonvalley发布的首个面向电影制作、版权合规的AI视频模型 ——Marey。 这意味着,影视创作者用AI生成画面,不再担心版权纠纷,也不再局限于短片、低清、无法控的"AI玩具"。 Moonvalley近日完成8400万美元A+轮融资,由General Catalyst领投,CAA、YC、CoreWeave等参与。至此,Moonvalley的总融资额达1.54亿美 元,成为当前AI视频赛道融资规模最高的玩家之一。 与消费级产品不同,Marey直接定位电影工业,首创前/中/后景分层编辑与3D镜头轨迹控制,单场景渲染成本仅1~2美元(即使用AI模型生成一 段完整的视频片段时,一次性的画面生成过程,所对应的计算成本),较传统VFX(视觉特效)制作成本下降90%以上。 正如CEO Talukdar所言:"AI永远没有品味"。AI工具价值非削减人力,而是能让5000万美元的预算,拍出1亿美元的效果。 01 1美元/次渲染,适配好莱坞生产管线 过去一年,AI视频正逐步渗透好莱坞制作现场。 ▲《野兽派》匈牙利语配音由AI工具Respeecher完 ...
速递|Moonvalley发布首个公开数据训练的AI视频模型Marey:如何实现360度镜头控制与物理模拟
Z Potentials· 2025-07-09 13:56
公司技术 - Moonvalley推出"3D感知"混合模型Marey 通过结合文本提示与手动控制为电影制作人提供更强操控性 区别于标准文本转视频模型[1] - Marey基于公开授权数据训练 避免AI生成内容涉及版权材料的法律风险 针对规避诉讼的电影制作人群体[1] - 模型支持5秒片段生成 符合行业标准 提供14 99美元/100积分至149 99美元/1000积分的订阅服务[1] 产品功能 - 实现物理世界模拟能力 如遵守运动定律 可替换视频主体(野牛→凯迪拉克)并保持环境互动(草叶尘土响应)[3][4] - 支持自由镜头运动 通过鼠标拖拽实现平移滑动变焦 接近360度视角调整 模拟手持/轨道拍摄效果[5] - 具备背景替换功能 保留主体同时转换场景(郊区道路→乡村公路) 未来将新增光照调节/深度轨迹等控制[5] 应用案例 - 独立制片人Ángel Manuel Soto使用Marey降低20%-40%制作成本 解决传统设备租赁的高资金门槛[2] - 应用于影视全流程 包括拍摄前场景测试与后期镜头角度调整 控制物体/角色/动作/构图等要素[2] - 曾用于HBO纪录片《Menudo: Forever Young》制作 通过收购Asteria(XTR)工作室强化内容生产能力[2] 行业定位 - 直接对标Runway Gen-3/Luma Dream Machine等AI视频生成器 强调差异化控制能力[5] - 技术对标Google Veo 3和OpenAI Sora 共享物理世界理解能力 但更早开放商业化应用[3] - 创始团队含DeepMind前研究人员 具备谷歌视频模型开发经验 技术背景深厚[1]