Workflow
Gen 4.5
icon
搜索文档
速递|冲刺“世界模型”:Runway获E轮3.15亿美金弹药,英伟达、Adobe共同押注
Z Potentials· 2026-02-11 12:08
融资与估值 - AI视频生成初创公司Runway完成3.15亿美元E轮融资,公司估值飙升至53亿美元,较之前水平近乎翻倍 [2] - 本轮融资由General Atlantic领投,参投方包括英伟达、富达管理与研究公司、AllianceBernstein、Adobe Ventures、未来资产、Emphatic Capital、Felicis、Premji以及AMD Ventures [4] 战略与资金用途 - 新资金将使Runway能够预训练下一代世界模型,并将其引入新产品和行业 [2] - 公司计划运用新资金将其约140人的团队在研发、工程和市场拓展等岗位进行快速扩容 [4] - 公司近期与CoreWeave签署协议以扩大算力规模,此举可能增强了投资者对其在算力密集型领域运营能力的信心 [3] 技术发展与产品 - Runway以具备物理感知能力的AI视频生成模型闻名,于去年12月发布了其首款世界模型 [2] - 世界模型是一种能够构建环境内部表征的人工智能系统,从而能够对未来事件进行规划,许多顶尖学者认为这类模型对突破大语言模型的局限至关重要 [2] - 公司最新视频生成模型Gen 4.5支持用户通过文本提示生成高清视频,并引入了原生音频生成、长视频生成、多镜头生成、角色一致性保持以及高级编辑工具等功能 [3] - Gen 4.5模型在多项基准测试中表现优于谷歌和OpenAI的视频生成产品,为Runway在人工智能行业赢得了重要信誉 [3] 市场定位与行业竞争 - Runway历史上在传媒、娱乐和广告行业建立了坚实的客户基础,包括近期与Adobe建立合作关系 [2] - 公司在游戏和机器人领域的应用正日益增长 [2] - Runway的战略转型正值世界模型研发竞赛白热化之际,竞争对手包括李飞飞创立的World Labs与Google DeepMind,两家机构近期均已向公众开放其模型 [2] - 公司将世界模型技术视为攻克医药、气候、能源及机器人等领域重大挑战的核心 [2]
AI视频的“1毛钱战争”与“万亿生意”
创业邦· 2026-01-30 14:07
AI视频行业概览与竞争格局 - AI视频技术正以“周”为单位快速迭代,海外如PixVerse、Runway与国内公司如字节即梦AI、快手可灵AI均在激烈竞争,模型份额月初与月底可能发生显著变化[5][7][9] - 行业竞争激烈源于退一步面临“流量危机”,进一步则是“万亿蓝海”,AI视频有望带来更沉浸体验并已开始抢夺用户注意力,未来可能蔓延至漫剧、游戏及电影等领域[9] - AI视频不仅是技术进步,更是个性体验、内容生产和商业效率的“三重革命”,对字节、快手等视频平台而言是一场不得不参与的竞争[11] 字节(即梦AI)与快手(可灵AI)的技术与产品路径对比 - 技术路线差异显著:字节即梦基于多模态基础大模型Seedance,优化模型以实现参数知识共享并降低维护成本;快手可灵则聚焦打磨视频模型基座,通过产品交互创新提升生成可控性[16][17][20] - 产品策略与目标不同:即梦旨在“突破产品技术上限”并定义下一代超级入口,其探索方向是结合AI技术解锁全新场景与产品形态;可灵则走“产品创新驱动”的务实路线,聚焦服务专业创作者(P端)和企业客户(B端),对大众市场(C端)保持探索[22] - 资源投入悬殊:2025年字节在算力、芯片等方面的资本投入达1500亿元,断层领先行业;内部采用“饱和式”投入与“内部赛马”机制,即梦2025年获得的算力资源同比增加300%[23][25] - 生成效果与成本存在权衡:可灵2.6 Pro生成视频画面细节更丰富但排队时间超30分钟,每分钟生成成本为4.2美元;即梦生成速度更快(1分钟内)且成本更低,其Seedance 1.5 pro模型API定价为每分钟1.56美元[13][15][29] - 用户增长呈现不同态势:可灵凭借务实策略在发布一年内用户总量从600万飞升至4500万;即梦则凭借低价格和高效率,截至去年9月月活用户达到2037万,是可灵的13倍[27][28] AI视频行业的商业化现状与挑战 - 当前AI视频生成可能并非一门好生意,存在用户留存率低与创作门槛高的问题,例如Sora的30天用户留存率仅1%,且高达90%的生成视频为不可用的“废片”[33][35] - 商业化表现分化:专注大众市场的产品如即梦AI和Minimax的海螺AI年化营收均未破亿;而聚焦专业创作者的可灵累计收入已达7亿元,预计全年收入10亿,其中近70%营收由P端订阅会员贡献,B端客户规模超2万家[37][39] - 成本效益显著:AI视频能将传统视频制作时间从平均7小时缩短至45分钟,制作成本节省一半,这使其成为对专业创作者有吸引力的生产力工具[39] 字节与快手的长期战略与市场展望 - 字节即梦采取放眼长期增长的战略,认为视频是更理想的AI产品形态,内部判断“长期看,即梦的价值空间可能是剪映的十倍”,参照剪映2024年近百亿收入,即梦瞄准千亿级市场[41] - 为培育大众市场,即梦在产品设计、流量扶持和价格上积极布局:通过短视频交互推荐内容、利用抖音生态导流(2025Q1该路径贡献37%新用户)、并设定极具竞争力的低价,单条视频生成最低仅0.1-0.19元[42][44] - 快手可灵则专注即时收益,采取“先落袋为安”的务实策略,但其也面临挑战,创作者可能组合使用多家厂商的专精模型,导致用户被分流[46][47] - 行业未来形态未定,但科技正加速发展,无论是快手的“务实当下”还是字节的“豪赌未来”,都在等待市场验证[48][50]
腾讯研究院AI速递 20260123
腾讯研究院· 2026-01-23 00:01
视频生成模型技术升级 - Runway发布全新Gen 4.5图生视频模型,镜头控制和故事叙事能力显著提升,能在5秒内快速生成包含近景、中景、远景的三个镜头 [1] - 在1000人参与的测试中,仅有57%的人能分辨AI生成视频与真实视频,模型在人物面部一致性、光影逻辑和物理规律表现上接近电影级水准 [1] - 视频生成模型正进入新一轮升级期,真实度、声画同步、局部控制精细化和更长生成时长成为行业共同趋势 [1] 大模型在教育领域的应用拓展 - 谷歌联手The Princeton Review将全套SAT模拟题整合进Gemini,用户可免费进行全真模考,分数立等可取并获得详细错题解析 [2] - 测试涵盖阅读写作和数学两大模块,支持自定义倒计时和提示功能,Gemini会把解题思路拆解成详细步骤辅助理解 [2] - SAT只是第一步,谷歌计划将Gemini逐步扩展到更多标准化考试,同时通过垂直领域渗透策略让AI成为各行业的专家助手 [2] 大模型服务与算力挑战 - 智谱GLM-4.7上线后用户高速增长导致算力紧张,部分用户在高峰期遇到并发限流和模型速度变慢问题 [3] - 1月23日起限量发售GLM Coding Plan,每日可销售量降至当前20%,优先保障老用户的编程体验 [3] - 智谱正在研发更强大高效的模型并加速算力扩容,已有自动续订不受影响,限售结束时间另行通知 [3] 垂直领域大模型突破 - 百川发布医疗大模型M3 Plus,幻觉率降至2.6%达全球最低,首创“证据锚定”技术可将每句医学结论精确锚定到原始论文对应段落 [4] - M3 Plus在Healthbench等权威评测中登顶榜首全面超越GPT-5.2,API调用价格较上一代降低70% [4] - 百川推出“海纳百川”计划,向中国医疗服务机构免费开放M3 Plus API,推动AI医疗生态发展 [4] 消费级AI硬件与助手演进 - 苹果正秘密研发类似AirTag外形的AI设备,配备双摄像头和三麦克风,功能类似Ai Pin,首批规划量产2000万台,最快2027年发布 [5] - 苹果计划推出代号“Campos”的全新Siri,深度整合iOS 27,支持网页搜索、写邮件、生成图片和屏幕感知等ChatGPT级能力 [5] - 新版Siri基础模型将基于Google Gemini 3构建,苹果每年需向谷歌支付约10亿美元,并可能切换到TPU服务器托管 [5] AI驱动的程序化视频制作工具 - Remotion是一个开源库,支持用React代码程序化制作视频,现已有专门的skills可通过npx命令安装到Cursor、Claude Code等开发工具 [6] - 用户只需提供文案和节奏需求,AI就能自动生成带动画的视频效果,支持产品演示、宣传视频等场景,并可通过Web端编辑器做细节修改 [6] - 这一工具适合独立开发者制作产品宣传视频,实现了“视频编辑可以接近编程”的思维转变,支持与AI反复迭代调整效果 [6] 人工智能学术研究前沿 - AAAI 2026公布5篇杰出论文,其中三篇由华人团队主导,作者来自港科大(广州)、西湖大学、浙大、同济、浙师大、港城大等高校 [7] - 获奖论文涵盖机器人视觉语言动作模型ReconVLA、多模态表示学习LLM2CLIP、动力系统因果发现CADYT等前沿方向 [7] - AAAI 2026总投稿23,680篇,录用4,167篇,接收率17.6%,会议于1月20-27日在新加坡举行 [7] 消费级AI市场趋势与竞争格局 - 通用LLM助手市场呈“赢家通吃”趋势,ChatGPT周活跃用户达8-9亿,仅9%用户会为多款AI产品付费,Gemini桌面端用户同比增长155% [8] - 2025年图像视频生成模型在真实感和推理能力上取得长足进步, Veo 3的音视频融合和Nano Banana Pro的搜索整合成为关键突破 [8] - 头部实验室在模型研发上表现出色,但新消费级产品多未取得理想效果,2026年初创企业在细分应用场景仍有很大发展空间 [8] AI模型价值观与安全框架 - Anthropic发布84页《Claude宪法》并以CC0协议开源,这是一份直接面向AI模型的价值观宣言,定义Claude是谁及如何自处 [9] - 宪法确立四级价值优先级:广义安全>广义伦理>遵循指南>真正有帮助,强调“可修正性”是当前阶段最重要的安全特性 [9] - 文件明确划定硬性红线包括不协助制造大规模杀伤性武器、不生成CSAM等,同时鼓励Claude建立稳定积极的自我认同 [9]
57.1%的人分不清真假!Runway新视频模型太爆炸
量子位· 2026-01-22 13:39
Runway Gen 4.5模型的核心能力 - 全新Gen 4.5模型主打图生视频,在镜头控制和故事叙事能力上显著提升[8][9] - 模型能在5秒内快速生成包含近景、中景、远景三个镜头的视频[11] - 在1000人参与的调查中,只有约一半(57%)的人能分辨出该模型生成的视频与真实视频的区别[11][21] 模型在镜头控制与一致性方面的表现 - 即便镜头晃动,人物面部仍保持较高一致性[12] - 在快速运动场景下,如骑飞行章鱼,人物面部细节稳定不崩坏[13] - 复杂场景中,如巨型毛绒猩猩在纽约街头,镜头比例、透视逻辑及主体与背景的光影一致性处理得当[15] - 模型具备精准的镜头控制能力,包括景别、角度、运动轨迹及切换节奏,输出效果接近真实摄影语言[16] - 通过图像参考和内部优化,模型实现了更稳定的角色一致性,主体在不同镜头中的跨帧效果更佳[16] 模型在长故事叙事与连贯性方面的进步 - 模型长故事表达能力增强,能承载更长时序的内容结构,视频完整度和长度大幅提升[16] - 多个镜头之间的情节逻辑性更强,叙事表达比上一版本更到位[16] - 在长达两分多钟的剧情视频中,即便在同一场景多次切换镜头位置和动作,画面空间关系和镜头衔接依然保持连贯,无明显跳轴或场景漂移问题[18] - 用户制作的视频展示了出色的镜头漂移感,能流畅切换特写与远景镜头[18] 视频生成行业的整体发展趋势 - 从去年年底至今,视频模型能力进入新一轮升级期,各厂商发布节奏密集[23][35] - 行业整体趋势对视频模型的真实度和一致性要求被整体抬高,包括纹理与细节保真、光影与氛围、整体画面质感等[25][26] - 模型越来越注重理解并遵守现实世界的物理规律,在跨帧表现上要求更自然[27] - 声画同步能力显著提升,模型可直接生成配套音频,唇形同步精度提高,即使在侧脸、极端角度或多人对话场景也不易崩坏[28][30] - 局部控制精细化成为重要趋势,支持单独编辑局部区域而无需重新生成整段视频[28] - 支持更长的生成时长,10至60秒的视频生成区间变得常见,竖屏原生视频逐步占据主流[28] - 视频生成方式更加多元,从图生视频到音频生视频,创作路径更加灵活[28] - 主流视频模型的能力已明显接近可商业化应用、具备普适性的水平[34]
AI初创公司Runway推出影片生成模型Gen 4.5;字节Seed发布GR-RL,首次实现真机强化学习穿鞋带丨AIGC日报
创业邦· 2025-12-03 08:08
可灵AI产品发布 - 公司正式发布全新产品可灵O1,该产品基于全新的视频和图像模型,整合文字、视频、图片、主体等多模态输入 [2] - 可灵O1将所有生成和编辑任务融合于一个全能引擎,解决了AI视频生成中角色、场景等一致性难题 [2] - 产品为影视、自媒体、广告电商等应用场景提供深度适配的一站式解决方案 [2] OpenAI商业模式探索 - ChatGPT应用的最新安卓测试版中存在被标记为"特色广告"的代码,包含引用商业广告的字符串,例如"搜索广告"和"集市内容" [2] - 公司正考虑根据ChatGPT对用户交互的记忆投放个性化广告 [2] - 公司正从Google和Meta等竞争对手处挖走顶尖广告人才,并在LinkedIn发布与广告相关的招聘信息 [2] 字节跳动机器人技术突破 - 公司Seed团队发布研究成果GR-RL,着力于拓展VLA模型在长时程精细灵巧操作方面的能力边界 [2] - GR-RL提出从离线数据筛选到在线真机微调的强化学习框架,首次实现让机器人给整只鞋连续穿鞋带 [2] - 相较前作监督学习模型GR-3,GR-RL在穿鞋带任务上将成功率从45.7%提升至83.3%,失败情况减少近70% [2] Runway模型性能领先 - AI初创公司Runway推出最新影片生成模型Gen 4.5,能依照文字指令生成高画质影片 [3] - 新模型在第三方评测平台Video Arena排名第一,超越谷歌Veo 3(排名第二)和OpenAI的Sora 2 Pro(排名第七) [3] - Gen 4.5擅长理解物理效果、人类动作、镜头运动与因果关系,能更精准模拟真实世界情境,并于本周向所有用户全面开放 [3]
持股20亿,年薪435万!上市公司董事长投票反对自己连任:不满意薪酬;传联想ISG上海全员被裁;公众号灰度测试付费加热丨邦早报
创业邦· 2025-12-03 08:08
联想集团组织架构调整 - 联想ISG(基础设施方案业务集团)中国区进行大规模裁员,据传上海一个site涉及数百名员工,裁员沟通会仅持续15分钟[3] - 裁员范围不仅限于上海,中国区的软件、固件和操作系统团队也全部裁撤,波及北京、上海、天津和深圳多地[3] - 公司对裁员传闻暂无官方回应[3] 科技巨头动态与战略 - OpenAI CEO宣布公司进入“红色警戒”紧急状态,以集中资源改进ChatGPT,并推迟包括广告业务在内的其他项目[6] - 微软CEO表示将加码在欧盟的人工智能投资,投资将用于在德国及欧洲各国本土建设实体设施,而非设在美国[13] - 亚马逊云科技推出定制AI芯片Trainium3,其运算速度是上一代的四倍,据称可将训练和操作AI模型的成本降低多达50%[13] - 苹果公司拟拒绝印度政府关于预装网络安全App的命令,理由是存在安全和隐私风险[13] - Meta旗下Instagram要求美国员工从2月2日起每周五天返回实体办公室工作[11] - Netflix悄然中止移动端App的投屏功能,官方建议用户改用电视或流媒体设备自带的遥控器操作[11] 消费电子与硬件创新 - 三星正式发布首款三折叠手机Galaxy Z TriFold,采用双铰链设计,在韩国售价359万韩元,将于12月12日率先发售[16] - 网络名人罗永浩对三星三折叠手机提出质疑,认为其相当于四块手机屏,除了更厚之外意义不明[6] - 中国重卡市场11月销量约10万辆,环比下降约6%,但同比大幅增长约46%,实现“八连涨”[20] - 2025年1-11月中国重卡市场累计销量达到103万辆,同比增长约26%,全年销量有望突破110万辆[20] 人工智能与机器人领域进展 - AI初创公司Runway推出最新影片生成模型Gen 4.5,在第三方评测平台Video Arena排名第一,超越谷歌Veo 3和OpenAI Sora 2 Pro[20] - 众擎发布T800全尺寸通用人形机器人,身高1.73米,续航4-5小时,公司称其综合运营成本仅为人力成本的1/3,定价18万元起[18] - 蔡浩宇旗下AI公司上线聊天软件AnuNeko,功能包括聊天、查资料、解答问题,但数据库停留在2023年且无法实时联网[15] 资本市场与融资活动 - AI芯片企业清微智能完成超20亿元人民币C轮融资,由京能集团领投,公司已启动上市筹备工作[13] - 无论科技完成数千万元Pre-A轮融资,由滴滴战投等产业资本投资,资金将用于表情头产品完善和情感交互模型升级[13] - 戴盟机器人完成新一轮战略融资,投资方为中国移动链长基金,资金将用于技术突破、新品研发及全球市场开拓[13] - 中科千乘完成数千万元天使轮融资,投资方为中科创星,资金将用于新型相变液冷技术的产品化落地[13] - 美微达医疗完成数千万元A+轮融资,由翰驰基金领投,资金将用于肿瘤介入治疗产品的临床推进和市场推广[13] 消费、旅游与零售趋势 - 年终出境游出现“日本替代”热潮,同程旅行数据显示,11月最后两周韩国酒店预订热度同比增长超240%,部分欧洲目的地增幅超过300%[12] - 雀巢据报考虑出售旗下蓝瓶咖啡连锁店,估值可能低于2017年收购时的7亿美元,作为其精简业务组合、退出实体零售策略的一部分[11] - 香港郑裕彤家族被传计划出售瑰丽酒店集团资产以应对流动性危机,但接近集团人士表示未听说相关讨论,酒店运营正常[11] 社交媒体与内容平台功能更新 - 微信公众号正在灰度测试“付费加热”功能,创作者可付费提升阅读量或增加新关注,估算新增一个阅读的成本在0.1至0.4元之间[6] 公司治理与高管动态 - 艾比森董事长丁彦辉在选举议案中投反对票,公司最初公告称反对理由是对“董事长岗位薪酬不满意”,后回应称实为对公司的激励机制、治理结构及利益分配机制不满[10] - 马斯克在播客节目中官宣其伴侣为Neuralink项目负责人之一希文·齐里斯,并透露对方为AI专家[8] 行业数据与宏观统计 - 2025年10月中国汽车商品进出口总额为253.1亿美元,环比增长1.7%,其中出口金额216.3亿美元,环比增长2.9%,同比增长15.9%[20] - 2025年1-10月,全国汽车商品累计出口金额1941.9亿美元,同比增长10%[20] - 2024年我国人均预期寿命达到79岁,孕产妇死亡率下降至14.3/10万,婴儿死亡率下降至4.0‰[20] 金融市场动向 - 知名投资者迈克尔·伯里披露正在做空特斯拉股票,理由是估值“高得离谱”[11]
Runway rolls out new AI video model that beats Google, OpenAI in key benchmark
CNBC· 2025-12-01 22:05
新产品发布 - 人工智能初创公司Runway发布新一代视频生成模型Gen 4 5 [1] - 新模型允许用户根据描述动作和行为的文字提示生成高清视频 [1] - 该模型在理解物理原理、人体运动、摄像机移动及因果关系方面表现出色 [1] 行业竞争地位 - Gen 4 5在独立基准测试平台Video Arena排行榜上位列第一 [2] - 该排行榜由独立AI基准测试与分析公司Artificial Analysis维护 [2] - 排名通过匿名比较不同模型输出并由用户投票决定 [2] - Google的Veo 3模型排名第二 OpenAISora 2 Pro模型排名第七 [2] 公司运营亮点 - Runway以约100人的团队在竞争中超越了市值万亿美元的公司 [3] - 公司认为通过极度专注和勤勉即可达到技术前沿 [3]