Gen 4.5 - 财报，业绩电话会，研报，新闻

Gen 4.5

搜索文档

速递｜冲刺“世界模型”：Runway获E轮3.15亿美金弹药，英伟达、Adobe共同押注

Z Potentials· 2026-02-11 12:08

融资与估值 - AI视频生成初创公司Runway完成3.15亿美元E轮融资，公司估值飙升至53亿美元，较之前水平近乎翻倍 [2] - 本轮融资由General Atlantic领投，参投方包括英伟达、富达管理与研究公司、AllianceBernstein、Adobe Ventures、未来资产、Emphatic Capital、Felicis、Premji以及AMD Ventures [4] 战略与资金用途 - 新资金将使Runway能够预训练下一代世界模型，并将其引入新产品和行业 [2] - 公司计划运用新资金将其约140人的团队在研发、工程和市场拓展等岗位进行快速扩容 [4] - 公司近期与CoreWeave签署协议以扩大算力规模，此举可能增强了投资者对其在算力密集型领域运营能力的信心 [3] 技术发展与产品 - Runway以具备物理感知能力的AI视频生成模型闻名，于去年12月发布了其首款世界模型 [2] - 世界模型是一种能够构建环境内部表征的人工智能系统，从而能够对未来事件进行规划，许多顶尖学者认为这类模型对突破大语言模型的局限至关重要 [2] - 公司最新视频生成模型Gen 4.5支持用户通过文本提示生成高清视频，并引入了原生音频生成、长视频生成、多镜头生成、角色一致性保持以及高级编辑工具等功能 [3] - Gen 4.5模型在多项基准测试中表现优于谷歌和OpenAI的视频生成产品，为Runway在人工智能行业赢得了重要信誉 [3] 市场定位与行业竞争 - Runway历史上在传媒、娱乐和广告行业建立了坚实的客户基础，包括近期与Adobe建立合作关系 [2] - 公司在游戏和机器人领域的应用正日益增长 [2] - Runway的战略转型正值世界模型研发竞赛白热化之际，竞争对手包括李飞飞创立的World Labs与Google DeepMind，两家机构近期均已向公众开放其模型 [2] - 公司将世界模型技术视为攻克医药、气候、能源及机器人等领域重大挑战的核心 [2]

世界模型

Artificial Intelligence

世界模型

Gen 4.5

世界模型

Artificial Intelligence

世界模型

Gen 4.5

AI视频的“1毛钱战争”与“万亿生意”

创业邦· 2026-01-30 14:07

AI视频行业概览与竞争格局 - AI视频技术正以“周”为单位快速迭代，海外如PixVerse、Runway与国内公司如字节即梦AI、快手可灵AI均在激烈竞争，模型份额月初与月底可能发生显著变化[5][7][9] - 行业竞争激烈源于退一步面临“流量危机”，进一步则是“万亿蓝海”，AI视频有望带来更沉浸体验并已开始抢夺用户注意力，未来可能蔓延至漫剧、游戏及电影等领域[9] - AI视频不仅是技术进步，更是个性体验、内容生产和商业效率的“三重革命”，对字节、快手等视频平台而言是一场不得不参与的竞争[11] 字节（即梦AI）与快手（可灵AI）的技术与产品路径对比 - 技术路线差异显著：字节即梦基于多模态基础大模型Seedance，优化模型以实现参数知识共享并降低维护成本；快手可灵则聚焦打磨视频模型基座，通过产品交互创新提升生成可控性[16][17][20] - 产品策略与目标不同：即梦旨在“突破产品技术上限”并定义下一代超级入口，其探索方向是结合AI技术解锁全新场景与产品形态；可灵则走“产品创新驱动”的务实路线，聚焦服务专业创作者（P端）和企业客户（B端），对大众市场（C端）保持探索[22] - 资源投入悬殊：2025年字节在算力、芯片等方面的资本投入达1500亿元，断层领先行业；内部采用“饱和式”投入与“内部赛马”机制，即梦2025年获得的算力资源同比增加300%[23][25] - 生成效果与成本存在权衡：可灵2.6 Pro生成视频画面细节更丰富但排队时间超30分钟，每分钟生成成本为4.2美元；即梦生成速度更快（1分钟内）且成本更低，其Seedance 1.5 pro模型API定价为每分钟1.56美元[13][15][29] - 用户增长呈现不同态势：可灵凭借务实策略在发布一年内用户总量从600万飞升至4500万；即梦则凭借低价格和高效率，截至去年9月月活用户达到2037万，是可灵的13倍[27][28] AI视频行业的商业化现状与挑战 - 当前AI视频生成可能并非一门好生意，存在用户留存率低与创作门槛高的问题，例如Sora的30天用户留存率仅1%，且高达90%的生成视频为不可用的“废片”[33][35] - 商业化表现分化：专注大众市场的产品如即梦AI和Minimax的海螺AI年化营收均未破亿；而聚焦专业创作者的可灵累计收入已达7亿元，预计全年收入10亿，其中近70%营收由P端订阅会员贡献，B端客户规模超2万家[37][39] - 成本效益显著：AI视频能将传统视频制作时间从平均7小时缩短至45分钟，制作成本节省一半，这使其成为对专业创作者有吸引力的生产力工具[39] 字节与快手的长期战略与市场展望 - 字节即梦采取放眼长期增长的战略，认为视频是更理想的AI产品形态，内部判断“长期看，即梦的价值空间可能是剪映的十倍”，参照剪映2024年近百亿收入，即梦瞄准千亿级市场[41] - 为培育大众市场，即梦在产品设计、流量扶持和价格上积极布局：通过短视频交互推荐内容、利用抖音生态导流（2025Q1该路径贡献37%新用户）、并设定极具竞争力的低价，单条视频生成最低仅0.1-0.19元[42][44] - 快手可灵则专注即时收益，采取“先落袋为安”的务实策略，但其也面临挑战，创作者可能组合使用多家厂商的专精模型，导致用户被分流[46][47] - 行业未来形态未定，但科技正加速发展，无论是快手的“务实当下”还是字节的“豪赌未来”，都在等待市场验证[48][50]

腾讯研究院· 2026-01-23 00:01

视频生成模型技术升级 - Runway发布全新Gen 4.5图生视频模型，镜头控制和故事叙事能力显著提升，能在5秒内快速生成包含近景、中景、远景的三个镜头 [1] - 在1000人参与的测试中，仅有57%的人能分辨AI生成视频与真实视频，模型在人物面部一致性、光影逻辑和物理规律表现上接近电影级水准 [1] - 视频生成模型正进入新一轮升级期，真实度、声画同步、局部控制精细化和更长生成时长成为行业共同趋势 [1] 大模型在教育领域的应用拓展 - 谷歌联手The Princeton Review将全套SAT模拟题整合进Gemini，用户可免费进行全真模考，分数立等可取并获得详细错题解析 [2] - 测试涵盖阅读写作和数学两大模块，支持自定义倒计时和提示功能，Gemini会把解题思路拆解成详细步骤辅助理解 [2] - SAT只是第一步，谷歌计划将Gemini逐步扩展到更多标准化考试，同时通过垂直领域渗透策略让AI成为各行业的专家助手 [2] 大模型服务与算力挑战 - 智谱GLM-4.7上线后用户高速增长导致算力紧张，部分用户在高峰期遇到并发限流和模型速度变慢问题 [3] - 1月23日起限量发售GLM Coding Plan，每日可销售量降至当前20%，优先保障老用户的编程体验 [3] - 智谱正在研发更强大高效的模型并加速算力扩容，已有自动续订不受影响，限售结束时间另行通知 [3] 垂直领域大模型突破 - 百川发布医疗大模型M3 Plus，幻觉率降至2.6%达全球最低，首创“证据锚定”技术可将每句医学结论精确锚定到原始论文对应段落 [4] - M3 Plus在Healthbench等权威评测中登顶榜首全面超越GPT-5.2，API调用价格较上一代降低70% [4] - 百川推出“海纳百川”计划，向中国医疗服务机构免费开放M3 Plus API，推动AI医疗生态发展 [4] 消费级AI硬件与助手演进 - 苹果正秘密研发类似AirTag外形的AI设备，配备双摄像头和三麦克风，功能类似Ai Pin，首批规划量产2000万台，最快2027年发布 [5] - 苹果计划推出代号“Campos”的全新Siri，深度整合iOS 27，支持网页搜索、写邮件、生成图片和屏幕感知等ChatGPT级能力 [5] - 新版Siri基础模型将基于Google Gemini 3构建，苹果每年需向谷歌支付约10亿美元，并可能切换到TPU服务器托管 [5] AI驱动的程序化视频制作工具 - Remotion是一个开源库，支持用React代码程序化制作视频，现已有专门的skills可通过npx命令安装到Cursor、Claude Code等开发工具 [6] - 用户只需提供文案和节奏需求，AI就能自动生成带动画的视频效果，支持产品演示、宣传视频等场景，并可通过Web端编辑器做细节修改 [6] - 这一工具适合独立开发者制作产品宣传视频，实现了“视频编辑可以接近编程”的思维转变，支持与AI反复迭代调整效果 [6] 人工智能学术研究前沿 - AAAI 2026公布5篇杰出论文，其中三篇由华人团队主导，作者来自港科大（广州）、西湖大学、浙大、同济、浙师大、港城大等高校 [7] - 获奖论文涵盖机器人视觉语言动作模型ReconVLA、多模态表示学习LLM2CLIP、动力系统因果发现CADYT等前沿方向 [7] - AAAI 2026总投稿23,680篇，录用4,167篇，接收率17.6%，会议于1月20-27日在新加坡举行 [7] 消费级AI市场趋势与竞争格局 - 通用LLM助手市场呈“赢家通吃”趋势，ChatGPT周活跃用户达8-9亿，仅9%用户会为多款AI产品付费，Gemini桌面端用户同比增长155% [8] - 2025年图像视频生成模型在真实感和推理能力上取得长足进步， Veo 3的音视频融合和Nano Banana Pro的搜索整合成为关键突破 [8] - 头部实验室在模型研发上表现出色，但新消费级产品多未取得理想效果，2026年初创企业在细分应用场景仍有很大发展空间 [8] AI模型价值观与安全框架 - Anthropic发布84页《Claude宪法》并以CC0协议开源，这是一份直接面向AI模型的价值观宣言，定义Claude是谁及如何自处 [9] - 宪法确立四级价值优先级：广义安全＞广义伦理＞遵循指南＞真正有帮助，强调“可修正性”是当前阶段最重要的安全特性 [9] - 文件明确划定硬性红线包括不协助制造大规模杀伤性武器、不生成CSAM等，同时鼓励Claude建立稳定积极的自我认同 [9]

生成式AI

多模态与应用生成

Artificial Intelligence

Artificial Intelligence

Baichuan - M3 Plus

Gemini

GLM Coding Plan

57.1%的人分不清真假！Runway新视频模型太爆炸

量子位· 2026-01-22 13:39

Runway Gen 4.5模型的核心能力 - 全新Gen 4.5模型主打图生视频，在镜头控制和故事叙事能力上显著提升[8][9] - 模型能在5秒内快速生成包含近景、中景、远景三个镜头的视频[11] - 在1000人参与的调查中，只有约一半（57%）的人能分辨出该模型生成的视频与真实视频的区别[11][21] 模型在镜头控制与一致性方面的表现 - 即便镜头晃动，人物面部仍保持较高一致性[12] - 在快速运动场景下，如骑飞行章鱼，人物面部细节稳定不崩坏[13] - 复杂场景中，如巨型毛绒猩猩在纽约街头，镜头比例、透视逻辑及主体与背景的光影一致性处理得当[15] - 模型具备精准的镜头控制能力，包括景别、角度、运动轨迹及切换节奏，输出效果接近真实摄影语言[16] - 通过图像参考和内部优化，模型实现了更稳定的角色一致性，主体在不同镜头中的跨帧效果更佳[16] 模型在长故事叙事与连贯性方面的进步 - 模型长故事表达能力增强，能承载更长时序的内容结构，视频完整度和长度大幅提升[16] - 多个镜头之间的情节逻辑性更强，叙事表达比上一版本更到位[16] - 在长达两分多钟的剧情视频中，即便在同一场景多次切换镜头位置和动作，画面空间关系和镜头衔接依然保持连贯，无明显跳轴或场景漂移问题[18] - 用户制作的视频展示了出色的镜头漂移感，能流畅切换特写与远景镜头[18] 视频生成行业的整体发展趋势 - 从去年年底至今，视频模型能力进入新一轮升级期，各厂商发布节奏密集[23][35] - 行业整体趋势对视频模型的真实度和一致性要求被整体抬高，包括纹理与细节保真、光影与氛围、整体画面质感等[25][26] - 模型越来越注重理解并遵守现实世界的物理规律，在跨帧表现上要求更自然[27] - 声画同步能力显著提升，模型可直接生成配套音频，唇形同步精度提高，即使在侧脸、极端角度或多人对话场景也不易崩坏[28][30] - 局部控制精细化成为重要趋势，支持单独编辑局部区域而无需重新生成整段视频[28] - 支持更长的生成时长，10至60秒的视频生成区间变得常见，竖屏原生视频逐步占据主流[28] - 视频生成方式更加多元，从图生视频到音频生视频，创作路径更加灵活[28] - 主流视频模型的能力已明显接近可商业化应用、具备普适性的水平[34]

AI视频模型

Artificial Intelligence

Gen 4.5

Grok Imagine

AI视频模型

Artificial Intelligence

Gen 4.5

Grok Imagine

AI初创公司Runway推出影片生成模型Gen 4.5；字节Seed发布GR-RL，首次实现真机强化学习穿鞋带丨AIGC日报

创业邦· 2025-12-03 08:08

可灵AI产品发布 - 公司正式发布全新产品可灵O1，该产品基于全新的视频和图像模型，整合文字、视频、图片、主体等多模态输入 [2] - 可灵O1将所有生成和编辑任务融合于一个全能引擎，解决了AI视频生成中角色、场景等一致性难题 [2] - 产品为影视、自媒体、广告电商等应用场景提供深度适配的一站式解决方案 [2] OpenAI商业模式探索 - ChatGPT应用的最新安卓测试版中存在被标记为"特色广告"的代码，包含引用商业广告的字符串，例如"搜索广告"和"集市内容" [2] - 公司正考虑根据ChatGPT对用户交互的记忆投放个性化广告 [2] - 公司正从Google和Meta等竞争对手处挖走顶尖广告人才，并在LinkedIn发布与广告相关的招聘信息 [2] 字节跳动机器人技术突破 - 公司Seed团队发布研究成果GR-RL，着力于拓展VLA模型在长时程精细灵巧操作方面的能力边界 [2] - GR-RL提出从离线数据筛选到在线真机微调的强化学习框架，首次实现让机器人给整只鞋连续穿鞋带 [2] - 相较前作监督学习模型GR-3，GR-RL在穿鞋带任务上将成功率从45.7%提升至83.3%，失败情况减少近70% [2] Runway模型性能领先 - AI初创公司Runway推出最新影片生成模型Gen 4.5，能依照文字指令生成高画质影片 [3] - 新模型在第三方评测平台Video Arena排名第一，超越谷歌Veo 3（排名第二）和OpenAI的Sora 2 Pro（排名第七） [3] - Gen 4.5擅长理解物理效果、人类动作、镜头运动与因果关系，能更精准模拟真实世界情境，并于本周向所有用户全面开放 [3]

AIGC

人工智能

强化学习

Artificial Intelligence

Artificial Intelligence

Gen 4.5

可灵O1

持股20亿，年薪435万！上市公司董事长投票反对自己连任：不满意薪酬；传联想ISG上海全员被裁；公众号灰度测试付费加热丨邦早报

创业邦· 2025-12-03 08:08

联想集团组织架构调整 - 联想ISG（基础设施方案业务集团）中国区进行大规模裁员，据传上海一个site涉及数百名员工，裁员沟通会仅持续15分钟[3] - 裁员范围不仅限于上海，中国区的软件、固件和操作系统团队也全部裁撤，波及北京、上海、天津和深圳多地[3] - 公司对裁员传闻暂无官方回应[3] 科技巨头动态与战略 - OpenAI CEO宣布公司进入“红色警戒”紧急状态，以集中资源改进ChatGPT，并推迟包括广告业务在内的其他项目[6] - 微软CEO表示将加码在欧盟的人工智能投资，投资将用于在德国及欧洲各国本土建设实体设施，而非设在美国[13] - 亚马逊云科技推出定制AI芯片Trainium3，其运算速度是上一代的四倍，据称可将训练和操作AI模型的成本降低多达50%[13] - 苹果公司拟拒绝印度政府关于预装网络安全App的命令，理由是存在安全和隐私风险[13] - Meta旗下Instagram要求美国员工从2月2日起每周五天返回实体办公室工作[11] - Netflix悄然中止移动端App的投屏功能，官方建议用户改用电视或流媒体设备自带的遥控器操作[11] 消费电子与硬件创新 - 三星正式发布首款三折叠手机Galaxy Z TriFold，采用双铰链设计，在韩国售价359万韩元，将于12月12日率先发售[16] - 网络名人罗永浩对三星三折叠手机提出质疑，认为其相当于四块手机屏，除了更厚之外意义不明[6] - 中国重卡市场11月销量约10万辆，环比下降约6%，但同比大幅增长约46%，实现“八连涨”[20] - 2025年1-11月中国重卡市场累计销量达到103万辆，同比增长约26%，全年销量有望突破110万辆[20] 人工智能与机器人领域进展 - AI初创公司Runway推出最新影片生成模型Gen 4.5，在第三方评测平台Video Arena排名第一，超越谷歌Veo 3和OpenAI Sora 2 Pro[20] - 众擎发布T800全尺寸通用人形机器人，身高1.73米，续航4-5小时，公司称其综合运营成本仅为人力成本的1/3，定价18万元起[18] - 蔡浩宇旗下AI公司上线聊天软件AnuNeko，功能包括聊天、查资料、解答问题，但数据库停留在2023年且无法实时联网[15] 资本市场与融资活动 - AI芯片企业清微智能完成超20亿元人民币C轮融资，由京能集团领投，公司已启动上市筹备工作[13] - 无论科技完成数千万元Pre-A轮融资，由滴滴战投等产业资本投资，资金将用于表情头产品完善和情感交互模型升级[13] - 戴盟机器人完成新一轮战略融资，投资方为中国移动链长基金，资金将用于技术突破、新品研发及全球市场开拓[13] - 中科千乘完成数千万元天使轮融资，投资方为中科创星，资金将用于新型相变液冷技术的产品化落地[13] - 美微达医疗完成数千万元A+轮融资，由翰驰基金领投，资金将用于肿瘤介入治疗产品的临床推进和市场推广[13] 消费、旅游与零售趋势 - 年终出境游出现“日本替代”热潮，同程旅行数据显示，11月最后两周韩国酒店预订热度同比增长超240%，部分欧洲目的地增幅超过300%[12] - 雀巢据报考虑出售旗下蓝瓶咖啡连锁店，估值可能低于2017年收购时的7亿美元，作为其精简业务组合、退出实体零售策略的一部分[11] - 香港郑裕彤家族被传计划出售瑰丽酒店集团资产以应对流动性危机，但接近集团人士表示未听说相关讨论，酒店运营正常[11] 社交媒体与内容平台功能更新 - 微信公众号正在灰度测试“付费加热”功能，创作者可付费提升阅读量或增加新关注，估算新增一个阅读的成本在0.1至0.4元之间[6] 公司治理与高管动态 - 艾比森董事长丁彦辉在选举议案中投反对票，公司最初公告称反对理由是对“董事长岗位薪酬不满意”，后回应称实为对公司的激励机制、治理结构及利益分配机制不满[10] - 马斯克在播客节目中官宣其伴侣为Neuralink项目负责人之一希文·齐里斯，并透露对方为AI专家[8] 行业数据与宏观统计 - 2025年10月中国汽车商品进出口总额为253.1亿美元，环比增长1.7%，其中出口金额216.3亿美元，环比增长2.9%，同比增长15.9%[20] - 2025年1-10月，全国汽车商品累计出口金额1941.9亿美元，同比增长10%[20] - 2024年我国人均预期寿命达到79岁，孕产妇死亡率下降至14.3/10万，婴儿死亡率下降至4.0‰[20] 金融市场动向 - 知名投资者迈克尔·伯里披露正在做空特斯拉股票，理由是估值“高得离谱”[11]

Runway rolls out new AI video model that beats Google, OpenAI in key benchmark

CNBC· 2025-12-01 22:05

新产品发布 - 人工智能初创公司Runway发布新一代视频生成模型Gen 4 5 [1] - 新模型允许用户根据描述动作和行为的文字提示生成高清视频 [1] - 该模型在理解物理原理、人体运动、摄像机移动及因果关系方面表现出色 [1] 行业竞争地位 - Gen 4 5在独立基准测试平台Video Arena排行榜上位列第一 [2] - 该排行榜由独立AI基准测试与分析公司Artificial Analysis维护 [2] - 排名通过匿名比较不同模型输出并由用户投票决定 [2] - Google的Veo 3模型排名第二 OpenAISora 2 Pro模型排名第七 [2] 公司运营亮点 - Runway以约100人的团队在竞争中超越了市值万亿美元的公司 [3] - 公司认为通过极度专注和勤勉即可达到技术前沿 [3]

谷歌(US:GOOG)

Artificial Intelligence

Gen 4.5

Veo 3

Sora 2 Pro

Artificial Intelligence

Gen 4.5

Veo 3

Sora 2 Pro