Workflow
视频生成不再「断片」:OneStory给模型装上「选择性记忆」,跨镜头讲故事人物场景始终如一丨CVPR'26
量子位· 2026-04-10 13:17
文章核心观点 - 多镜头视频生成面临维持跨镜头内容一致性与遵循叙事变化的双重挑战,现有方法在长程上下文维护上存在局限[3] - Meta与University of Copenhagen的研究者提出OneStory模型,通过自适应记忆建模机制,有效保留全局跨镜头上下文,实现连贯的多镜头视频叙事[4] - OneStory采用next-shot generation的自回归生成方式,并设计Frame Selection与Adaptive Conditioner两个关键模块,在计算成本可控的前提下,生成长达分钟级、包含十个镜头的连贯视频故事[9][10][16] 多镜头视频生成的挑战与定义 - 多镜头视频生成要求模型同时处理需在不同镜头间保持稳定的信息(如人物身份、环境主体)和需随叙事自然变化的信息(如视角切换、场景转场)[3] - 任务定义为:给定每个镜头的提示词及可选的初始图像,模型需生成多个镜头,并维持跨镜头内容一致性及对每个镜头提示词的准确遵循[3] - 现有方法主要局限在于:依赖固定滑动窗口导致较早信息被丢弃,或仅依赖单张关键帧难以传递复杂的叙事细节[3] OneStory模型的核心创新 - 将问题重构为next-shot generation,实现基于已生成镜头自回归地生成下一个镜头的shot-by-shot生成方式[10] - 以预训练的image-to-video基础模型初始化,自然继承其强大的视觉条件生成能力,首个镜头可由任何text-to-video或image-to-video模型生成,后续镜头由OneStory逐步生成[14] - 在同一个模型中统一支持text-to-multi-shot video和image-to-multi-shot video两种生成方式[15] 关键技术模块:自适应记忆建模 - **Frame Selection模块**:从所有历史镜头中自动挑选与当前镜头提示词语义最相关的帧作为记忆,解决了固定窗口的遗忘问题,构建了全局跨镜头上下文[19][20] - **Adaptive Conditioner模块**:根据Frame Selection预测的重要性,对选中的历史帧进行自适应patchification,重要信息保留细粒度表示,次要信息被更强压缩,从而将历史上下文转化为紧凑有效的条件信号注入生成过程[21][24] 模型能力与数据构建 - 可生成长达分钟级、包含十个镜头的长视频故事,在复杂叙事推进中保持人物与场景的一致性[9] - 在out-of-domain场景中展现出良好的泛化能力[9] - 数据构建仅保留分镜头提示词,并将每个镜头写成带有前文指代关系的描述,更贴近真实故事讲述逻辑,使镜头间形成更自然的叙事流[25] 实验结果与意义 - 实验表明,模型能在复杂提示不断变化的情况下持续推进叙事,同时保持人物和环境的一致性[28] - 模型表现包括外观变化下的人物一致性保持、从大全景到局部特写时的空间定位能力、以及人与物体交互发展过程中的叙事延续能力[29] - 模型学到的更接近于一种跨镜头叙事理解能力,而非表层的视觉连续性[28] - 该工作为视频模型提供了一种有效的自适应memory管理机制,为更长时程、更高一致性的视频生成及可控世界模型开辟了新方向[29]
这帮清华的,造了一个让龙虾“安全着陆”的新物种
量子位· 2026-04-10 13:17
允中 发自 凹非寺 量子位 | 公众号 QbitAI 前脚刚喂给龙虾的公司财务数据,下一秒就成了云端大模型的"共享语料"? 这绝不是危言耸听。 在OpenClaw热潮中, 隐私保护的缺位 正成为所有企业和开发者绕不开的一道暗礁。 大家既想要顶级模型的 "最强大脑" ,又想要本地私有化的 "绝对安全" 。 但这道题过去几乎无解:本地算力盒子"带不动"复杂任务,而传统的脱敏方案又是个"偏科生"——只管得了文本,遇到语音、视频就彻底抓 瞎。 这种 全模态安全能力 的断档,正是OpenClaw落地最后一公里的最大"绊脚石"。 就在今天,国产大模型基础设施玩家 无问芯穹 正式出手,甩出了他们的破局之作: InfiniClaw Box , 一个更安全、更专业、可托付的智能伙伴。 它彻底打破了"脱敏即降智"的僵局: 更重要的是,它背后还有 企业级Token工厂 的成本优化,以及内置的 80+垂类场景Skills 。 就是这样一支由 清华电子工程系 推动集结的队伍,让端侧智能真正成为了可托付的生产力工具。 端云一体安全脱敏:三段式隐私守护,云端智能本地享 InfiniClaw Box直击了本地龙虾在模型成本、性能与隐私之间难 ...
马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T
量子位· 2026-04-10 13:17
文章核心观点 - 马斯克在讨论其公司xAI的超算训练计划时,疑似“手滑”泄露了Anthropic公司Claude系列模型的关键参数信息,即Sonnet模型参数量为1万亿(1T),Opus模型参数量为5万亿(5T)[1][6][10] - 尽管Anthropic官方对模型参数严格保密,但行业及社区通过多种方法(如成本反推、性能对标、技术逆向工程等)对Claude各版本参数进行了持续估算与推测,最新推测结果与马斯克泄露的信息高度吻合[12][14][56] - 大语言模型的发展趋势正从盲目追求参数规模转向提升现有参数的利用效率,表现为通过模型蒸馏、架构优化(如MoE)等方式,在保持或提升性能的同时显著降低推理成本和提升速度[44][45][59] xAI的超算与模型训练计划 - xAI正在其Colossus 2超算上训练7个模型,其中参数量最大的一款达到10万亿(10T)[2][3] - Colossus 2超算第一阶段已部署11万个英伟达GB200 NVL72 GPU,冷却能力约200MW,最终目标是部署超过55万个GPU,峰值功率需求预计超过1.1GW[3][4] - 训练一个10万亿参数的模型,预训练阶段大约需要2个月时间[6] - xAI当前已发布的Grok 4.2模型总参数量为5000亿(0.5T),仅为在训最大模型(10T)的5%[6][7] Claude系列模型参数规模社区推测汇总 - 社区对Claude各版本参数的推测主要基于四类方法:推理成本与吞吐量反推法、性能基准对标法、内部文件泄露与传闻分析法、架构特性分析法[17] - 根据汇总的社区推测表格,关键版本参数估计如下: - Claude 3 Haiku: 总参数约200亿(20B)[15][20] - Claude 3 Sonnet: 总参数估计存在分歧,约700亿(70B)或1500-2500亿(150-250B)[15][20][21] - Claude 3 Opus: 总参数约2万亿(2T)[15][20] - Claude 3.5 Sonnet: 总参数约1750亿(175B)或4000亿(400B)[15][29] - Claude 4 Sonnet: 总参数估计范围宽,约50-1000亿(50B-1T)[15] - Claude 4/4.1 Opus: 总参数估计约6万亿(6T)(MoE架构)或3000-5000亿(300-500B)[15][46][60] - Claude 4.5 Sonnet: 总参数约1.7-2万亿(1.7-2T)[15] - Claude 4.5 Opus: 总参数约2万亿(2T)[15][46][59] - Claude 4.6 Sonnet: 总参数约1-2万亿(1-2T)[14][15] - Claude 4.6 Opus: 总参数约1.5-2.5万亿(1.5-2.5T)或2-5万亿(2-5T)[14][15] - 未发布的Claude Mythos: 传闻总参数达10万亿(10T)[15][64] Claude各代模型性能与迭代分析 - **Claude 3系列**:形成Haiku、Sonnet、Opus清晰产品矩阵,性能与成本依次递增,在MMLU、GPQA、GSM8K等多个基准测试中表现强劲[16][18] - **Claude 3.5 Sonnet**:速度是Claude 3 Opus的两倍,成本仅为后者的五分之一,在多项推理、代码和数学基准上表现优异[24][25] - **Claude 4系列**:跳过了3.5 Opus,直接发布Opus 4和Sonnet 4,在Agent编程(SWE-bench)、终端编码、工具使用等任务上能力显著[32][35] - **Claude Opus 4.1**:编程性能超越Opus 4,是一次小规模更新,旨在替代Opus 4[38][39][40] - **Claude 4.5系列**:通过蒸馏技术优化,Opus 4.5运行速度比Opus 4快约3倍,API调用成本仅为三分之一,Sonnet 4.5在计算机操作(OSWorld)测试中得分比Sonnet 4提升近一半[44][49][50] - **Claude 4.6系列**:最新版本,Sonnet 4.6在复杂计算机操作任务上接近人类水平,Opus 4.6在金融法律知识任务(GDPval-AA)上比GPT-5.2高出144 Elo,并在编程基准测试中领先[52][53][55] 模型架构与效率优化趋势 - 行业估算显示,GPT-4参数约1.76万亿(1.76T),而后续的GPT-4o参数约2000亿(200B),表明参数规模并非持续扩大[30] - Claude Opus 4/4.1可能采用混合专家(MoE)架构,参数量较大(约5T-6T),而后续的4.5/4.6版本通过蒸馏等技术大幅缩小了规模(约1.5T-2T),提升了效率[43][46][59][60] - 技术逆向工程分析通过Token吞吐数据推算,Claude Opus 4.6在FP8精度下的激活参数量约为930-1050亿(93–105B),若采用混合精度配置,激活参数量约为1270-1540亿(127–154B)[58][59] - API定价变化印证效率提升:Claude Opus 4.1定价为每百万Token 15美元(输入)/75美元(输出),而Claude Opus 4.5/4.6定价降至5美元/25美元,降幅达三分之二[59]
美军公布最新伤亡人数
第一财经· 2026-04-10 13:16
美国国防部还将六名空军人员的死亡归类为"非敌对行动",其中包括一架KC-135加油机的机组人 员,他们在支援空中作战时丧生。 3月中旬,美国哥伦比亚广播公司(CBS)报道称,大约25名美军士兵在德国接受治疗,12名士兵被疏散 到美国马里兰州贝塞斯达的沃尔特·里德国家军事医疗中心,还有1名士兵被送往布鲁克陆军医疗中 心,该中心是美国国防部唯一的I级创伤中心,也是国防部顶级烧伤科的所在地。 据美国《军事时报》报道,根据美国中央司令部8日公布的数据,自对伊朗发动袭击以来的40天里,已 有13名美军士兵丧生,381人受伤。 报道称,美国国防部列出了7名在行动中被敌方火力击毙的美国军人,据推测,他们就是3月1日在沙特 阿拉伯遭伊朗空袭身亡的美军士兵。 编辑 | 钉钉 来源|中国新闻网 ...
微创机器人-B涨超4% 26年图迈手术机器人装机至少200台 海外市场仍是核心增长引擎
智通财经· 2026-04-10 13:16
微创机器人-B 分时图 日K线 周K线 月K线 28.30 0.96 3.51% 4.46% 2.96% 1.50% 0.00% 1.50% 2.96% 4.46% 26.12 26.53 26.93 27.34 27.75 28.15 28.56 09:30 10:30 12:00/13:00 14:00 16:10 0 6万 13万 19万 微创机器人-B(02252)涨超4%,截至发稿,涨3.44%,报28.28港元,成交额4244.15万港元。 该行表示,截至4月初,公司已安装23台图迈手术机器人,并持有86台在手订单。管理层指引上半年安 装约103台至113台,全年至少200台,并表明去年下半年的交付瓶颈已解决。海外市场将继续是核心增 长引擎,需求遍及欧洲、亚洲(中国除外)及拉丁美洲。 消息面上,小摩发布研报指出,微创机器人-B2026财年指引标志着从"商业化验证"明确转向"盈利释 放",管理层设定清晰的收入、盈利及现金流目标。公司预期今年收入约11亿元人民币,按年近乎翻 倍,同时实现净利润收支平衡至盈利,以及正自由现金流,显示进入营运杠杆阶段。 ...
The bull market ‘DESERVES the benefit of the doubt,' says Truist Wealth CIO
Youtube· 2026-04-10 13:15
核心观点 - 尽管市场存在担忧,但牛市仍应获得“疑点利益”,因为企业盈利和利润率处于历史高位,且经济基本面具有韧性 [1][2][3][4][5] 市场整体状况与判断依据 - 过去5年,企业经历了新冠疫情、快速加息和通胀的考验,目前盈利和利润率均处于历史最高水平 [3] - 分析采用“证据权重”方法,综合考虑经济状况、历史规律、基本面和技术面 [5] - 除非对盈利规模产生重大影响,否则应看淡短期担忧,关注盈利本身 [6] - 预计GDP增速至少为2.2% [6] - 当前市场情绪与90年代科技泡沫时期不同,当时无人称之为泡沫且投机氛围狂热,而目前市场讨论更理性 [12][13][14] 积极驱动因素 - 数据中心支出“超乎想象”,科技资本支出受税收激励推动 [7] - 工资增长开始加速 [7] - 较低的石油依赖度已帮助经济抵御冲击 [7] - 国防支出可能上升而非下降,这是一个长期趋势 [8][9] - 国防预算申请额为1.5万亿美元 [9] 行业配置与机会 - 当前超配的行业包括:材料、工业、能源和科技 [8] - 工业板块由交通运输和国防构成 [8] - 如果经济保持韧性,交通运输类股票应有更多上行空间 [10] - 材料板块受益于人工智能相关建设,以及过去十年投资不足导致的供应链约束引发的重建需求 [10] - 科技板块估值已从32倍前瞻市盈率降至近期低点的20倍,收缩了35% [12] - 科技股内部存在分化:半导体股创出新高,需求持续;软件股则处于相对低位 [11] - 科技股估值已变得更合理,预期已重置 [12]
野人先生崔渐为:“网红”标签对我们不公平丨厚雪专访
36氪未来消费· 2026-04-10 13:14
押中Gelato连锁化背后,一家创业公司的15年。 作者 | 钟艺璇 编辑 | 乔芊 如果你在一个意大利人面前,把Gelato等同于ice cream,他一定会难过。 16世纪,Gelato诞生于文艺复兴时期的佛罗伦萨,传说中一名炼金术师创造了它。在意大利语中,Gelato本就译为冰淇淋。但它和美式冰淇淋ice cream 口感大有不同,Gelato使用口感更密实,也更新鲜、低脂和健康。 目前中国冰淇淋市场中,夫妻老婆店冷柜里卖的预制冰淇淋占据75%以上的市场份额,这个品类中的高端玩家是哈根达斯。现制冰淇淋只占约25%,以 DQ、波比冰淇淋(原波比艾斯)乃至蜜雪冰城为代表的软冰(Soft Serve)以规模化优势,又占其半壁江山,Gelato由于手工现制、定位高端以及门店成 本高,市场份额只有6%左右。 在欧洲,数百年来,Gelato都以家族传承、百年老店的形式分散存在——意大利4万家Gelato几乎都是小店,甚至只要10家连锁以上,就能称作大品牌。 但在中国,有一家公司却想把堪称"小众"的Gelato连锁化,它就是野人先生。 2025年,野人先生突然涌现在大众面前,从300多家到突破千店,这也是它爆发式增长 ...
People Moves: Chubb Names Rampe Global Head of Claims; The Hartford Promotes Burns to Lead Enterprise Sales and Distribution
Insurance Journal· 2026-04-10 13:13
公司人事任命 - Chubb Limited 任命 Kevin Rampe 为高级副总裁、Chubb Group 全球理赔官,负责全球理赔管理,同时他将继续兼任北美理赔负责人,其职责扩大至领导公司的全球理赔组织,并负责通过其全球理赔办公室网络进行所有高管层面的理赔管理、服务和行政工作 [2] - Kevin Rampe 将向 Chubb Limited 及 Chubb Group 的董事长兼首席执行官 Evan G. Greenberg,以及 Chubb Group 的总裁兼首席运营官 John Keogh 汇报工作,在北美职责范围内,他向 Chubb Group 执行副总裁、北美保险总裁 Juan Luis Ortega 汇报 [3] - Kevin Rampe 于2005年加入公司,担任全球合规官,之后曾任北美总法律顾问和全球副总法律顾问,并于2021年被任命为北美理赔负责人,其职业生涯早期曾担任下曼哈顿开发公司总裁兼主席,以及纽约州保险部第一副总监和纽约州州长 George E. Pataki 的第一助理法律顾问 [3][4] - The Hartford 任命 Natalie Burns 为企业和销售与分销负责人,向中大型业务负责人 Tracey Ant 汇报,该任命自5月1日起生效 [6] - Natalie Burns 将负责加强与公司顶级分销合作伙伴的关系,并与公司的个人和商业保险以及员工福利销售团队合作,以推动各业务板块的增长,她接替了 Stephen Screen,后者近期被任命为 The Hartford 全球专业业务部门的另类安排解决方案负责人 [7] - Natalie Burns 于2002年以执行核保人身份加入 The Hartford,之后在公司内历任核保和分销领域职责不断扩大的职位,最近担任另类分销负责人,领导公司的中大型业务中心和中端市场核保中心 [8]
敏实集团(0425.HK):利润创新高 新赛道指引大幅上调
格隆汇· 2026-04-10 13:12
车身结构BU 进入规模化收获期,新赛道指引大幅上调1)车身结构BU 进入规模化收获期,电池盒BU 正式更名并延伸至防撞梁、门槛梁、储能电池盒等,单车配套价值大幅扩展,2030 年目标300 亿。2) 管理层大幅上调新赛道营收指引,机器人2026E 指引从1 亿上调至5 亿(5倍)、2027E 从5 亿上调至10 亿(2 倍);AI 液冷2026E 从2 亿上调至3亿、2027E 从8 亿上调至15 亿(近2 倍)。3)股东回报与抗 风险能力同步提升,派息率20%→27%,有息负债率降至21.2%,管理层表示未来将根据现金流状况逐 步提高派息比例。此外公司全球化运营深化,北美本地化生产比例约七成,可以有效对冲地缘风险。 盈利预测与估值 考虑到下游乘用车市场竞争加剧以及机器人等新赛道仍处于投入期,我们下调26-27 年营业收入预测至 295/337 亿元(较前值分别-7.9%/-8.7%),下调26-27 年归母净利润至31.95/37.96 亿元(较前值分 别-6.8%/-6.7%),新增28 年营业收入/归母净利润预测为380/44.06 亿元。可比公司26 年iFind一致预期 PE 均值13.4 倍,给予 ...
开启金融法治新征程 国泰海通证券“法治文化长廊”启幕
中国金融信息网· 2026-04-10 13:11
转自:新华财经 金融的安全靠制度、活力在市场、秩序靠法治。在国泰海通证券合并成立一周年、焕新发布"国泰海通 共识"企业文化理念体系之际,为进一步培育"五要五不"中国特色金融文化,落实新"国九条"部署及基 层立法联系点相关工作要求,国泰海通证券"法治文化长廊"正式启幕。国泰海通同步启动"4·15"全民国 家安全教育日金融法治宣传活动,以高质量建设金融法治特色阵地的实际行动,深入践行"全过程人民 民主"重大理念,为资本市场法治建设注入国有金融机构专业力量。 编辑:谈瑞 依法合规经营是金融发展的前提和保障,也是创造价值和防范风险的必要措施。自合并重组以来,国泰 海通证券深入贯彻中央金融工作会议精神,紧扣"十五五"规划金融法治建设要求,将基层立法联系点建 设作为践行金融工作政治性、人民性的重要抓手之一,充分把"依法合规,不胡作非为"融入"国泰海通 共识"构建,在立法调研、民意汇聚、普法宣传、投资者保护等工作中切实履行国有金融机构主体责 任。 "法治文化长廊"设计遵循"接地气、察民情、聚民智、传民声"建设指引,围绕"可走进、可互动、可体 验"原则,让每一处空间都成为传递金融法治文化的载体。长廊设八大特色功能区域,明晰基 ...