Genie
搜索文档
DeepMind掌门人万字详解通往AGI之路
量子位· 2025-12-19 15:20
在最新一期播客中,DeepMind掌门人哈萨比斯清晰地勾勒了他心目中通往AGI的一条现实路径: 一半靠规模扩展,另一半靠真正的科学突破。 henry 发自 凹非寺 量子位 | 公众号 QbitAI 想要实现AGI,技术创新和规模扩展得五五开,缺一不可。 从世界模型、模拟和智能体,一路聊到材料、超导体,甚至可控核聚变。这期播客里,哈萨比斯几乎是站在谷歌的当下,眺望AGI的全局图 景。 以下是哈萨比斯的核心观点速览: AGI实现需要创新与规模化的双重努力 :约50%的努力集中在模型扩展,50%集中在技术创新,二者结合是通向AGI的关键路径。 根节点问题推动科学突破 :AlphaFold的成功验证了AI解决基础科学难题的潜力,当前研究正拓展至材料科学(如室温超导体、更优电 池)、核聚变及量子计算等领域。 AI在数学等领域的表现存在"锯齿状智能"现象 :尽管能在国际数学奥林匹克竞赛中获奖,但在简单逻辑题上仍可能出错,反映出系统在 一致性与可靠推理方面的不足,需提升其自我反思与验证能力。 当前模型依赖人类知识,未来需实现自主学习 :现有大模型基于互联网知识进行压缩与泛化,类似于AlphaGo;下一步目标是实现类似 Al ...
Prediction: This Will Be the First Artificial Intelligence Stock to Reach a $5 Trillion Valuation in 2026
The Motley Fool· 2025-12-12 13:00
英伟达的里程碑与近期挑战 - 英伟达在10月底凭借强劲势头和对人工智能支出持续增长的乐观情绪,成为全球首家市值达到5万亿美元的公司 [1] - 自创下历史新高后,其股价已下跌10%,市值回落至4万亿美元区间 [1] - 市场预期英伟达将在2026年重返5万亿美元市值水平 [2] 对英伟达主导地位的主要威胁 - 英伟达的收入增长严重依赖其GPU需求,业务结构相对单一,若客户支出放缓或转向其他芯片制造商,其收入将面临风险 [4] - Alphabet被视为英伟达主导地位的重大威胁,其与Anthropic达成协议,该大型语言模型开发商将从2026年起在谷歌云上使用Alphabet的TPU [5] - 近期报告显示,Meta Platforms也有兴趣为其Llama模型使用TPU,可能通过租用谷歌云平台空间或直接购买TPU实现 [6] - 据一位谷歌云高管称,仅TPU业务就可能为Alphabet带来相当于英伟达年收入10%的收入,以分析师对英伟达明年3160亿美元收入的预估中值计算,这意味着谷歌云TPU收入可达310亿美元,约为谷歌云当前年化收入的一半 [6][7] Alphabet的全栈人工智能战略与优势 - Alphabet提供从消费产品到云计算基础设施的完整人工智能服务堆栈,各业务板块相互支撑,降低了竞争威胁并确保了公司前景 [8] - 在搜索业务方面,AI Overviews(人工智能概览)功能提供了人工智能生成的搜索结果摘要,该功能提高了用户参与度,并且其货币化率已与无AI概览的搜索结果持平,对整体搜索收入产生了积极贡献 [10][11] - 2025年最新季度,搜索收入重新加速增长,增幅达15% [10] - 公司正通过引入AI Mode(人工智能模式)来扩大势头,该模式将用户推入其Gemini AI的聊天机器人界面,可能带来更多订阅收入或广告潜力 [12] Alphabet的人工智能产品与开发生态 - Gemini基础模型及其它模型(如Veo, Genie, Nano Banana)被数百万开发者使用,管理层统计有超过1300万开发者使用其模型开发应用 [13] - 最新版本Gemini 3.0获得广泛好评,据《华尔街日报》报道,OpenAI内部备忘录显示其CEO Sam Altman认为该模型对其最新版GPT构成严重威胁 [14] - 谷歌云业务增长迅速,最近一个季度收入增长34%,未完成合同金额(backlog)大幅增长82%,表明其持续增长动力强劲 [15] - 随着业务规模扩大,谷歌云的运营利润率正在扩大,预示着未来更强的盈利增长 [15] Alphabet的财务表现与估值 - 尽管在人工智能计算领域投入巨大,公司每季度仍持续产生数百亿美元的自由现金流 [16] - 公司股票远期市盈率约为29倍,虽高于市场平均水平,但其多元化的收入来源和全栈运营模式使其风险低于其他人工智能股票,因此这一溢价被认为是合理的 [16] - 综合其增长动力和多元化的人工智能收入流,Alphabet的股价在2026年相对较快地攀升至5万亿美元市值并不令人意外 [16]
Google DeepMind CEO:AGI 还差 1–2 个突破?
36氪· 2025-12-08 10:42
AGI实现时间表与关键突破 - Google DeepMind CEO Demis Hassabis预测,通用人工智能(AGI)可能在5到10年内实现,距离AGI仅差一到两个AlphaGo级别的技术突破 [2][3][13] - 该预测并非基于模型参数规模,而是基于当前模型在理解能力、判断能力和创造能力方面的具体进展 [3][12] 当前AI模型已具备的核心能力 - 模型从文本专家进化为多模态理解系统,例如Gemini能够理解视频内容并解读动作背后的深层意图,展现出洞察能力 [3][4][6] - 模型具备独立的判断力,能够在被指出错误时进行温和反驳,显示出对上下文的理解和表达平衡能力,开始向稳定人格型系统靠近 [7][8][10] - 模型展现出产品级创造能力,例如能够一键生成可玩的小游戏原型或完整的前端网页,这需要其对代码结构、设计逻辑和交互体验有整体理解 [11][12] 当前模型与AGI的关键差距 - 模型不具备持续学习能力,无法在使用过程中通过互动成长或根据经验改正错误,在线学习和长期记忆系统是关键突破点之一 [16] - 模型无法执行长期规划,缺乏进行长链式推理和制定、执行多步长期目标的能力,底层结构并非为多步决策系统设计 [17][18] - 智能体系统仍不稳定,无法在复杂环境中可靠地执行多步骤任务,因此尚不能将整个任务完全委托给AI并确信其完成 [19][20] - 模型缺乏跨对话的稳定记忆,无法在多次互动中保持一致的立场、记住用户的长期偏好或根据上下文调节行为,这需要更底层的架构设计 [21][22] 实现AGI的关键技术路径 - 发展“世界模型”是核心路径之一,例如DeepMind的Genie模型能够生成具备物理一致性和时空连贯性的虚拟环境,使AI从理解画面跨越到理解物理规律和推演真实世界 [25][26][27] - 发展稳健的“智能体系统”是另一核心路径,目标是打造能够自主规划、执行任务并根据结果调整的AI,使其从回答问题转变为完成目标,并嵌入到各种生活与工作场景中 [28][29][30] - 单纯扩大大型语言模型(LLM)的规模不会带来AGI,真正的突破将来自世界建模和智能体系统的技术创新 [30] 全球AI竞争格局 - 中美在AGI研发上处于平行赛道,竞争窗口正在压缩,西方目前在算法和创新层面领先,但中国(如Qwen和DeepSeek模型)在技术能力、执行层面和迭代速度上紧跟,差距仅为几个月而非几年 [35][36] - 在AGI竞赛中,真正的护城河并非资金或GPU数量,而是将研究、工程和产品全链条打通的能力,安全是前提,速度是关键 [2][37] 领先AI公司的核心竞争优势 - 科学方法是根本优势,开发AI被视为运用科学方法逼近人类智能本质的过程,而非简单的技术进化 [39][40] - 领先公司(如DeepMind)采取不迷信单一路线的全面试错策略,同时探索强化学习、认知架构等多种技术路径,并严格追踪数据表现,其核心非技术资产是科学决策能力 [41][42][43] - 真正的竞争优势在于将世界级的研究、工程和基础设施三者深度融合,具备把从未被解决过的问题转化为真正可用产品的独特能力 [44]
“AI教母”李飞飞发布首款商用世界模型
第一财经· 2025-11-13 10:15
产品发布与特点 - World Labs公司正式推出首款产品Marble 由多模态世界模型提供支持 能通过单张图片 一段视频或一句文本提示创建高保真 持久的3D世界 [2] - Marble正式版功能扩展 支持大规模多模态输入 同步推出名为Marble Labs的创意中心 并开放免费增值与付费订阅服务 [5] - Marble提供四档订阅方案 免费版支持4次生成 标准版每月20美元 旗舰版每月95美元包含75次生成 [5] - Marble的差异化优势在于生成持久化 可下载的3D环境 显著减少场景变形与不一致性 支持导出为高斯泼溅 网格或视频格式 [5] 技术理念与行业定位 - 空间智能被定位为人工智能的下一个前沿 是机器实现真正智能的关键突破 [6] - 世界模型需具备生成性 多模态性和交互性三种核心能力 以构建环境内部表征 [8] - Marble是目前世界模型赛道中首个投入商用的产品 行业评测认为其交互效果不错但细节精细度需提升 [8] - 竞争对手如谷歌Genie处于有限研究预览阶段 Decart与Odyssey仅推出免费演示版本 [8] 应用前景与发展规划 - 短期内空间智能将赋能电影 游戏和建筑领域的创作者 快速生成可探索的3D环境 [8] - 中期将推动具身智能机器人发展 通过高仿真训练使其成为人类在家庭 实验室中的协作伙伴 [8] - 长远看空间智能有望在科学 医疗和教育领域引发革命 通过模拟实验 辅助诊断和沉浸式学习增强人类能力 [8] - 公司第一阶段专注于构建对三维性 物理性及空间和时间概念有深入理解的模型 随后将支持增强现实技术和机器人技术等领域 [9] 公司融资与市场地位 - World Labs在2024年创办 短短几月内完成约2.3亿美元(约合人民币16亿元)融资 估值迅速突破10亿美元(约合70亿元)成为AI领域最新独角兽企业 [9] - 公司投资方阵容包括a16z Radical Ventures 英伟达NVentures AMD Ventures和Intel Capital等科技与风投界重量级玩家 [9]
“AI教母”李飞飞发布首款商用世界模型 空间智能更近了
第一财经· 2025-11-13 09:37
公司产品发布 - 李飞飞创立的World Labs公司于11月13日正式推出首款产品Marble,这是一个由多模态世界模型支持、能通过单张图片、视频或文本提示创建高保真持久3D世界的平台 [1] - 产品正式版功能扩展,支持大规模多模态输入,同步推出名为Marble Labs的创意中心,并开放免费增值与付费订阅服务 [4] - Marble提供四档订阅方案,免费版支持4次生成,标准版每月20美元,旗舰版每月95美元包含75次生成并可解锁全部功能 [4] - 与实时模型RTFM的差异在于,Marble生成的是持久化、可下载的3D环境,支持导出为高斯泼溅、网格或视频格式,显著减少场景变形与不一致性 [4] 技术理念与行业定位 - 李飞飞认为空间智能是人工智能的下一个前沿,是机器实现真正智能的关键突破,其核心是构建具备生成性、多模态性和交互性的世界模型 [5] - 相较于谷歌Genie仍处于有限研究预览阶段,以及竞争对手Decart与Odyssey仅推出免费演示版本,Marble是世界模型赛道中首个投入商用的产品 [5] - 行业评测认为Marble整体交互效果不错,但细节精细程度还需要提升 [5] 市场应用前景 - 短期内空间智能将赋能电影、游戏和建筑等领域的创造力,提供快速生成可探索3D环境的工具 [5] - 中期将推动具身智能机器人发展,使其成为家庭和实验室中的协作伙伴 [6] - 长期有望在科学、医疗和教育领域引发革命,通过模拟实验、辅助诊断和沉浸式学习增强人类专业能力 [6] 公司融资与发展规划 - World Labs在2024年创办后短短几月内完成约2.3亿美元(约合人民币16亿元)融资,估值迅速突破10亿美元(约合70亿元),成为AI领域最新独角兽 [6] - 公司投资方包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家 [6] - 公司第一阶段专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实技术和机器人技术等领域 [6]
“AI教母”李飞飞发布首款商用世界模型,空间智能更近了
第一财经· 2025-11-13 09:31
产品发布与核心功能 - World Labs公司于11月13日正式推出首款产品Marble,该产品由多模态世界模型提供支持,被官方称为“构建空间智能未来的基础”[1] - Marble模型能通过单张图片、一段视频或一句文本提示创建高保真、持久的3D世界[1] - 与实时模型RTFM的差异化在于,Marble生成的是持久化、可下载的3D环境,显著减少场景变形与不一致性,并支持导出为高斯泼溅、网格或视频格式[4] - 产品正式发布时功能得到扩展,支持大规模多模态输入,并同步推出了名为Marble Labs的创意中心[4] 商业模式与定价 - Marble采用免费增值与付费订阅服务模式,免费版支持4次生成,仅限文本和图像输入[4] - 标准版订阅价格为每月20美元,支持多图、视频输入及高级编辑功能[4] - 旗舰版订阅价格为每月95美元,包含75次生成,可解锁全部功能[4] - Marble是世界模型赛道中首个投入商用的产品,而竞争对手如谷歌的Genie仍处于有限研究预览阶段,Decart与Odyssey仅推出免费演示版本[5] 技术理念与行业前景 - 公司创始人李飞飞认为,空间智能是人工智能的下一个前沿,是实现机器真正智能的关键突破[5] - 空间智能即人类用以理解、导航并与三维世界交互的底层能力,构建的世界模型需具备生成性、多模态性和交互性三种核心能力[5] - 短期内,空间智能将赋能电影、游戏和建筑领域的创造力,提供快速生成可探索3D环境的工具[5] - 中期将推动具身智能机器人发展,长远看有望在科学、医疗和教育领域引发革命[6] 公司发展与融资 - World Labs由李飞飞在2024年创办,并在短短几月内完成约2.3亿美元(约合人民币16亿元)的融资[6] - 公司估值迅速突破10亿美元(约合70亿元),成为AI领域最新的独角兽企业[6] - 公司投资方阵容包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家[6] - 公司第一阶段将专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实技术和机器人技术等领域[6]
Kaltura(KLTR) - 2025 Q3 - Earnings Call Transcript
2025-11-11 07:02
财务数据和关键指标变化 - 第三季度总收入为4390万美元,同比下降1%,但高于指导范围上限4280万至4360万美元 [34] - 订阅收入为4200万美元,同比持平,高于指导范围上限4080万至4160万美元 [34] - 专业服务收入为190万美元,同比下降14% [34] - 调整后息税折旧摊销前利润为420万美元,创纪录新高,同比增长72%,连续第九个季度实现盈利 [5][40] - 非公认会计准则净利润为200万美元,连续第五个季度盈利 [5] - 经营活动现金流为930万美元,符合下半年强劲现金流的预测 [5] - 非公认会计准则毛利率为70%,高于去年同期的68% [5] - 剩余履约义务为1593亿美元,同比下降4%,其中60%预计在未来12个月内确认为收入 [37] - 年度经常性收入为1691亿美元,同比略有增长 [38] - 净美元留存率为97%,低于上季度和去年同期的101% [38] - 第三季度末现金及有价证券为8410万美元 [41] 各条业务线数据和关键指标变化 - 企业、教育和科技部门总收入为3240万美元,同比略有增长,订阅收入为3180万美元,同比增长1% [38] - 媒体和电信部门总收入为1150万美元,同比下降4%,但环比增长3%,订阅收入为1010万美元,同比下降4%,环比增长3% [39] - 企业、教育和科技部门的毛保留率在第三季度继续保持强劲,预计2025年全年毛保留率将优于前四年 [22][33] - 媒体和电信部门的毛保留率优于第一和第二季度,但仍低于往常水平,预计第四季度将强劲 [22][33] 公司战略和发展方向和行业竞争 - 公司宣布计划收购ESOFai,一家专注于生成式AI和实时拟真头像技术的深度科技实验室,交易总价值约为2700万美元 [6][16] - 此次收购是公司从视频公司转型为富媒体、AI赋能的客户和员工体验公司战略的关键一步 [9][15] - 计划将ESOF技术整合到现有产品中,并推出新的自助式沉浸式虚拟代理产品,以扩大目标市场至中小企业 [10][11] - 公司认为基于头像的对话代理将成为工作、学习和娱乐的主要界面,并致力于成为实时视频体验生成器 [8][9] - 公司在第三季度扩大了Genie代理家族的功能,并推出了新的发布代理,以自动化内容发布流程 [22][23] - 公司目标是在2028年或更早实现两位数收入增长以及收入增长与调整后息税折旧摊销前利润率的"30法则"组合 [30][48] 管理层对经营环境和未来前景的评论 - 新订阅订单在第三季度尚未出现预期的下半年增长,但当前渠道支持第四季度出现增长 [21][42] - AI相关交易在第三季度完成了5笔,预计未来将有更多交易,且数量超过先前预测 [20] - 尽管宏观经济环境存在不确定性,但公司通过有效的运营费用管理获得了运营杠杆,处于支持需求增长的有利位置 [42] - 对第四季度的展望包括总收入首次出现环比增长,订阅收入与第三季度持平,调整后息税折旧摊销前利润预计再创新高 [29][44][45] - 公司预计在完成Goldman Sachs股票回购和ESOF收购后,年底将拥有约6000万美元的总现金和约3000万美元的净现金 [19][41] 其他重要信息 - 公司以1660万美元回购了Goldman Sachs持有的1440万股股票,占当时流通股的92% [18] - 公司对剩余履约义务的计算进行了调整,发现了之前未在系统中充分反映的带有"便利终止"条款的合同,导致本季度向下调整1810万美元 [35][37] - 公司在8月初宣布的重组计划按部就班进行,预计2025年将实现260万美元的增量节省,年化节省额为850万美元 [43] - 首席财务官John Doherty将于12月5日离职,公司已开始寻找新任首席财务官 [31] 问答环节所有提问和回答 问题: 关于收购ESOFai后对新产品的投资和整合计划,销售团队何时能够开始销售新产品 [51] - 回答指出重点将放在2026年下半年实现收入贡献,而非立即见效,需要1-2个季度进行整合、确保合规性和安全性,并逐步商业化 [51][54] - ESOFai现有17人团队的年支出约为350万美元,将加入公司的运营费用,预计无需额外增加销售、营销或一般行政人员 [58] - 收购的战略意义在于将Genie代理升级为具备视听功能的完全对话式代理,使公司从视频体验提供商转型为沉浸式虚拟代理提供商,利用其庞大的视频数据和工作流优势 [51][52][57] 问题: 第四季度是否有特定垂直行业或客户群表现优于或劣于预期 [59] - 回答指出媒体和电信部门的毛保留率在第三季度已开始改善,预计第四季度会更好,新订单的增长预计将在第四季度出现在媒体和电信以及企业、教育和科技两个部门 [60] 问题: 客户采用AI技术是否已经切实增加了视频内容的创建量或速度 [65][66] - 回答确认了市场对Genie和ContentLab的兴趣日益增长,第三季度完成了5笔AI交易,AI用于视频的重新利用和生成是一个重要趋势,预计2026年将实现更大飞跃 [67][68] - 尽管客户兴奋度很高,但收入的完全体现需要时间,因为涉及合规性和全面采用的过程,公司采取谨慎态度,注重中长期建设 [68][69] 问题: 导致两起客户收入确认延迟的原因以及何时能解决 [72] - 回答澄清延迟是由于客户方的项目计划推迟到明年,而非公司交付问题,涉及金额约为50万美元,一例来自企业、教育和科技部门,另一例来自媒体和电信部门 [73][74]
Kaltura(KLTR) - 2025 Q3 - Earnings Call Transcript
2025-11-11 07:02
财务数据和关键指标变化 - 第三季度总收入为4390万美元,同比下降1%,但超过指导范围上限4280万-4360万美元 [34] - 订阅收入为4200万美元,与去年同期持平,超过指导范围上限4080万-4160万美元 [34] - 专业服务收入为190万美元,同比下降14% [34] - 调整后税息折旧及摊销前利润为420万美元,创纪录新高,同比增长72%,连续第九个季度实现盈利 [5][40] - 非公认会计准则净利润为200万美元,连续第五个季度盈利 [5] - 经营活动现金流为930万美元,符合下半年强劲现金流的预测 [5] - 非公认会计准则毛利率为70%,高于去年同期的68% [5] - 剩余履约义务为1593亿美元,同比下降4%,其中60%预计在未来12个月内确认为收入 [37] - 年度经常性收入为1691亿美元,同比略有增长 [38] - 净美元留存率为97%,低于上季度和去年同期的101% [38] - 第三季度末现金及有价证券为8410万美元 [41] 各条业务线数据和关键指标变化 - 企业、教育和科技部门总收入为3240万美元,同比略有增长,订阅收入为3180万美元,同比增长1%,专业服务收入为50万美元,同比下降37% [38] - 媒体和电信部门总收入为1150万美元,同比下降4%,但环比增长3%,订阅收入为1010万美元,同比下降4%,环比增长3%,专业服务收入为140万美元,同比略有下降 [39] - 企业、教育和科技部门的毛保留率在第三季度保持强劲,预计2025年全年毛保留率将优于前四年 [22][33] - 媒体和电信部门的毛保留率优于第一和第二季度,但仍低于通常水平,预计第四季度将强劲 [22][33] 公司战略和发展方向和行业竞争 - 公司宣布计划收购ESOFai,这是一家深度技术生成式人工智能实验室,专注于开发会话代理人工智能技术,包括实时逼真虚拟形象、语音识别与生成以及屏幕理解 [6] - 此次收购旨在推动公司从视频内容管理体验提供商转型为利用丰富媒体和人工智能技术的客户和员工体验公司 [9] - 收购后计划推出两项新服务:基于人工智能的按需视频内容创建工具以及具有实时虚拟形象界面的沉浸式会话虚拟代理 [10] - 公司战略是将其人工智能代理从基于提示的被动代理发展为主动、自动化、会话的环境代理,最终成为行业特定的AI专家 [8] - 公司相信基于虚拟形象的会话代理将成为工作、学习和娱乐的主要界面,进入"代理的十年" [8] - 公司目标是在2028年或更早实现两位数收入增长以及收入增长与调整后税息折旧及摊销前利润率的"30法则"组合 [30][48] 管理层对经营环境和未来前景的评论 - 尽管第三季度新订单未如预期般增长,但当前渠道支持第四季度新订单量回升 [21][42] - 公司预计第四季度总收入将出现今年首次环比增长,指导范围为4500万至4570万美元 [29][44] - 考虑到两个现有客户的收入确认延迟,第四季度订阅收入指导与第三季度结果持平,为4160万至4230万美元 [29][45] - 公司第三次提高全年调整后税息折旧及摊销前利润指导,预计第四季度将再创新高,达到420万至520万美元,全年指导范围为1660万至1760万美元 [29][45] - 公司预计第四季度再次实现正经营现金流 [29] - 在完成高盛股份回购和ESOFai收购后,公司预计年底总现金约为6000万美元,净现金约为3000万美元 [19][41] - 宏观经济环境仍存在不确定性,但公司已有效应对媒体和电信部门今年的客户流失 [42] 其他重要信息 - 公司以1660万美元回购了高盛持有的1440万股股份,相当于当时流通股的92%,收购价格为30日成交量加权平均价的75折 [18] - 在完成高盛股份回购和ESOFai收购后,公司流通股将减少980万股,产生62%的反稀释增值效应 [19] - 公司发现部分包含方便终止条款的合同未完全反映在剩余履约义务计算中,因此对本季度及历史剩余履约义务数据进行了1810万美元的向下调整 [35][37] - 公司首席财务官约翰·多尔蒂将于12月5日离职,公司已开始寻找新任首席财务官 [30][31] - 第三季度新订阅订单包括12笔六位数交易,新增客户包括一家大型日本 conglomerate、一家领先的欧洲专业服务公司和一家知名的亚洲电信公司 [20] - 第三季度完成了五笔人工智能交易,涉及ContentLab和Genie产品 [20] 问答环节所有提问和回答 问题: 关于对新产品的投资以及产品整合时间表的想法 [51] - 回答重点更多放在2026年下半年,并非不可能提前,但希望设定一个现实可行的目标 [51] - 收购ESOFai的战略长期价值在于赋予Genie产品虚拟形象,使其成为完全会话式、沉浸式的虚拟代理,这是从视频公司向基于视频的客户和员工体验公司转型的一部分 [51][52] - 整合和商业化计划包括将代理与现有产品连接、开发独立自服务代理、构建软件开发工具包以及添加点播虚拟形象工具 [53][54] - 达到合规性、安全性和大规模运行所需的时间预计为一到两个季度,全面商业化整合将在明年逐步进行 [54] - ESOFai现有团队17人,年运营支出约为350万美元,收购后将并入公司运营支出,公司可能增加研发人员,但预计无需增加销售、市场营销、客户服务或一般行政管理人员 [58] 问题: 第四季度是否有特定垂直行业或客户群体表现优于或差于预期 [59] - 媒体和电信部门的毛保留率在第三季度开始好转,预计第四季度会更好 [60] - 新订单的环比增长未在第三季度发生,但预计将在第四季度发生,这一趋势将在媒体和电信以及企业、教育和科技两个部门同时出现 [60] 问题: 在客户群中是否看到采用人工智能技术增加视频内容创建速度或数量的切实迹象 [65][66] - 确实看到客户对使用Genie和ContentLab的兴趣日益增长,第三季度完成了五笔交易,更多交易正在酝酿中 [67] - 人工智能用于视频再创作和重新目的是最大应用场景之一,这一趋势正在形成,但收入完全体现需要时间,主要受合规性和全面采用速度影响 [68] - 在会议上展示新愿景时反响热烈,与大型客户的讨论显示出积极的采购信号,但公司倾向于保守承诺,注重中长期建设 [69][70] 问题: 导致两起客户收入确认延迟的原因以及何时能解决 [72] - 延迟涉及约50万美元,如果加上这部分,第四季度指导将更接近原预期 [72] - 延迟原因是客户方的项目计划推迟到明年,与公司交付无关,是客户方出现的未知挑战 [73][74]
Kaltura(KLTR) - 2025 Q3 - Earnings Call Transcript
2025-11-11 07:00
财务数据和关键指标变化 - 第三季度总收入为4390万美元,同比下降1%,但高于指导范围上限4280万至4360万美元 [33] - 第三季度订阅收入为4200万美元,同比持平,高于指导范围上限4080万至4160万美元 [33] - 专业服务收入为190万美元,同比下降14% [33] - 调整后息税折旧摊销前利润为420万美元,创纪录新高,同比增长72%(去年同期为240万美元),连续第九个季度实现盈利 [5][38] - 非公认会计准则净利润为200万美元,连续第五个季度盈利,同比改善200万美元 [5][38] - 经营活动现金流为930万美元,符合下半年强劲现金流的预测,但同比下降140万美元(去年同期包含一笔230万美元的延迟收款) [5][39] - 第三季度GAAP净亏损为260万美元,即每股摊薄收益0.02美元,同比改善100万美元 [38] - 剩余履约义务为1.593亿美元,同比下降4%,其中60%预计在未来12个月内确认为收入 [35] - 年度经常性收入为1.691亿美元,同比略有增长 [36] - 第三季度净美元留存率为97%,低于上一季度和去年同期的101%,主要受媒体和电信板块客户流失增加影响 [36] - 第三季度GAAP毛利润为3070万美元,同比增长4%,毛利率为70%,高于去年同期的67% [37] - 订阅毛利率为77%,高于去年同期的75% [37] - 第三季度总运营费用为3220万美元,同比下降5%(去年同期为3400万美元) [38] 各条业务线数据和关键指标变化 - 企业、教育和技术板块第三季度总收入为3240万美元,同比略有增长,订阅收入为3180万美元,同比增长1%,专业服务收入为50万美元,同比下降37% [37] - 媒体和电信板块第三季度总收入为1150万美元,同比下降4%,但环比增长3%,订阅收入为1010万美元,同比下降4%,环比增长3%,专业服务收入为140万美元,同比略有下降 [37] - 企业、教育和技术的总留存率在第三季度继续保持强劲,预计2025年年度总留存率将优于前四年 [21][32] - 媒体和电信的总留存率优于第一和第二季度,但仍低于通常水平,预计第四季度将表现强劲 [21][32] - 第三季度新订阅订单包括12笔六位数交易,涉及新客户如大型日本 conglomerate、领先的欧洲专业服务公司和知名亚洲电信公司 [20] - 在人工智能方面,第三季度完成了五笔ContentLab和Genie的交易,客户包括跨国快餐连锁店、美国领先的医疗保健提供商和三所大学 [20] 公司战略和发展方向和行业竞争 - 公司宣布签署最终协议,计划收购深度生成式人工智能实验室ESOFai,以推动从视频公司向富媒体人工智能驱动的客户和员工体验公司的转型 [6][9] - ESOFai的技术将用于开发新一代Kaltura沉浸式实时对话虚拟代理,具备听说看和理解能力,并作为新内容创作工具的基础 [6][10] - 公司愿景是将人工智能代理从基于提示的被动代理转变为主动自动化对话环境代理,最终成为行业特定的人工智能专家 [7] - 收购后,计划提供两项新服务:基于人工智能的按需视频内容创作工具和具有实时头像界面的沉浸式对话虚拟代理 [10] - 新的自助服务产品旨在促进产品引导增长,扩大目标市场至中小型企业 [11] - 公司计划将ESOF技术整合到现有视频体验产品中,并作为独立产品提供 [11] - 公司定位为进入"代理的十年",基于头像的对话代理将成为工作、学习和娱乐的主要界面 [8] - 公司目标是在2028年或更早实现两位数收入增长以及收入增长与调整后息税折旧摊销前利润率的"30法则"组合 [30][47] 管理层对经营环境和未来前景的评论 - 新订单管道支持在第四季度企业、教育和技术以及媒体和电信板块的新订单量回升 [20][27] - 尽管宏观经济环境存在不确定性,但公司通过有效管理媒体和电信板块的客户流失,运营杠杆得到改善 [40] - 对第四季度前景乐观,预计总收入将出现今年首次环比增长,指导范围为4500万至4570万美元 [28][43] - 第四季度订阅收入指导范围为4160万至4230万美元,考虑到两名现有客户的收入确认延迟,与第三季度持平 [28][44] - 预计第四季度调整后息税折旧摊销前利润将再创新高,介于420万至520万美元之间 [44] - 全年调整后息税折旧摊销前利润指引第三次上调至1660万至1760万美元,较2024年的730万美元有显著增长 [44] - 预计第四季度经营活动现金流再次为正 [29] - 预计ESOFai收购对2025年财务影响最小,增量收入预计在2026年下半年开始确认 [41][42] - 公司预计在完成高盛股份回购和ESOF收购后,年底总现金约为6000万美元,净现金约为3000万美元(扣除银行债务后) [19][39] 其他重要信息 - 公司以1660万美元回购了高盛持有的1440万股股份(占当时流通股的9.2%),较30日成交量加权平均价有25%折扣 [18] - 完成高盛股份回购和ESOF收购(假设所有条件达成)后,流通股将减少980万股,产生6.2%的反稀释增值效应 [19] - 公司于8月初宣布的重组计划按部就班,预计2025年将节省260万美元费用,年化节省850万美元,一次性费用为80万美元 [41] - 首席财务官John Doherty将于12月5日离职,公司已开始寻找新任首席财务官 [30][31] - 在第三季度,公司通过人工智能合同扫描发现剩余履约义务计算需要调整,涉及终止便利条款的合同,导致本季度剩余履约义务下调1810万美元,但管理层强调这不影响业务前景 [34][35] - 第三季度产品增强包括虚拟活动支持更大规模、视频门户整合现代Kaltura Studio、学习管理系统和内容管理系统扩展支持原生嵌入等 [25] - 公司在全球举办了多场行业活动,展示其人工智能产品,并获得了强烈的市场兴趣 [26][27] 问答环节所有提问和回答 问题: 关于收购ESOFai后新产品投资、整合以及销售时间表的想法 - 回答重点更多放在2026年下半年实现收入贡献,而非即时回报,设定现实目标 [48] - 收购旨在将Genie代理升级为具备面部、嘴、耳朵、眼睛的完全对话式代理,从提供视频体验转向提供沉浸式虚拟代理和体验 [49][50] - 计划将代理作为独立自助服务产品提供,并整合到现有产品中,未来一年逐步完成整合和商业化,部分功能会更快推出 [51][52] - ESOF技术区别于竞争对手之处在于其优化于对话功能、结合代理逻辑、与Kaltura视频系统集成、以及拥有丰富的现有数据和工作流基础 [53][54] - ESOF现有17人团队的年运营费用约为350万美元,将加入公司运营费用,预计无需增加销售、营销或一般行政人员 [55] 问题: 第四季度是否有特定垂直领域或客户群表现优于或差于预期 - 媒体和电信板块的总留存率在第三季度已开始好转,预计第四季度会更好 [56] - 新订单量预计在第四季度在企业、教育和技术以及媒体和电信板块都会出现回升 [57] 问题: 客户采用人工智能技术是否已经增加了视频内容创建的速度或数量,是否有数据支持 - 观察到客户对使用Genie和ContentLab的兴趣日益增长,第三季度完成了五笔交易,更多交易正在酝酿中 [58] - 人工智能用于视频再造和重新利用的趋势正在形成,但收入贡献需要时间,预计2026年将有更大进展 [59] - 在行业会议上展示新愿景获得了极大兴趣和兴奋,与主要客户的讨论显示出积极的购买信号,但市场是"展示型"而非"告知型",需要时间 [60] 问题: 关于两名客户收入确认延迟的原因以及预计何时解决 - 延迟涉及约50万美元收入,原因是客户方的项目时间表推迟到明年,与Kaltura的交付无关 [61] - 如果延迟问题解决,第四季度业绩可能达到或超过原始指引 [62]
《大模型的第一性思考》李建忠对话GPT5与Transformer发明者Lukasz Kaiser实录
36氪· 2025-10-13 18:46
对话一:语言对于智能到底意味着什么? - 语言模型在智能构建中扮演核心角色,其成功源于对语言在智能中核心作用的认知,ChatGPT和Transformer的成功均得益于此[6][9] - 语言具备时间维度,总是在生成下一个词,而序列模型(如Transformer)可处理包括语言、蛋白质、音频在内的各种序列,时间序列是表达智能的重要组成部分[7] - 语言训练具有实践优势,互联网上海量的语言数据使得训练非常方便且成本远低于视频训练[9] - 语言模型确实会形成独立于语言的抽象概念,例如在解决数学问题时,尽管用不同语言生成答案,但解题方式和错误类型相同,表明模型在抽象空间进行思考[10] - 然而,未经过大量多模态数据训练的模型,其概念(如"痛苦"或"爱")可能与人类植根于物理世界的真实感受有所不同[11] 对话二:多模态与世界模型的挑战 - 现代大语言模型(如GPT-4)已是多模态模型,能接收和生成图像、音频,并已取得巨大进展,例如ChatGPT的语音模式可以对话、唱歌[12] - 当前多模态处理方式(如通过VQ-VAE将图像/音频编码为特殊代码)有效但不令人满意,未来需要更深入地将多模态融合到模型中,使编码更具可训练性并与语言有更多交互[13] - 语言对于为视觉对象赋予语义含义至关重要,否定语言价值的视觉派研究可能重蹈ChatGPT发布前的错误路线[14] - 现代大语言模型在某种程度上已是世界模型,在文本和数学方面表现卓越,但作为物理模型的表现不如语言模型,部分原因是视频训练数据不足、质量不佳及当前架构限制[14] - 通过改进架构、损失函数并增加更好更多的数据,结合像Sora、Genie和Veo这类从视频学习的模型,正在弥合"世界模型"与"语言模型"之间的差距[15] 对话三:AI编程:自然语言是终极目标,还是新的"巴别塔"? - Transformer架构的创造者在早期就已预见其在自动化编程方面的应用潜力[17] - 未来语言模型将能覆盖大量编程工作,但数学符号和编程语言作为沟通工具,在解释复杂概念时比纯自然语言更高效,因此专业程序员仍需掌握这些概念以实现与模型的快速、高效沟通[18] - 编程的重点在于沟通和抽象,而非特定语言,AI有望帮助更好地使用现有编程语言来改进系统,而非必然需要创造新的为AI设计的编程语言[19] - 新的编程语言需求将来自新的计算硬件架构,而非AI编程本身[20] 对话四:Agent的泛化困境:是方法问题,还是根本限制? - 所谓的"智能体模型"通常指在其推理过程中能调用外部工具(如代码解释器、网络搜索)的推理模型,这些模型使用强化学习训练且效果良好[21] - Agent泛化问题的主要挑战在于缺乏学习信号,当模型使用未经训练的工具时,没有像强化学习训练那样的反馈机制来检查答案正确性[22] - 要实现出色的多智能体系统,需要能够模拟整个环境进行训练,而这在当前难以实现,但即使没有大量训练,聪明的模型也能零样本完成许多任务[23] 对话五:算力与算法:Scaling Law是信仰还是路径依赖? - 预训练的Scaling Law已带来巨大进展,但存在经济上的实践极限,因为用户不愿为每个token支付过高费用,且大模型可被蒸馏成更小模型[25] - 预训练的Scaling Law在解决某些问题(如GSM-8K数学数据集)时速度不可行,而强化学习推理能用小模型解决相同问题,显示出更高的数据效率[26] - 推理模型的Scaling Law(通过强化学习让模型运行更长时间以提升性能)受限于Transformer的上下文长度设计以及强化学习在长序列推理中的信用分配问题[27] - 推理的Scaling Law与预训练的Scaling Law有不同限制,这呼唤新的研究和可能的架构或强化学习算法改进[28] 对话六:具身智能的挑战:是数据问题?还是比特和原子的根本性差异? - 具身智能可能更接近于当前的大语言模型,数据效率正在提高,例如推理模型能用极少样本学会困难任务[29] - 实现具身智能需要一个在大量视频上预训练好的多模态模型作为基础,再结合强化学习进行推理训练,但需要调整架构以适应现实世界行动的速度要求[30] - 第一个版本的具身智能模型可能基于现有成果调整,但未来会出现数据和计算更高效的新一代模型[31] 对话七:强化学习:是超级优化器,还是科学发现的引擎? - 由强化学习驱动的推理模型可被视为一种数据效率更高的新架构或范式,能够从有限数据(如1000道数学题)中学习[32][33] - 强化学习只依赖一个奖励信号,若优化得当,模型有望从研究论文中学习并提出连专业人员都觉得新颖的想法,推动科学发现[33] - 该范式仍处于早期阶段(社区广泛关注约一年),需要更多尝试、发现和改进以提升效率和应用范围[34] 对话八:AI的组织跃迁:如何实现大规模Agent协作? - 实现大规模Agent组织(如成千上万个Agent协作)的最大挑战在于开发下一代推理模型,需要类似Transformer之于RNN的架构创新[35] - 当前推理模型顺序生成token的方式缺乏并行性,未来需要为并行过程提供更多信号,并结合新的架构来融入并行处理[36] 对话九:AI记忆的瓶颈:模型离真正的"原生记忆"还有多远? - 通过将记忆作为工具(如访问互联网或记忆库)并结合强化学习训练,模型可以有效地解决记忆问题,当前方案已相当可行[37][38] - 未来可能出现更优雅的记忆机制,如将记忆转化为连续的向量或通过类似LoRA的适配器微调模型权重,但这仍是待研究的问题[40] 对话十:大模型如何摆脱瞬时学习,而像人类一样持续学习? - 利用上下文学习作为持续学习的记忆是当前已实现的进展,模型将对话信息放入上下文进行处理,但效率并非最高[39] - 通过记忆工具和像LoRA这样的适配器微调技术,实质性修改权重已变得更加可行,为持续学习提供了基础,但如何优化算法仍是研究重点[40] - 下一代推理架构有望实现更并行的处理,推动模型在科学发现等领域的应用,未来并不遥远[41]