深思SenseAI - 财报，业绩电话会，研报，新闻

深思SenseAI

搜索文档

深思SenseAI· 2026-01-21 09:00

文章核心观点 - 人工智能与可穿戴技术的结合，其发展方向不应仅是向外提升效率或生产，更应向内帮助人们理解自身的身体信号、情绪和节律，实现一种更细腻、更少误判的自我觉察 [1][32] - 理想的科技产品交互应像戏剧中的停顿，安静、不打扰、不制造焦虑，只在合适的时候提供可选的、自定义的“背景音”式支持，尊重用户解读世界的方式 [29][30] - 技术发展的意义在于“平权”，即将“理解自身”的能力从少数人的特权转变为日常可及的工具，让更多人能获得稳定的自我照料线索，而不必在身体与情绪的迷雾中猜测 [40][42] 人类向内探索的工具史 - 人类文明在追求向外扩张的同时，一直并行着向内理解自身的努力，“认识你自己”是一条古老的指令 [11] - 听诊器的发明让心跳从主观感觉转变为可听见、可讨论的客观证据，是身体内部世界首次被稳定带入语言 [12][15] - 体温计、心电图、Holter动态心电等工具相继出现，每一次进步都将身体的低语“翻译”得更清楚，把瞬间的诊室观察延长至24小时的生活趋势 [12][15] “悦己”与贴身之物的哲学 - “悦己”是向内照料与向外表达的并行，既关注自身睡眠、疲惫、情绪等内在变化，也通过外在选择表达身份与品味 [26][27] - 历史上，玉、古埃及饰物、印戒、怀表、日本根付等贴身之物，共同特点是贴身、持久、克制，它们不仅是装饰，更是身份、宇宙观及私人节律的载体 [23][25][26] - 贴身之物是一种把“陪伴”做得很轻的传统，其意义在于持久的、可触碰的陪伴 [4][25] 科技产品的交互哲学 - 许多创新产品倾向于将理想生活投射给用户，追求更聪明、更主动、功能更满的交互，但这往往与人性相悖，因为人们并不爱被教育或学习新东西 [29] - 人们真正需要的是“解脱感”，一个让一切正常运转而无需额外费神的环境，高级的交互应像高级的表演，重在精准的“停顿”而非持续的动作 [29] - 以智能穿戴为例，Oura累计销量超550万枚，但行业数据显示用户App活跃度低、弃用率高，这表明图表、数据评分等“上一代交互”可能只让少数人长期投入 [31] 向内AI的定位与路径 - AI不应仅被视为“无限心智”用于向外生产，其另一条路径是向内，帮助人们理解身体、情绪及难以言说的变化 [32] - 向内AI的作用类似于历史上的听诊器，是将分散的身体信号串联、翻译成日常能懂的语言，并根据用户习惯决定信息呈现的方式与程度 [34] - 理想的健康科技应走“分诊”式的中间道路，既不草率下诊断，也不将信号娱乐化，而是整理模糊感觉，指引轻重缓急，必要时再导向专业检查 [34] - 向内AI需掌握分寸：不吓唬、不夸张、不假装权威，少用“你应该”，多用“你也许可以”，不将每次波动都渲染为新闻或失败 [35] 可穿戴与AI结合的未来意义 - 技术与可穿戴结合的核心意义在于“平权”，即把“理解自身能力”下放，让更多人能在日常中获得清晰的健康线索，而非依赖特权资源 [40][42] - 这种平权不是将每个人变成医生，而是让自我照料像灯、水、路一样成为稳定、低调且不可或缺的日常基础 [43] - 可穿戴设备的意义不止于佩戴算法，更在于将“理解”放回日常，其贴身、长期、安静的特性天然适合观察趋势与节律 [47] - 最终，AI与贴身物件结合的产品形态将进化，但其答案早已蕴含在人类不愿被打扰的习惯及对克制、留白的形式追求之中 [47]

前 Bose 团队创立，睡眠耳塞是下一个入口级机会 ?

深思SenseAI· 2026-01-13 16:18

文章核心观点 - 睡眠是一个被长期忽视但高频、刚需的场景，正成为消费电子行业寻找“下一个手机级入口”的重要方向 [1] - Ozlo公司及其产品Sleepbuds代表了“睡眠可穿戴”赛道的演进趋势，即通过产品定义、功能形态与商业模式的重构，推动睡眠耳塞从小众配件向具备平台潜力的睡眠系统入口演进 [1] - 随着AI、传感器与可穿戴技术成熟，睡眠耳塞正从单一助眠工具演化为连接硬件、软件与健康服务的关键入口型产品，考验对佩戴体验、日常习惯和长期价值的理解 [7][18] Ozlo Sleepbuds产品分析 - **产品定位与形态**：Ozlo Sleepbuds是专门适配睡眠的耳塞，而非通用耳机，提供4种尺寸硅胶耳塞，佩戴稳定且对侧睡友好 [5] - **核心功能升级**：相比前代Bose Sleepbuds II实现多方面升级 [5] - 支持播放播客、有声书等流媒体音频内容，不再局限于白噪音库 [5] - 设备在检测到用户入睡后，自动从正在听的内容切换到遮噪音 [5] - 配备生物识别传感器监测用户呼吸、翻身等动作，续航10小时 [5] - **定价与市场验证**：售价299美元，比前代Bose设备贵50美元，同时提供20美元/月的订阅试用计划以降低用户试错成本 [5] - 在Kickstarter上获得5747位支持者，共筹集1,405,886美元，众筹价与最终零售价接近，表明用户价格接受度高 [6] - **团队背景**：核心团队由前Bose Sleepbuds的产品、工程与算法成员组成，对睡眠可穿戴品类有完整的一线经验积累 [6] 睡眠可穿戴市场空间与增长逻辑 - **睡眠问题规模**：全球约8.52亿成人存在失眠，成人患病率达16.2%，其中严重失眠约4.15亿（7.9%） [9] - **助眠市场总体规模**：2025年约917.6亿美元，预计到2030年达1281亿美元，年复合增长率为6.9% [9] - **睡眠可穿戴细分市场**：2023年市场规模约134亿美元，预计2030年达277.6亿美元，年复合增长率为10.8% [9] - **可穿戴设备出货结构**：2024年全球可穿戴设备出货预计5.379亿台，智能耳机、耳塞占可穿戴市场60%以上，为睡眠耳塞品类提供了主流入口基础 [9] 上一代产品局限与Ozlo的商业模式演进 - **Bose产品复盘**：Bose在2023年停止了Sleepbuds产品线，官方表示尽管存在一批热情用户，但产品未达到期望的采用和普及水平 [11] - **上一代产品受限原因** [13] - 体验不够日常化：使用流程复杂（如必须打开App、只能选内置声音）导致长期坚持率下降 - 场景价值偏窄：仅做遮噪功能，天花板有限 - 价值感难以体现：功能与更便宜的耳塞或白噪音机对比时，用户付费动力不足 - **Ozlo的商业模式重构**：不满足于一次性卖硬件，构建了iOS/Android SDK，希望将睡眠识别与干预能力开放给合作方，并将收入模式延展到软件订阅与健康相关功能（如耳鸣相关AI功能订阅） [12] 国内市场竞争格局与厂商策略 - **主要厂商分类**：分为消费电子/耳机大厂（如安克Soundcore）和智能穿戴/健康硬件厂商（如华米Amazfit）两类 [13] - **安克Soundcore策略**：以Sleep系列（A10, A20, A30, A30 Special）长期围绕睡眠场景打磨产品 [14] - A20主力型号单只重量3.1g，蓝牙5.3，IPX4防水，蓝牙模式续航约10小时，睡眠模式可达14小时，配备580mAh充电盒，并放弃通话功能以优化侧睡佩戴 [14] - 从A30系列开始引入主动降噪、被动隔音及自适应鼾声遮蔽的“三重降噪”体系，从“更安静”升级为“主动对抗睡眠干扰” [14] - A30 Special通过与Calm合作，将Sleep Stories等内容直接接入App，意图将睡眠耳塞变为夜间高频使用的内容载体 [15] - **华米Amazfit策略**：代表产品ZenBuds定位为睡眠场景高度优化的轻量化可穿戴设备，单只约2g，采用Knowles动铁单元 [16] - 产品重心偏向睡眠数据监测与分析，通过Zepp App输出睡眠报告与改善建议，旨在将耳朵端纳入既有的可穿戴与健康产品矩阵，作为健康数据的新入口 [16]

CES 2026 上最狠的电竞外设，Neurable 把脑机接口做进无线耳机

深思SenseAI· 2026-01-08 10:37

公司与产品发布 - Neurable在2026年CES上宣布与惠普旗下游戏品牌HyperX达成战略合作，计划共同开发业界首款集成神经技术的游戏耳机[1] - 该产品将结合人工智能与非侵入式传感器，在游戏过程中实时解读脑电信号，并将其转化为可量化、可用于训练与优化的表现指标[1] - 产品采用Neurable的微型脑机接口技术，可嵌入耳机结构，做到更纤薄、更轻量、外观更“隐形”，以贴近玩家日常使用场景[3] 技术原理与硬件形态 - Neurable过去14年的核心工作是将脑电图技术持续小型化、可穿戴化，让EEG传感器能够嵌入日常形态的消费级耳机中[9] - 传感器被缝入耳罩织物内部，外观几乎不可见，佩戴时基本无异物感，舒适度符合长时间使用需求[9] - 公司早在2024年就曾与Master & Dynamic合作推出采用同一EEG技术的高端耳机产品MW75 Neuro LT[9] 性能表现与实验数据 - 在一项面向半职业电竞选手的初步研究中，Neurable的神经反馈系统Prime在第一人称射击训练任务中带来改进：参与者反应时间缩短43毫秒，命中率提升0.53%，并额外击中近9个目标[3] - 在大学及职业电竞选手群体中，提升幅度更为明显：命中率提升接近3%，反应时间缩短38毫秒，平均额外击中21个以上目标[3] - 记者体验显示，个体差异很大，其同事在完成Prime热身后反应时间缩短了约40毫秒[6] - 对电竞选手与主播而言，毫秒级差距就足以影响胜负与稳定输出[8] 应用场景与功能价值 - 系统提供“实时脑部活动洞察”，可提升玩家表现[3] - 除游戏训练外，Neurable与HyperX还在联合开发一款面向主播的插件，可将主播的专注度呈现在直播画面中，用于检测主播在与观众互动中是否情绪失控[8] - 该插件指标可呈现为“速度计”、点云或进度条等多种视觉形态，形成更有趣的互动玩法，并能与眼动追踪等现有直播插件配合使用[8] - 产品核心价值分为两类：一是即时防疲劳，当系统检测到专注水平持续走低，App会主动建议进行约10分钟的“brain break”[18]；二是长期习惯洞察，随着数据积累，App会输出个性化的规律洞察，形成用户的“专注画像”和工作习惯模型[19] - 用户案例显示，数据可帮助用户发现夜间更容易进入高专注状态，最佳连续注意时长为38分钟，并推测睡前可能是学习新内容的更佳窗口[21] 市场趋势与产业意义 - 从产业角度看，此次发布被视为游戏可穿戴设备的关键升级：市场正从音频、触觉为主的传统外设逻辑，延展到神经数据处理这一更深层的能力[23] - 相关市场目前规模约50亿美元，并预计到2034年将增长至200亿美元[23] - 在这一趋势下，追踪脑电活动有望像监测身体指标一样变得自然、轻量、随时可用，确立了神经技术作为竞技游戏下一代必备工具的地位[23]

想知道下一个Manus在哪里？推荐一个AI2C创业闭门会

深思SenseAI· 2026-01-05 08:02

活动概况 - 活动主题为探讨AI to C应用，旨在解锁下一个百亿美金赛道 [3] - 活动形式包括创业者深度分享、早期项目路演、圆桌讨论及小组面对面交流 [1][4][6][8][11] - 活动为闭门会，仅设40席位，采取审核制 [1][12] 与会嘉宾背景 - **手言（小影科技&影伙引擎创始人）**：公司旗下VivaVideo上线不到两年全球用户突破1亿，视频创作软件矩阵出海覆盖200多个国家和地区，累计用户超90亿 [12] - **玉伯（YouMind 创始人&CEO）**：产品定位为AI学习与创作工具，愿景是构建“万物化稿、稿生万物”的完整创作生态系统 [14] - **空手（智谱 Z.ai 负责人）**：Z.ai平台集成GLM系列大模型，GLM-4.5/4.6发布后，海外付费用户数量在两个月内增长十倍，拥有400万免费聊天机器人用户 [15] - **亚马逊云科技大中华区生成式AI负责人**：亚马逊云科技提供超过240项全功能服务，基础设施遍及38个地理区域的120个可用区 [16] - **何永超（算秩未来研发中心负责人）**：公司专注智能算力解决方案，构建覆盖IaaS、PaaS、MaaS的全栈自研平台，依托数万卡规模算力集群运营经验提供一站式大模型解决方案 [18] - **圆桌主持嘉宾（Linkloud 联合创始人）**：前高瓴创投投资人，关注AI、SaaS领域 [20][21] 讨论议题 - 探讨如何找到AI to C的第一个真实需求 [5] - 探讨AI to C应用的出海策略与打法 [5] - 聚焦从模型到应用、从创作到生产力、从国内到出海首日（Day One）的软件领域 [3] 活动组织方与合作方 - 活动由Sense AI组织，该机构由一线投资人、企业家、AI产品经理、增长专家联合创建，致力于为AI创业者提供全方位加速 [26] - 特别鸣谢亚马逊云科技、Linkloud、Topkick [22] - 合作高校组织包括清华创协、燕南创新 [23] - 合作平台包括上海天使会、算秩未来 [23]

AI2C

Artificial Intelligence

Artificial Intelligence

A16z 4100万美元领投Mirelo，重磅押注欧洲音频大模型

深思SenseAI· 2025-12-27 09:11

公司概况与融资 - 欧洲音频AI公司Mirelo AI近期完成4100万美元种子轮融资，由Andreessen Horowitz (a16z) 和 Index Ventures共同领投 [1][2][3] - 公司团队规模精干，目前仅有约10人 [1][17] - 公司由拥有约10年AI研究经验且兼具深厚音乐背景的联合创始人创立，结合了AI技术与音乐专长 [3][10] 业务与产品 - 公司核心业务是为视频内容和游戏生成全套音频，包括音乐和音效，主打“视频到音频”的自动生成与同步 [1][3][6] - 已开发两个核心模型：音乐模型和“视频到音效”模型，其中“视频到音效”模型在评测中表现领先，为同类最强 [1][6][12] - 产品形态分为面向创作者的B2C产品Mirelo Studio和面向平台/企业的B2B API [2][6][14] - 当前主要用户是AI视频创作者，用于为AI生成的视频添加音效和配乐，长期目标是服务更广泛的视频内容创作者及专业人士 [6][14] 技术策略与优势 - 公司选择自主研发音频基础模型，而非依赖现成的多模态技术栈，因两年前该领域几乎空白，专注音频有机会建立真正的模型优势 [7] - 音频模型相比大语言模型更为轻量高效，其参数量通常在10亿到100亿之间，算力需求比典型大语言模型少50倍 [8][9] - 竞争逻辑不同于大语言模型，音频模型的性能并不随规模爆炸式增长，因此竞争核心是模型研发能力而非资本规模，这为创业公司提供了对抗大实验室的机会 [13] - 创始人的音乐背景在模型构建中至关重要，影响了音乐的表征方式和架构设计，这构成了训练模型时的核心知识产权之一 [10] 市场认知与商业化路径 - 公司认为音频至关重要，引用乔治·卢卡斯的观点，强调声音至少占电影体验的50%，决定视频的氛围和情绪 [15][16] - 商业化采取双路径：通过Mirelo Studio服务消费者和创作者，同时通过API将模型能力提供给AI视频生成等平台 [14][15] - 目前增长势能最大的点是音效生成，因为需求明确且差异化显著，但未来音乐和音效将同步发展 [17] - 公司面临的市场挑战是需要教育市场，改变音频被视为“事后补丁”的现状，让创作者和平台更早、更重视地集成高质量音频 [20][21] 发展计划与愿景 - 获得融资后，公司计划扩大团队，重点招聘研究科学家、产品人员以及市场与销售人员，以支持技术和业务扩张 [19] - 产品路线图包括增强编辑能力、提升音质，目标是覆盖从AI爱好者到专业工作室的更广泛人群 [15][18] - 未来18-24个月的成功标准是推动市场广泛认识到音频对视频成功的重要性，并理解其经济价值，从而创造对高质量音频服务的更大需求 [20][21] - 公司坚持将核心技术团队放在欧洲，认为欧洲拥有优秀的科学家且竞争环境更有利，资本是欧洲过去的主要短板，而此次融资解决了该问题 [11][23]

视频到音效（video - to - sound - effect）模型

视频到音效（video - to - sound - effect）模型

摩根大通资管、贝莱德加码 40 亿美元 L轮，Databricks 估值冲到 1340 亿

深思SenseAI· 2025-12-24 09:03

公司近期融资与经营表现 - 2025年2月16日，Databricks宣布完成超过40亿美元融资，投后估值达到1340亿美元，本轮融资由Insight Partners、Fidelity Management & Research、J.P. Morgan Asset Management领投，Andreessen Horowitz、BlackRock、Blackstone等参与 [1] - 本轮融资距离上一轮融资（当时估值约1000亿美元）不到半年 [1] - 公司披露其第三季度对应的年化营收规模超过48亿美元，同比增长超过55% [1] - 公司AI相关产品与数据仓库业务的年化收入规模均超过10亿美元 [1] - 公司在过去12个月实现自由现金流为正 [1] 公司定位与市场地位 - Databricks是一个面向企业的数据平台，目标是将数据处理、分析等原本分散的工作收拢到同一套工作流中完成，以解决企业数据量膨胀后传统方案存在的性能、成本、维护复杂度和团队协作效率低下问题 [2] - 公司目前拥有约17,909家客户，预估市场份额约16.49%，在大数据分析相关市场排名第一 [2] - 其主要竞争对手包括Azure Databricks（预估市场份额15.82%）、Talend（预估市场份额9.41%）以及Apache Hadoop（预估市场份额9.34%）[2][3] 行业趋势与公司价值主张 - 当前企业领先优势越来越依赖于数据和人才两类新资源，但许多企业仍在使用过时的数据架构，导致系统堆叠、数据分散、流程复杂，数据团队将大量时间耗费在数据搬运、对齐和排障上 [4] - 统一组织内的数据与协作方式成为管理层的长期战略选择，需同时应对三大趋势：数据爆炸（非结构化数据占比上升）、AI成为产品标配、多云常态化 [4][5] - Databricks主要通过两件事应对：一是将数据存储、报表分析、AI/机器学习放在同一平台完成，减少数据在不同系统间搬运带来的成本与复杂度；二是采用按用量付费模式控制开支，并将数据保存在企业自己的云账户中以降低供应商锁定风险 [5] AI作为增长曲线与竞争壁垒 - 企业AI落地的关键在于数据治理底座，Databricks致力于将数据工程、治理、安全与应用层连接成统一底座，这成为企业后期更稳定和刚性的需求 [5] - 公司的增长基于现有业务规模和现金流表现，估值逻辑转变为：平台型主业务提供稳定基础，AI增速提供上涨空间 [6] - 当企业将核心数据通道、权限、治理、调度和工作流都放在Databricks的统一底座上时，迁移成本会非常高，这带来了高用户粘性，使扩张路径更顺，并提高了竞争维度，竞争对手需对齐功能与生态 [6][7] - Databricks在推动企业使用AI Agent时加深与OpenAI、Anthropic的合作，以强化其平台入口地位 [7] 解决企业数据隐形成本 - Gartner指出，糟糕的数据质量会带来显著但未被系统化衡量的隐形成本，主要源于重复操作，如同一份数据被复制多份导致版本偏差，数据指标不一致导致业务端反复会议对齐和返工验证 [8] - Databricks通过将重复流程收敛为更少的系统与更统一的规则来压缩这类浪费，其Lakehouse架构强调减少跨系统同步并统一数据存储，通过原始数据保留、逐层清洗标准化来形成可复用的数据集 [8] - 公司通过Unity Catalog这一集中式治理层，将过去靠人力的流程平台化，使企业能清晰地管理数据访问权限、审计追溯，从而将冗杂的数据工作变成可持续体系，减少隐形成本 [8] 主要竞争对手分析 - Databricks主要面临来自云数据仓库阵营（如Snowflake、Redshift、BigQuery）和云厂商原生生态（如Azure）的竞争 [10] - **Snowflake**：强项在于标准化的数据仓库范式，将存储和计算分离，扩容简单，运维负担小，擅长SQL分析、BI及跨团队数据共享；与更偏“工程与建模导向”的Databricks形成对比，后者在大规模数据处理、复杂数据管道、机器学习与灵活开发上更有优势 [11] - **Amazon Redshift**：是AWS体系内的主力数据仓库产品，优势在于对大规模结构化数据的SQL查询与报表分析，以及与AWS服务的深度整合；更适合以仓库分析为中心且深度绑定AWS的组织，而Databricks更适合需要将数据处理、探索、建模放在同一条生产链路的团队 [12] - **Google BigQuery**：核心卖点是无服务器与弹性，适合对海量数据进行即席查询和BI分析，并有内置的机器学习能力；更适合以查询分析为主、希望减少运维复杂度的团队，而Databricks更适合数据工程与数据科学工作流更重的场景 [13] - **Azure Synapse Analytics**：优势在于整合，将SQL、数据集成、分析与微软工具链放在一个环境，对偏SQL报表与微软生态的企业友好；而Databricks更偏重高强度的数据处理与建模场景 [14][15]

闭源越跑越快之后，DeepSeek V3.2 如何为开源模型杀出一条新路

深思SenseAI· 2025-12-03 17:51

文章核心观点 - 闭源模型在综合能力上持续领先，与开源模型的差距在拉大，尤其在复杂任务上优势明显 [1] - DeepSeek V3.2系列模型通过三项关键技术改进，在效率、后训练算力投入和AI Agent能力上取得突破，实现了在有限预算下接近顶级闭源模型（如GPT-5）的性能，为开源社区提供了新的发展路径 [2][3][6][16] 闭源与开源模型的现状与挑战 - 权威评测指出，在最前沿的综合能力上，闭源模型的性能曲线更陡，开源模型在所有维度上追平变得越来越难 [1] - 闭源模型（如Anthropic、Gemini、OpenAI）在复杂任务上展现出越来越明显的优势，与开源模型的差距在拉大 [1] - 开源模型面临三个关键问题：依赖低效的Vanilla Attention机制限制了长序列场景的计算效率和部署；后训练阶段算力投入不足；在AI Agent场景中，泛化与指令跟随能力显著滞后于闭源系统 [2] DeepSeek V3.2的技术改进与架构创新 - 引入DeepSeek Sparse Attention稀疏注意力机制，旨在显著降低长上下文场景下的计算复杂度，这是相比前代V3.1-Terminus唯一的架构层修改 [2][6] - DSA采用两阶段稀疏化筛选机制：通过“闪电索引”轻量级模块计算索引分数，再根据分数仅对得分最高的Top-k个键值条目进行细粒度计算，将核心注意力复杂度从O(L^2)降低到O(L*k) [7][11] - DSA在多头潜在注意力框架下实例化，采用多查询注意力模式以最大化计算效率 [10] - 2025年9月评估显示，DSA在常规任务上相比密集注意力基线没有性能下降，在AA-LCR长文本推理基准测试中得分比上一代模型高出4分 [11] 后训练策略与算力投入 - 将后训练阶段的算力预算提升至超过预训练成本的10%，通过扩大后训练计算规模来释放更高阶的模型能力 [3][12] - 摒弃传统分阶段微调，采用单阶段混合强化学习方案，将推理、智能体和人类对齐任务合并进行，以解决灾难性遗忘问题 [12][14] - 通过专家蒸馏闭环（先训练专家模型并蒸馏，再通过混合RL优化）和算法底层优化（如推导无偏KL估计器、引入离策略序列掩码）来保证训练稳定性和性能上限 [14] - 构建了DeepSeek V3.2 Speciale版本，在RL阶段移除长度惩罚，允许超长思维链推理，使其在IMO 2025和IOI 2025中斩获金牌，硬实力追平闭源模型Gemini 3.0 Pro [14] 数据流水线与AI Agent能力提升 - 提出新的数据流水线，用于在工具使用场景中培育具有泛化能力的推理 [3] - 推进到大规模的agentic任务合成阶段，构建了超过1,800个不同环境以及85,000个复杂提示，这些大规模合成数据显著提升了模型在agent场景下的泛化能力和指令跟随能力 [3] 对行业与开源生态的意义 - Scaling law的边际收益正在变小，复制从GPT-3.5到GPT-4量级的提升已很难仅靠堆叠数据和算力实现，需要新的科学思路、训练机制和架构范式来打开增长曲线 [16] - 大模型发展被拉回到一个更偏“学术研究驱动”的时代，模型本身不是护城河，能力和落地才是 [16] - DeepSeek为开源社区做出了榜样，展示了如何在有限预算下通过重做架构、训练和重塑Agent体系，走出一条不依赖闭源的道路 [16]

大模型

开源模型

闭源模型

Artificial Intelligence

DeepSeek V3.2

DeepSeek V3.2 Speciale

大模型

开源模型

闭源模型

Artificial Intelligence

DeepSeek V3.2

DeepSeek V3.2 Speciale

Claude Opus 4.5 全面上线，凭什么夺回 Agentic Coding 第一！

深思SenseAI· 2025-11-25 20:42

模型性能表现 - 在单提示词生成Minecraft克隆版测试中，模型生成的角色移动流畅、帧率稳定，支持正常破坏和放置方块、切换方块类型及自由飞行，完成度和可玩性接近真正可玩的沙盒游戏[1] - 在同样的单提示词测试中，Gemini 3 Pro生成的世界无法破坏或放置方块，角色移动略显混乱，仅为基础可看的Demo[2] - 在单提示词生成乐高搭建网站测试中，模型返回完整可用的乐高模型，支持拖动视角、堆叠积木、修改颜色、删除及选择不同形状积木，达到高完成度交互应用水平[3] 效率与成本优化 - 模型引入可调effort参数（低、中、高三档），在同等任务下token消耗相较Sonnet 4.5呈指数级下降[4] - 在medium effort档位，模型追平Sonnet 4.5在SWB基准上的最佳验证分数，但输出token减少约76%；在最高effort档仍优于Sonnet 4.5，同时输出token减少约48%[6] - 模型价格下调至每100万输入token 5美元、每100万输出token 25美元，约为原价格的三分之一，整体性价比提升明显[7] 高级工具调用能力 - 模型在工具调用时不再扫描全部工具列表，而是检索与过滤后只调用与当前子任务相关的部分，显著提升效率[7] - 在解谜保险库Demo中，模型消耗约70万个token成功完成所有关卡，而Sonnet 4.5消耗约800万个token仍未完成解谜[8] - 按官方定价折算，同一任务Sonnet 4.5成本约4美元，而模型成本仅约1美元，体现成本与效率优势[8] 计算机操作能力升级 - 增强版Computer Use能力支持界面缩放，可先放大界面再操作，提升在真实桌面环境中的实用性[10] - 该能力使Agent能检查细小UI元素和复杂控件，如逐像素检查生成页面、读取小字号文本及分析结构复杂界面[10] 无限对话功能 - 无限对话机制自动对较早内容进行摘要与重写，腾出上下文空间，使同一会话线程持续推进，无需频繁新开对话[12] - 该功能显著降低长线项目（如从零共建App、持续打磨文档）的协作成本，为将大模型作为持续在线长期助手提供基础[12][13] 基准测试与竞争格局 - 在Agentic tool use测试中模型得分88.9%，高于Sonnet 4.5的86.2%和Gemini 3 Pro的85.3%[15] - 在Scaled tool use MCP Atlas测试中模型得分62.3%，显著高于Sonnet 4.5的43.8%和Opus 4.1的40.9%[15] - 在Novel problem solving ARC-AGI-2测试中模型得分37.6%，高于Gemini 3 Pro的31.1%和GPT-5.1的17.6%[15] - 模型在编码与工程类任务上保持优势，而Gemini 3 Pro在研究生级推理（得分91.9%）和多语言问答（得分91.8%）上领先[15] 目标用户与应用场景 - 模型理想用户指向专业软件开发者和知识工作者（如金融分析师、顾问、会计师），以及渴望激发创造力、构建新事物的用户[16] - 模型在处理电子表格、演示文稿等办公任务及执行深度研究方面有显著提升，可参与需求梳理、方案设计、实现与跟进的全流程[16]

Fal 联创对话种子轮投资人：从 200 万到 1 亿美金的思考和决策

深思SenseAI· 2025-11-24 11:16

公司概况与业务定位 - 公司是一家面向开发者的生成式媒体基础设施平台，托管图像、视频、音频等多模态模型，通过高速推理引擎和统一API提供服务 [4] - 核心产品形态为统一Model API，调用超过600个图像、视频、音频模型，并提供高性能推理基础设施、SDK和工具链 [4] - 公司总部位于旧金山，2021年成立，创始团队为前Coinbase和亚马逊的工程师 [4] - 公司将“实时视频生成”从演示技术转化为可复用的基础设施 [1] 财务表现与融资情况 - 年经常性收入（ARR）在不到两年时间内从约200万美元增长至超过1亿美元 [1][3][4] - 服务超过200万开发者和300多家企业客户，包括Adobe、Canva、Shopify等 [1][3][4] - 2025年7月完成C轮1.25亿美元融资，估值约15亿美元；2025年10月完成新一轮约2.5亿美元融资，最新估值超过40亿美元 [3][4] 战略转型与市场机遇 - 公司从最初押注数据基础设施果断转向生成式媒体推理平台，在视频生成爆发前夜完成二次创业 [4][5] - 转型契机源于DALL-E 2、Stable Diffusion、ChatGPT和LLaMA等模型的相继发布，AI世界转向直接使用现成模型，降低了使用门槛 [6] - 公司专注于图像和视频推理，避开了竞争激烈的语言模型推理市场，抓住了Stable Diffusion和视频模型带来的早期机会 [11][12] 产品与技术优势 - 视频模型的上线（约10月份）是业务增长的关键转折点，带来了“疯狂”的增长 [3][15] - 公司构建了复杂的系统来动态调度GPU资源，在28个数据中心部署，优化“冷启动”时间至秒级，并通过缓存策略减少模型启动时间 [18] - 技术挑战包括实现多GPU的线性扩展推理，以提升计算效率 [19] - 公司定位“生成式媒体”为全新蓝海市场，不同于抢夺传统巨头的市场，覆盖广告、影视、设计、电商等多个领域 [17] 客户与商业化策略 - 早期客户主要为通用的设计或图像生成应用，部分客户每日花费达数万美元，证明其商业价值 [14][15] - 商业化策略从按需付费转向推动年付合约，以提升收入质量和稳定性，并组建销售团队进行客户转化 [25][29] - 企业客户更关注模型训练方式、输入输出安全性等合规问题，公司已建立应对企业合规和法律问题的能力 [22][23] - 收入是公司的北极星指标，请求数量和团队账户数量为参考指标 [26] 开发者生态与品牌建设 - 公司极度重视开发者体验，通过500多个Slack频道与客户工程师保持紧密沟通，并日常追踪响应速度 [20] - 品牌建设采用更细腻、隐晦的营销方式，如“GPU富裕/贫穷”帽子，通过社交媒体和社区活动自然传播，传统市场营销对开发者无效 [30][32] - 新模型发布是重要的营销和销售机会，公司努力成为第一个支持新模型的平台 [24] 团队管理与文化 - 团队采用扁平化管理，30多名工程师中没有专职的工程经理，每个人都写代码，领导起带头作用但非专职管理 [33] - 招聘注重两点：对优化痴迷（具备数据库或底层系统经验）以及对生成式媒体领域的热情和执着 [35] - 销售团队约6人，包含客户成功团队约10人，销售流程更短，重心是快速筛选潜在客户 [39] - 内部大量使用AI工具，如产品团队使用Cursor辅助编程，销售团队用Clay做线索丰富化处理 [40]

生成式媒体平台

数据基础设施

Artificial Intelligence

Artificial Intelligence

统一Model API

高性能推理基础设施

面向开发者的SDK

别再肝了！Google 发布 SIMA 2，你的下一个游戏搭子可能是个 AI

深思SenseAI· 2025-11-21 12:14

SIMA 2核心能力突破 - 新一代通用智能体SIMA 2与Gemini深度集成，能够在虚拟世界理解并执行自然语言指令，执行连续多步操作[1] - SIMA 2超越简单指令执行，通过Gemini作为推理中枢具备思考和推理能力，能够解释意图并描述下一步行动[2] - 智能体可以理解复杂细致指令，执行冗长任务并给予反馈，互动体验接近真实玩家[5] 技术实现与训练方法 - 训练使用大量带语言标注的人类演示视频，结合Gemini自动生成标注进行强化学习[2] - 具备初步对话式协作能力，能用自然语言向用户解释意图并描述行动计划[2] - 通过反复试验加Gemini反馈评估的闭环实现自我改进，不断学会完成更复杂新任务[11] 多模态与环境适应能力 - 借助Gemini出色多模态能力，可以理解图像、表情符号和简洁语言进行互动[6][7] - 在《我的世界》学会挖矿后，能将采集能力迁移到其他未训练过的游戏中[7] - 在Genie 3新生成的3D模拟世界中，即使未受专门训练也能正确辨别方向并执行指令[9][10] 行业意义与发展路径 - SIMA 2是迈向通用交互式具身智能的重要一步，为机器人领域智能具身化提供核心能力模块[15][16] - 通过大规模多世界数据训练叠加Gemini推理能力，将分散的专用系统能力整合进统一通用智能体框架[15] - 虚拟3D世界为具身智能提供可控低成本训练环境，Gemini加SIMA 2组合让会思考的LLM迈向会动手做事的Agent[14]

具身智能

通用智能体

Software and Internet

Software and Internet