Agent OS
搜索文档
离开小米后,他赌耳机才是AI硬件的最优解|甲子光年
新浪财经· 2026-01-21 18:25
文章核心观点 - AI硬件发展的关键分水岭在于操作系统,而非硬件形态本身,未来的趋势是软件定义硬件,并由一个统一的Agent OS来协同多设备工作 [2][7][64] - 光帆科技认为,一个随时可用的AI助理的理想载体并非标新立异的“新物种”,而是基于用户已有使用习惯的日常设备进行深度智能化改造,其产品Lightwear选择了“耳机+智能耳机盒+手表”的组合形态 [4][6][9] - 公司押注的方向是构建一个全新的、端云结合的Agent操作系统,这是实现通用AI助理和“一个大脑,多个设备”愿景的核心技术壁垒 [7][26][27] 产品理念与硬件形态选择 - 选择耳机作为主要入口是基于降低用户接受门槛的策略,类比苹果当年改造手机而非推出全新iPod touch的思路,目标是实现AI助理的“全天候可用” [9][10] - 将传统充电配件耳机盒升级为集成了GPS、指纹识别、独立联网等功能的传感与计算节点,以扩展设备能力 [11] - 联动手表以补充显示和简单交互(如卡片化信息呈现),并集成人体传感器增强感知,形成与手机、PC场景互补的“需求漏斗”,优先解决80%的轻量化需求 [13][14][15][17] - 判断耳机形态在至少未来十年内都是最优解之一,虽然眼镜形态潜力更大,但面临用户接受度和技术成熟度的长期挑战 [47][104][105] Agent 操作系统的核心设计 - 操作系统必须从零开始构建,因为传统的图形交互系统(如iOS、安卓)的代码架构不适用于以多模态交互为核心、且需要端云协同的AI时代 [27][28][85] - 操作系统采用端云结合架构是现实选择,因为效果好的大模型动辄上百亿参数,无法在端侧运行,且可穿戴设备用户在线率高达约98%,对话交互对延迟不敏感 [30][31][89][90] - Agent OS的核心特性是“全感知”与“主动性”,其最重要的任务是划清操作系统、大模型与第三方应用之间的职责边界,以实现高效协同 [33][39][92][98] - 操作系统需完成三大核心工作:硬件调度(管理多传感器与跨设备协同)、应用接入、以及基于多传感器数据融合与用户理解的“多模态混排”式交互 [35][94] 技术实现、成本与供应链 - 产品进行了“大改”,最大的创新赌注之一是专为AI感知设计的弧面摄像头,该设计涉及复杂的光学、材料与工艺调整,旨在弱化攻击感并保护隐私 [19][76] - 当前制造成本高昂主要源于两方面:一是几乎所有部件均为定制件;二是因缺乏高集成度芯片而需使用多颗芯片,增加了复杂度与体积 [20][77][78] - 通过向供应链展示在现有品类上改良的合理预期与AI落地潜力,说服了供应商合作,产业链厂商因担心错过AI时代机会而愿意尝试 [23][81] 应用生态与商业模式演进 - Agent OS上的应用形态将发生根本变化,应用(APP)将存在于云端,没有传统图形界面,用户通过自然语言与统一的AI助理交互,背后由不同的云应用承接需求 [41][42][101] - 在真正的AI时代,类似手机时代的独立“超级应用”(如抖音)可能难以再现,商业模式将围绕新的业态重新构建 [43][102] - 与第三方应用厂商(包括部分大厂)的合作基础在于能为它们带来手机生态之外的增量价值、新场景与新流量 [40][99] 公司战略与运营 - 公司团队规模约100人,其中软件相关员工占一半以上,硬件创新侧重与成熟产业链伙伴协同 [51][109] - 在技术变革期,招人更看重对创新的渴望程度和学习能力,而非完全匹配的经验 [52][53][110][111] - 产品计划于1月启动公测,并在公测后于一季度正式量产,未来将持续迭代现有产品并探索由系统反推的新硬件形态 [55][114][115] - 公司初期聚焦国内市场,但会很快向海外拓展,面对竞争持开放态度,更倾向于产业协作而非完全闭环 [57][116][117]
竞购Chrome的Perplexity,为什么要做AI浏览器?
虎嗅· 2025-08-16 09:06
AI浏览器市场格局 - Perplexity向Alphabet提出345亿美元收购Chrome的邀约 这一出价超过其自身200亿美元估值[1] - OpenAI宣布未来几周发布AI浏览器 将重新思考用户浏览方式并与Operator集成[12] - The Browser Company于6月向Arc用户开放Dia浏览器Beta测试[30] Comet产品特性 - 采用多模型架构 集成OpenAI、Anthropic及自研DeepSeek模型[6] - 侧边栏AI助手可基于当前页面context执行任务 包括跨应用操作和复杂工作流[3][41] - 支持语音指令和个性化设置 等待名单超50万人 目前仅限Perplexity Max订阅用户使用[5][37] 技术实现路径 - 基于真实用户数据构建PPLX Bench基准测试集 避免模型过拟合学术基准[8] - 采用监督微调(SFT)和强化学习(RLHF)优化模型 使用DeepSeek设计的GRPO算法[10] - 动态构建训练数据 结合表现不佳的prompt与通用能力prompt[9] 商业模式创新 - 设计分层收费:免费版提供基础AI功能 付费版支持高价值场景如私有数据处理[16] - 用户愿为省时服务付费 案例显示Comet用5分钟完成原需2-3小时工作并节省200美元[17] - 拒绝广告驱动模式 认为Google将凭借垄断广告网络保持优势[14] 产品定位差异 - Comet侧重任务执行 在搜索摘要、跨应用操作和协作功能上表现突出[38][41][46] - Dia专注于工作流管理 Skill功能支持自定义代码和多标签页协同[46][51] - a16z测评显示Comet在8个维度领先 Dia在2个维度占优 4个维度持平[35] 行业发展趋势 - 浏览器成为AI代理操作系统(Agent OS)的理想平台 可无缝集成现有工作流[23][24] - 记忆(Memory)功能是解锁主动型AI的关键 需在操作系统或浏览器层面实现[57][61] - 预计2025年初将普及能完成简单工作流的代理 复杂研究任务代理将在2-3年内成熟[55][56] 竞争优势构建 - AI浏览器根本优势在于数据本地化处理 服务端无法访问用户数据[27] - Perplexity最关注用户留存率 目标是将Comet设为默认浏览器以提升日请求量[13] - 架构设计实现"按需使用数据但不收集"的平衡 避免数据用于训练或广告[29]