Workflow
端侧推理
icon
搜索文档
未知机构:东北计算机20260128智元VLA端侧推理性能提速15倍并于精灵G-20260129
未知机构· 2026-01-29 10:20
纪要涉及的行业或者公司 * 行业:人形机器人、智能装备、机器人流程自动化(RPA)、企业人工智能、固态电池、计算机[1] * 公司:智元、AutomationAnywhere、C3.ai、LG能源、特斯拉、道通科技、祥鑫科技[1][2][3] 纪要提到的核心观点和论据 * **人形机器人固态电池需求预测**:到2035年,人形机器人领域的固态电池需求可能超过74吉瓦时(GWh)[1] * **智元公司技术突破**:其VLA端侧推理性能提升了15倍,并且已在精灵G2机器人上完成了真机验证[1] * **潜在行业并购**:机器人流程自动化软件公司AutomationAnywhere可能收购企业人工智能软件公司C3.ai,若交易达成,AutomationAnywhere将借此实现上市[1] * **供应链合作**:LG能源将向特斯拉供应用于人形机器人的电池[1] * **地方产业目标**:山东省力争在2026年使机器人和智能装备产业规模突破2000亿元人民币[2] * **公司业绩预告**:祥鑫科技预计年度净利润在1.680亿元至2.000亿元之间,同比下降幅度为44.36%至53.26%[3] 其他重要但是可能被忽略的内容 * 道通科技发布了一份关于公司涉及诉讼进展的公告[3] * 文档中包含了“国产人形机器人每日公告”的标题,表明这可能是一份定期或系列性的行业信息汇总[3]
目标取代AirPods,OpenAI新硬件正式曝光
36氪· 2026-01-13 20:09
OpenAI自研AI硬件产品“甜豌豆” - OpenAI正在研发一款内部代号为“Sweetpea”(甜豌豆)的AI耳机,外观为成熟的入耳式硬件,非此前传言的“笔”,功能上可满足复杂AI运算 [2] - 该产品由苹果前首席设计官Jony Ive操刀设计,目标直指取代AirPods,并重新定义AI时代的随身交互范式 [4] - 产品采用金属材质打造卵石状主机,内置两枚胶囊式单元供耳后佩戴,为高性能芯片与AI运算预留充足空间 [4] - “甜豌豆”计划搭载2nm芯片,旨在实现大部分AI推理任务本地运行,搭配定制芯片甚至可通过指令替代iPhone操作,打破设备间交互壁垒 [4] - 产品计划于2028年9月发布,首年出货目标高达4000-5000万副,已逼近iPhone单品量级 [4] 产品战略与生态布局 - OpenAI于2024年5月以65亿美元收购Jony Ive创办的io硬件公司,完成了从AI算法到硬件设计能力的关键补强 [6] - “甜豌豆”是io团队“为AI时代而生”的无屏交互设备理念的延续,产品摒弃屏幕依赖,通过内置麦克风与摄像头实现环境感知,以主动式AI服务替代被动指令响应 [6] - 该产品不仅是硬件,更是OpenAI构建“AI伴侣”生态的入口,其“订阅服务+硬件终端”的潜在模式可能极大改变传统消费电子的盈利逻辑 [6] AI耳机行业市场与竞争格局 - AI耳机赛道正从概念期迈入高速增长期,2025年第一季度中国线上AI耳机销量同比激增960.4%,单季销量便超越2024年全年 [6] - 全球AI耳机市场规模预计将从2025年的2.17亿美元增长至2031年的6.8亿美元,年复合增长率达20.99% [6] - 目前赛道内已形成三大阵营:1)在外观设计上进行创新、搭载摄像头探索多模态交互的创新派;2)华为、苹果等凭借现有硬件生态将耳机打造成跨设备智慧入口的终端厂商;3)以硬件功底为基石叠加AI能力的传统声学厂商 [7] - 当前AI耳机的核心竞争力在于“主动智能”的能力,即通过持续感知环境与用户习惯,在无需明确指令的情况下提供精准建议,而非停留在“指令等待”的“被动智能”阶段 [7] 行业发展驱动因素与挑战 - AI大模型已能支撑复杂的场景理解,端侧推理成本下降实现了本地运算,多模态传感器技术成熟赋予了传统硬件“视听能力” [8] - 行业面临多重挑战:隐私争议首当其冲,持续环境感知涉及用户数据收集;技术层面需平衡续航与性能、提升多设备协同流畅度及嘈杂环境下交互精准度;市场层面需解决用户对“硬件低价+服务增值”模式的学习成本,并让消费者接受“耳机即智能终端”的认知 [8] - 对OpenAI而言,更大的挑战在于供应链整合,缺乏硬件量产经验的它虽携手富士康保障产能,但4000万副的出货目标仍需跨越良品率、成本控制等多重关卡 [8] - 科技大厂已加速AI耳机的上市进度,“甜豌豆”2028年的发布时间已明显落后 [5] - 相比之下,苹果虽在AI能力上滞后,但凭借出色的供应链与成本优势,已足够在2025年就抢下AI耳机市场 [9]
独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业
Z Potentials· 2025-12-26 11:43
文章核心观点 - AI正从回答问题走向交付结果,导致算力需求爆炸式增长,云端推理面临成本高、延迟和隐私问题,因此算力负载必须向端侧转移 [3] - 万格智元通过自研非GPU推理引擎,实现在消费级硬件上高效运行300亿、500亿等超大模型,旨在让终端设备拥有对标云端性能的本地“大脑”,推动AI普惠 [4][5] - 公司已完成数千万元种子轮融资,其技术突破(如300亿参数模型仅需4GB内存,推理速度达30 tokens/s)使过去不成立的本地AI应用场景成为可能,目标是成为AI时代的“算力供水商” [5][24][30] 行业背景与趋势 - AI Agent时代来临,任务从简单对话转向结果交付(如写文档、订机票),导致token消耗可能呈百倍、千倍甚至万倍增长,算力需求发生真正意义上的爆炸 [3][18] - 当前行业共识认为端侧只能运行小模型且性能需妥协,真正的能力依赖云端,但云端按token计费的模式导致“用得越多、付得越多”的成本难题无解 [3][4][21] - 大多数现有端侧方案仍基于GPU优化,与消费级硬件(内存、显存、成本、功耗受限)的实际情况不匹配,在消费级设备上实现有效大模型推理的工作整体偏少 [17][28] 公司技术与产品 - 核心产品为cPilot端侧算力引擎,通过自研的非GPU推理引擎、算子优化和流式并行模块调度,让超大模型在性能受限的消费硬件上高效运行 [4] - 已实现300亿参数模型在仅4GB内存开销下,推理吞吐率达到30 tokens/s,使本地设备在性能与速度上能够对标云端GPT-4o级别模型 [5][24] - 产品旨在打破端侧只能跑小模型的旧认知,目标是在终端侧实现“终端版贾维斯”,主要应用场景为AI PC、机器人和本地个人助理(纯本地的Claude Code和Manus) [4][15][16] 竞争优势与市场定位 - 差异化在于能在消费级硬件(如16GB内存的普通电脑)条件下,以极低成本和可用速度实现大模型推理,目前在该领域处于领先地位 [28] - 并非为了端侧运行而刻意使用小模型,而是直接将真正的大模型(30B、50B)放到端上运行,优先保证性能足够解决真实需求,再解决长期成本问题 [9][22] - 商业模式上,端侧推理使用户摆脱按token付费,理论上模型服务可免费或极低成本,同时从系统架构层面保障了数据隐私 [21][27] 创始人背景与公司愿景 - 创始人王冠博为清华大学计算机专业博士三年级学生,研究方向为端智能与大模型基础设施,本科期间以全院第一成绩保送清华,拥有丰富的竞赛和科研经历 [10][13] - 公司创立初衷是希望让人人都用得起Agent和大模型,通过端侧推理从根本上解决算力负载和成本问题 [21] - 长期愿景是实现“人人都用得起大模型、人人都用得起算力”,让大模型算力像水一样便宜甚至免费,成为AI时代的“算力供水商”,推动普惠AI [5][32] 公司进展与融资 - 公司于近日完成来自市场化头部基金的数千万元种子轮融资,正推动“端侧普惠算力”路线加速落地 [5][30] - 技术成果已使本地设备具备对标主流云端模型的现实可能,并开启了众多过去因成本与延迟限制而不成立的AI应用场景 [5][27] - 团队由相识七年、有极强粘合度和信任基础的同学构建,除产品外,也注重公司生存、企业文化及员工获得感 [15][29]
AutoGLM深夜开源,千千万万个手机Agent要站起来了。
数字生命卡兹克· 2025-12-09 09:20
智谱开源AutoGLM事件 - 智谱公司于深夜将其手机Agent框架AutoGLM开源 此次开源内容包括Phone Agent框架和AutoGLM-Phone-9B模型 [1][2] - 该框架是手机Agent领域的先驱 于2023年10月25日在CNCC大会上首次发布 经过32个月的研发后开源 [3][5] - 此次开源被视作在豆包手机助手被全面封禁的背景下 为技术世界增添新动力的举措 [5] 开源AutoGLM的技术方案与现状 - 开源方案提供了三种部署模式以解决当前手机端算力不足与隐私保护的矛盾 本地部署隐私性最高 数据不离开设备 云端部署需开发者自行确保安全 混合部署则结合本地与云端优势 [6] - 当前开源的AutoGLM并非系统级助手 不支持后台虚拟屏运行 且受本地模型限制 速度较慢 智能程度有限 [6][7][8] - 该框架目前大约支持50个应用程序 [9] - 安装和使用过程较为复杂 主要面向开发者而非普通用户 [6] 开源AutoGLM的行业意义与历史类比 - 此次开源是当前市场上为数不多的完全开源手机Agent方案 荣耀YOYO智能助手曾使用AutoGLM技术 [11] - 开源可能引发类似Stable Diffusion和LLaMA模型泄漏后的行业效应 即一个开源模型催生出大量应用和变体 成为行业基础设施 [13] - 此举被类比于Linux、安卓、Arduino和树莓派等开源硬件软件的历史 它们通过开放生态从巨头手中撬动市场 激发普通人的创造力 [14][15][16][17][18] - 开源可能改变“入口”的定义 未来入口可能不再是某个公司的APP 而是用户自己部署的本地Agent [19] 对AI助手未来的展望 - 未来十年 人们可能会习惯身边有长期伴随的AI助手 帮助处理起床、行程安排和信息过滤等任务 [24][25] - 技术发展也可能带来过度外包记忆、判断和品味的风险 进而可能引发新的“数字极简主义”潮流 [26][27][28] - 技术本身不替人类做价值选择 只是提供更多可能性 最终如何生活取决于人类自身的选择 [29] - 当前时代是AI技术发展的灿烂起点 集体意志将由豆包封禁、AutoGLM开源以及个人选择共同塑造 [29][30]
用豆包手机的这两周,我好像卷入了一场新与旧的战争。
数字生命卡兹克· 2025-12-08 10:47
豆包手机助手遭遇封禁事件 - 搭载豆包手机助手的努比亚手机首批3万台现货全部售罄 [2] - 作者作为早期测试用户,因使用豆包手机助手执行微信任务,导致个人微信账号被限制登录 [15][19] - 随后阿里系应用(支付宝、淘宝、闲鱼、盒马)及腾讯系应用(QQ)等主流APP相继对账号进行封禁或限制调用,严重影响日常使用 [19][21][25] - 豆包手机助手自身也进行了功能限制,导致涉及主流APP的任务无法执行 [25] AI手机助手与超级APP的入口之争 - 互联网发展史是控制入口的战争,从浏览器、搜索框到如今的超级APP(如微信、抖音)[30] - AI手机助手(Agent)旨在成为用户与所有服务之间的统一入口,用户只需与AI对话,由AI协调后端服务,这压缩了超级APP原有的用户交互和变现链路 [31][40][42] - 这种模式对超级APP构成“生死存亡级别的威胁”,因为用户将不再直接与平台交互,平台可能从主导者退化为服务提供者 [42][46][51] - 当前各大超级APP对豆包的封禁,被类比为历史上铁路威胁漕运利益时,旧有利益集团对新技术进行的阻挠 [32][34][35] Agent技术发展趋势与挑战 - 当前隐私问题的根本解决方案在于端侧推理:随着手机芯片算力提升和模型压缩技术进步,未来小型化模型(如8B或9B参数)可在设备本地运行,确保用户数据完全不离开手机 [49][50] - 技术发展路线明确:端侧算力提升、视觉模型压缩、系统级能力增强是必然趋势,封禁无法从根本上阻止该技术方向 [63][64] - 技术实现路径清晰,但核心挑战在于“利益的再分配”,即现有掌握入口的巨头不愿放弃其主导地位 [51] 对行业格局的长期影响 - AI Agent与超级APP的对抗,是继搜索vs门户、电商vs商场、移动互联网vs PC之后的新一轮入口之争 [60][61] - 历史规律表明,新秩序诞生初期混乱且痛苦,但秩序稳定后,大部分参与者的命运将由早期的幸存者决定 [69][70] - 长期来看,Agent技术形态终将到来,可能以不同品牌、交互形态或由现有APP自身推出的形式出现 [64][66] 对用户的短期与长期建议 - 短期建议:不要将所有关键服务依赖于尚不成熟的Agent,可将其用于处理非敏感任务,避免提交敏感信息 [67] - 长期建议:鼓励用户积极尝试和参与早期生态建设,以塑造未来技术形态,而非被动接受既定结果 [68]
“读万卷书”不如“行万里路”!芯原股份掌舵人戴伟民详解AI芯片下一站:端侧推理与场景落地
新浪证券· 2025-11-14 12:08
行业趋势:AI芯片市场发展 - AI定制化芯片(AI ASIC)需求正显著增长 [1] - GPU与AI ASIC是相辅相成的关系,GPU侧重通用灵活部署,AI ASIC侧重极致性价比 [3] - AI模型持续演进和更新,对算力提出了全新、多样化的要求 [4] 技术演进:AI发展路径 - AI发展需从“读万卷书”(大语言模型训练)跃迁至构建理解人类情感和复杂场景的“世界模型” [4] - 未来AI需要处理空间、物理和上下文信息,进行真正的“思考” [4] - 端侧主要进行推理和微调两种AI计算工作 [5] 市场机遇:端侧AI潜力 - 端侧推理崛起,在手机、汽车、智能眼镜、物联网设备等终端上进行模型推理和微调是未来AI落地和商业化关键 [5] - 端侧智能将成为比云端训练更大的市场机遇,是下一个万亿级黄金赛道 [8] - 端侧应用的核心在于可“离线”执行,体验更流畅自然且注重隐私和安全 [7] 公司战略:芯原股份布局 - 公司在AI加速处理器(如GPU、GPGPU、ASIC)上均有布局,可为不同应用场景定制芯片 [3] - 公司核心战略是依托半导体IP储备和芯片设计服务能力,为端侧革命提供AI ASIC解决方案 [8] - 公司看好AI在智能眼镜上的应用,认为这是一个潜在的增量市场,可实现实时离线语音翻译和场景交互 [7] 应用场景:端侧AI实践 - 在智能手机上,通过AI相关定制芯片可实现远超当前的拍照效果、画质优化和功耗控制 [7] - AI玩具是教育领域的重要颠覆,可通过搭载小模型根据孩子所见所闻即时生成故事并模仿父母声音讲述 [7] - 智能眼镜、AI玩具等端侧应用蕴藏巨大商机 [6][7]