端侧大模型
搜索文档
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
新浪财经· 2026-02-04 20:20
公司战略与市场定位 - 公司于2023年行业“百模大战”时,战略转向专注于端侧大模型,此决策初期受市场质疑,直至次年苹果入局端侧才验证其判断 [2] - 公司当前战略清晰,正全力推进端侧布局,包括发布支持“即时自由对话”的大模型以及计划在年中发布首款AI硬件“松果派”以支持硬件场景全栈开发 [2] - 公司核心理念是“知识密度定律”,认为大模型知识密度约每100天提升一倍,导致模型保鲜期短,因此核心竞争力在于构建能持续产出高知识密度模型的系统,而非单一模型 [14] - 作为创业公司,公司认为端侧市场分散、长尾且场景多样,并非统一市场,这为创业公司提供了切入细分领域、避免与大厂直接阵地战的机会 [15] - 公司定位为连接芯片厂商、终端厂商和开发者的重要媒介,2025年发力重点之一是建设开发者生态 [10] 核心产品与技术突破 - 公司于2024年2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,参数规模为9B [3][25] - MiniCPM-o 4.5是原生全双工的全模态模型,实现了“边看、边听、主动说”的端到端能力,支持即时自由对话,交互方式高度拟人,看、听、说并行不阻塞 [3][4] - 该模型两大核心创新为:1) 全双工机制,多模态输入输出互不阻塞;2) 全模态自主交互机制,模型可自主判断语义成熟度以触发输出 [4] - 技术挑战在于将图像、语音、指令等多种能力统一训练至单一模型,需精细把握训练动态以避免知识冲突,最终在保持文本和指令能力的同时实现了SOTA级全模态表现 [4][5] - 模型通过架构优化实现低延迟,采用“主干模型+轻量级语音生成模块”设计,并依赖高效推理框架llama.cpp-omni,降低了计算开销 [7][10] - 模型当前记忆时长约1分钟,为推理最佳“舒适区” [7] 开发者生态与硬件布局 - 2025年上半年在深圳的调研显示,当地涉及端侧模型的AI硬件项目中,超过一半在使用公司的MiniCPM模型 [11] - 公司推出首款AI原生端侧智能开发板“松果派”,旨在降低开发者在多模态设备上运行、微调和对齐模型的难度,构建软硬一体、全栈覆盖的端侧AI软件体系 [11][13] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,计划于2025年年中量产上市,初期不以盈利为目的,主要承担市场教育功能 [13] - 公司硬件由合作伙伴设计,自身负责整合应用,核心仍聚焦于端侧原生模型的研发,通过商业化落地验证模型能力并建立数据飞轮 [13] 运营效率与组织文化 - 公司内部推行AI原生计划,不到200人的团队在10个月内完成2000万行代码,按传统方式估算需700人完成 [16] - 其中一位核心员工在一个月内编写了65万行代码,通过将核心系统接入AI并重构,大幅提升效率 [16] - 公司内部出现“一人公司”趋势,小团队或个人可完成过去需团队数月完成的工作 [17] - 公司对“AI Native”的定义是:接到任务首先考虑用AI完成,并追求比人工完成得更好,AI已深刻影响其思维方式和工作模式 [17] - 公司招聘注重吸引“AI原生人才”,要求员工具备利用AI作为内在工具发现、解决问题并判断结果质量的能力 [17] 行业趋势与未来展望 - 公司判断端侧与云端的协同将是未来长期主流形态,智能终端是模型能力延伸的重要载体 [18] - 当前大部分产品仍依赖云端,存在延迟、隐私和安全问题,而端侧模型在实时性要求高的任务中不可或缺,价值在于本地即时处理与快速响应 [18] - 手机在大模型应用上仍有巨大空间,未来需提升其“输入”侧的环境感知与理解能力,但这在资源受限的终端上面临技术和工程挑战 [19] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键 [19] - 多模态/全模态能力是未来多智能体体系的基础,智能体之间的协同是必然选择 [19] - 通用人工智能的发展有两条主线:智能能力持续增强,以及智能的实现与使用不断高效化 [20] - 预计未来1-2年,模型的交互与专业能力将快速提升,具备更强自主学习能力;随后多智能体协同将成为重点;长远看模型将展现创新创造能力 [20] - 展望未来3-5年,每个人可能拥有一个在终端侧持续成长、越来越懂自己的大模型助手 [20]
AI硬件革命来了
虎嗅APP· 2026-01-25 22:11
OpenAI AI硬件产品规划与颠覆性技术 - OpenAI计划于2026年下半年推出首款AI设备,采用无屏幕、语音核心、10-15克可穿戴设计,年度计划出货量高达4000万至5000万台 [4] - 该产品被视为对统治世界近20年的智能手机的挑战,其核心是赌市场和社会能否从“所见即所得”转向“所说即所得”的交互模式 [4][7] 技术架构与创新 - **感知系统**:设备依赖“听觉+视觉+生物传感”的多模态传感器矩阵实现情境预判,而非简单指令响应 [9] - **听觉模块**:采用高灵敏麦克风阵列与xMEMS超声波驱动单元,工作频率达40kHz以上,响应时间低于10微秒,配合自适应均衡算法实现自然音效与骨传导私密输出 [10] - **交互模型**:开发了支持边听边说的端到端音频模型,允许用户中途打断并即时调整输出,实现类人对话节奏 [11][12][13] - **视觉与环境感知**:内置微型摄像头通过计算机视觉识别场景、物体及用户手势表情,配合加速度计、陀螺仪等传感器感知用户状态,实现如自动会议纪要等“贴身助理”功能 [14] - **生物传感**:首次民用化肌电传感器,采样率高达2000Hz,能通过捕捉嘴唇或喉部肌肉电活动实现“默读即输入”,误触发率控制在0.1%以下 [15][16] 计算核心与本地化能力 - 设备“大脑”预计为三星定制的2纳米Exynos芯片,晶体管密度达300 MTr/mm²,性能功耗比提升34%,以在微小体积内实现高端手机级算力与18小时以上续航 [18][19] - 芯片支持本地运行“蒸馏版”大语言模型,通过量化、剪枝技术将万亿参数模型压缩至十亿级别,在8GB LPDDR5X内存与128GB UFS 4.0存储支撑下实现离线语音理解与多轮对话,将响应延迟降至微秒级并解决隐私泄露痛点 [20] 研发背景与供应链挑战 - 为推进硬件,OpenAI于2025年5月以65亿美元收购了由苹果前首席设计官Jony Ive创办的硬件公司io,并从苹果、谷歌挖角数百名硬件工程师 [24][25] - 研发周期规划显示,设备原型机已进入内部测试,从概念设计到2026年下半年发布的节奏符合硬件正常研发周期 [25] - 供应链面临挑战:台积电2026年2纳米产能预计每月约10万片,苹果已预订一半,留给OpenAI的产能有限 [27] - 定制组件如肌电传感器与xMEMS单元良率爬坡周期可能长达3-6个月,核心组件良率从80%提升至95%可使单台设备成本降低约30美元,对299-399美元的定价策略至关重要 [31][32] 市场影响与行业重塑 - 无屏AI设备是“反注意力经济”,可能动摇基于屏幕时长的互联网经济根基,使传统搜索引擎优化死亡,被AIO取代 [41][42] - 若设备首年达到5000万用户存量,可能导致全球移动广告市场一年内萎缩5%-10%,数百亿美元广告预算转移至AI推荐算法竞价排名 [43] - 将重新定义可穿戴设备价值核心,从“健康监测+娱乐”转向“AI协同+效率提升”,倒逼苹果、谷歌、小米、华为等厂商跟进,引发新一轮技术竞赛 [43] - 预计到2028年,全球无屏AI可穿戴设备市场规模将突破500亿美元,占整个可穿戴设备市场的25% [43] - 上游2纳米芯片、xMEMS超声波单元、柔性肌电传感器需求将爆发,台积电、三星、xMEMS等企业直接受益下游将催生基于AI情境框架的全新“硬件+算法+服务”应用生态 [43] 应用场景与效率提升 - 在办公领域,语音转写、实时翻译等功能可将会议效率提升40%以上,每年为职场人士节省约375小时,相当于增加47个工作日 [46] - 在教育领域,设备能实时记录课堂内容并生成个性化笔记,帮助提升学习效率对老年人,语音交互能降低使用门槛,缩小数字鸿沟 [47] - 预计到2030年,全球60岁以上老人中无屏AI设备的渗透率将达20% [48] 潜在社会影响与挑战 - AI设备普及将加速就业替代,据预测到2027年AI将替代全球约8500万个工作岗位,行政助理、翻译等岗位替代率最高达30%以上 [51][52] - 设备“环境感知”能力引发隐私担忧,据调查78%的用户担心无差别监听,65%的用户反对采集生物特征数据,若隐私防护不足可能引发信任危机或被限制使用 [54][55] - 合规是另一挑战,设备需适应不同地区隐私法规如欧盟《通用数据保护条例》和美国加州《消费者隐私法》,获取认证过程可能需要半年时间,进度滞后可能导致发布推迟 [33][34][36] 量产时间表评估 - 综合考虑技术磨合、供应链与合规问题,2026年下半年推出“Beta版”或“开发者版”是可能的,但实现全球大规模消费级量产可能至少要推迟到2027年 [37]
PORTABLE 100 瓦折叠便携太阳能板
新浪财经· 2026-01-08 16:26
产品发布与定位 - 公司在CES 2026上发布了全球首款机器人形态智能手机ROBOT PHONE [1][4] - 该产品被定位为荣耀阿尔法战略的核心落地项目,被视为有温度的、全新的智能生命体 [4][7] - 产品没有激进抛弃传统手机形态,而是在保留日常使用习惯基础上,增加了“会动”“会看”“会想”的能力,以温和方式描绘下一代智能终端图景 [4][7] 产品核心技术与功能 - 产品背部集成了隐藏式三轴机械臂云台,轻点屏幕即可自动展开,实现灵活转动、智能跟拍与专业级防抖 [3][7] - 相比传统光学防抖或电子防抖,其机械云台方案支持更大角度的物理补偿,在动态拍摄中能有效抑制画面抖动且不牺牲画质 [3][7] - 产品搭载了公司自研的端侧大模型YOYO,具备情感感知与主动服务能力 [3][7] - YOYO大模型可通过多模态传感器识别用户情绪、使用习惯及环境状态,主动推送内容、调整设备参数,并联动全场景生态设备 [3][7] 产品状态与上市计划 - 目前展示的机型仍为工程样机,但已接近最终量产形态 [4][7] - 公司确认该产品计划于2026年上半年正式量产 [4][7]
星宸科技(301536) - 301536星宸科技投资者关系管理信息20251229
2025-12-29 19:58
经营现状与未来展望 - 公司发展进入关键转折期,前期AI SoC研发投入进入成果集中产出阶段,业务将从稳健增长步入快速增长,且增长态势预期可持续较长时间 [2] - 近期经营基本面持续向好,海外市场布局成效显著,车载前装等核心项目逐步落地,推动产品结构优化与中高端升级,带动营收与盈利水平提升 [2] - 外延并购作为扩大业绩规模的辅助手段,将与内生增长形成高度协同,提升公司竞争力 [2] 2025年开发者大会新品发布 - **车载激光雷达**:发布车规级dToF激光雷达SPAD芯片SS905HP(高线数)与SS901(低线数),覆盖超1000线至192线分辨率,SS905HP最大探测距离300-600米,系统架构简化,在可靠性、功耗、体积等核心指标上业内领先 [3] - **车载视觉感知与辅助驾驶**:推出12nm工艺SAC8905,定位L2级辅助驾驶,集成32Tops NPU,支持BEV、Transformer算法,2027年联合国际车厂量产;SAC8712定位L1级,已导入多家Tier1,2026年上半年批量发货;SAC8901/SAC8902定位舱内外视觉感知,其中SAC8901已在理想等车企交付,将于2026年上半年交付至一汽大众等车厂 [3] - **边缘计算**:发布SSR670,集成8Tops算力与本地大模型,支持32路解码,可搭配可拓展算力架构,落地高端边侧智能硬件 [4] - **智能机器人**:发布第三代机器人芯片SSU9366,适配户外、陪伴等机器人;将尽快推出面向具身智能机器人大小脑的SoC芯片,规划分布式算力芯片组,覆盖16T至128T算力 [4] - **移动视觉**:发布ISP6.0,HDR动态范围达140dB,支持AI HDR算法消除鬼影;EIS新增地平线锁定功能;可适配第二代智能眼镜等移动影像设备 [4] - **智能工业**:发布新一代智能PLC主芯片SSD2366GI,满足控制、分析、通信并行处理及工业AI多模态推理需求,后续沿“工业HMI→工业PLC→工业机器人→人形机器人”路径拓展 [4] 核心市场战略 - 目标5年内成为L2级及以下车载视觉全场景市场最领先的供应商,该市场体量庞大且竞争格局相对清晰 [6] - 核心策略包括:深耕海内外客户,相关产品已在30多家海内外客户导入或即将量产;海外重点突破日本市场;聚焦高确定性优势赛道,避免同质化竞争;依托技术与供应链优势保障产能与成本 [6] 商业模式与供应链 - 采用“芯片+内置存储”一体化方案,为客户提供“交钥匙”服务,形成差异化壁垒 [7] - 每年KGD采购量过亿级,与多家主流存储供应商密切合作,凭借规模效应优先锁产能、争最优价 [7] - 在行业缺货背景下,外挂存储问题促使客户转向公司内置存储产品,带来增量订单并提升公司定价能力 [7] 海外市场与客户拓展 - 公司全球布局广泛,直接与间接销售的海外占比过半,是海外智能视觉市场最主要的芯片供应商 [8] - 导入海外头部端侧大客户的机会明确,得益于产品矩阵多元、视觉效果认可度高、算力功耗成本平衡适配需求,以及强有力的海外技术支持团队 [9] 具体业务进展 - **车载激光雷达芯片**:已进入客户对接落地阶段,第一批产品将于2026年上半年量产;产品定位中高端差异化,在线数、分辨率、探测距离、点云密度、可靠性上具备显著优势 [9] - **机器人芯片业务**:今年出货量超过千万颗,后续增长具备确定性;正在拓品类及中高端化,切入大型户外机器人、陪伴机器人、工业协作机器人等多个细分领域;核心瞄准“泛机器人赛道”,目标成为该赛道领先的芯片供应商 [9]
面壁智能再获数亿元融资,加速端侧大模型商业化落地
搜狐财经· 2025-12-23 17:38
公司融资情况 - 北京面壁智能科技有限责任公司于近期完成新一轮数亿元融资 [1] - 本轮投资方包括京国瑞、国科投资、中金保时捷基金、米聚资本与和基投资,呈现多元化特征 [1] - 募集资金将主要用于加大端侧高效大模型的研发投入,并加速端侧AI的商业化进程 [1] 公司业务与产品 - 公司是国内较早布局端侧智能领域的大模型厂商 [3] - 已构建起包括MiniCPM(面壁小钢炮)系列在内的端侧模型产品谱系 [3] - 其模型已在汽车、手机、PC及智能家居等多个领域实现规模化落地 [3] 公司合作伙伴与落地案例 - 公司与吉利、长安、大众、华为等多家企业达成深度合作 [3] - 2024年4月,公司与长安马自达、梧桐科技共同打造的首款端侧模型量产车型——长安马自达MAZDA EZ-60已上市 [3] - 2024年9月全球发售的吉利银河M9搭载了其MiniCPM多模态模型,旨在打造新的人车交互体验 [3]
华米OV竞速AI,谁都不想成为“诺基亚”
36氪· 2025-12-23 12:29
文章核心观点 - 全球智能手机市场呈现“冰火两重天”格局:一方面硬件创新乏力,用户换机周期延长至约51个月[2];另一方面,以AI为核心定义的新一代手机正成为行业增长的核心驱动力,开启新时代[1][4] - AI手机短期内未能显著提振整体市场销量,但在高端市场已显现拉动作用,是头部厂商必须争夺的战略高地[11][13] - 主要手机厂商正通过巨额研发投入、差异化AI战略以及构建生态,争夺未来“个人智能生活核心中枢”的地位,以避免在技术变革中被淘汰[15][16][30] 市场现状与数据 - **整体市场疲软**:全球智能手机平均年换机率已降至23.7%,换机周期约51个月[2];2025年1-10月中国智能手机出货量约2.33亿台,同比微降0.3%[11] - **AI手机增长预测**:2024年全球新一代AI手机出货量预计达1.7亿部,占整体15%[3];预计2027年中国市场AI手机份额将超50%,2026年全球渗透率将突破35%[4] - **2025年第三季度中国市场竞争格局**:vivo以17.2%份额位列榜首,但同比下跌7.8%[8];苹果份额15.8%,同比微增0.6%[9];华为份额15.2%,同比跌1.0%[9];小米份额14.7%,同比跌1.7%[9];OPPO与荣耀份额分别为14.5%和14.4%,同比变化为+0.4%和-1.5%[9];市场头部六大品牌合计市占率达91.8%[11] 厂商AI战略与投入 - **巨额研发投入**:vivo在AI领域投入已超230亿元[13];OPPO研发投入超百亿[13];荣耀未来5年计划投入100亿美元于AI[15];小米未来五年AI研发投入将超2000亿元[15] - **战略定位差异化**: - **vivo**:专注“深度个人化智能”,首发3B参数端侧多模态推理大模型,构建以“蓝心智能体”为核心的主动服务体系[17][18] - **华为**:构建“全场景生态底座”,通过盘古大模型、鸿蒙内核及昇腾AI云服务实现全栈深度优化[17][18] - **小米**:定位“高效驱动人车家生态”,通过云端高效模型和澎湃OS,让AI成为硬件生态网络的效率核心[17][18] - **OPPO**:打造“记忆共生与生态协同”的个人化AIOS,通过On-Device Compute和PersonaX引擎提供专属体验[17][19] - **荣耀**:构建“开放连接的终端生态”,通过HONOR AI Connect平台和“1×3×N”生态战略连接泛在AI服务[17][18] - **技术路径转变**:从过去依赖云侧的文本处理,转向深度嵌入“端侧大模型”,实现场景理解、预测需求等“独立思考”能力[16] AI对高端市场的影响与挑战 - **高端市场拉动作用显现**:在4000-6000元高端赛道,vivo市场份额从8.8%增至14%[11];小米2024年高端手机全球销量突破1000万台,同比增长43%[11] - **成本压力严峻**:行业进入“超级成本周期”,内存成本上涨显著[27];预计到2026年底,旗舰手机内存成本占比将从8%升至14%,单机成本从52美元增至73美元,涨幅41%[28];中低端手机内存成本占比可能飙升至34%[28] - **入口地位受挑战**:智能眼镜、汽车、头显等终端正在争夺“下一代人机交互入口”控制权[28][30] 产业链与生态支持 - **SoC算力突破**:旗舰机AI算力自2017年以来增长20倍,2025年SoC人工智能计算极限预计超60TOPS[20];高通第五代骁龙8至尊版NPU性能提升37%,支持每秒220 tokens端侧生成速度[21];联发科天玑9500超性能NPU峰值算力较前代提升111%[22] - **应用生态共建**:手机厂商需与应用开发者合作,解决端侧化、AI与OS结合及上层应用建设问题[24];vivo、OPPO等厂商积极寻求接入豆包等第三方AI应用[24] - **中国芯片自给率提升**:摩根士丹利预测,2027年中国AI芯片自给率将达82%[24] 行业未来展望 - **手机中枢地位短期稳固**:人均每日手机接触时长108.76分钟,用户粘性犹在[30];手机是目前集成顶级算力、成熟生态、便携性与高频刚需的“完美交点”,是承载复杂AI智能体的最佳条件[30] - **AI是战略必选项**:在消费市场低迷和硬件创新瓶颈下,AI是支撑产品溢价、避免掉队的关键[25];对于头部厂商而言,布局AI是一场“不加入就淘汰”的生死战[13][26]
三星憋大招:本地大模型上车S26,手机AI的端侧大战要打响了?
36氪· 2025-12-20 17:08
手机AI技术发展现状与厂商策略 - 过去一年,手机厂商AI动作密集,荣耀YOYO接入更多第三方智能体实现系统层与应用层AI能力对接,华为小艺可通过一句指令在应用间穿梭完成任务[1] - 当前手机AI功能本质上仍需联网使用,仍困在端云协作阶段,未实现进一步突破[1] 三星的本地大模型布局 - 近期有消息透露,三星计划在即将发布的Galaxy S26系列上准备一套能够在本地运行的大模型,用于实现大部分AI功能,该模型甚至拥有高级权限,能在必要时清除内存以确保响应[1] - 三星在2023年曾展示名为“高斯”的本地大模型,并曾被指出已预装在Galaxy S25系列中,但之后力推Google的Gemini,近期其本地大模型才被重新提及[3] - 在多数厂商仍以云端为主的阶段,三星尝试将模型真正放进手机,可能预示着手机AI新阶段即将拉开帷幕[3] 端云协同方案的现状与逻辑 - 短期内手机AI不会放弃端云协同策略转向纯本地部署,端云协同在当下是几乎完美的方案[4] - 云端承担模型规模、复杂推理和快速迭代任务,优势在于云服务器算力资源充足,便于模型更新、统一治理和安全审查[4] - 端侧负责对接用户第一道指令,如唤醒、语音识别、基础意图判断,然后将复杂请求转交云端完成[4] - 该分工逻辑对偶尔使用AI的用户体验影响不大,对厂商而言不会过多占用手机资源,性能稍差的手机也能使用[4] - 三星Galaxy S26系列内置大模型的策略大概率不会开放给旧机型,这构成了区别[4] 端云协同的短板与端侧模型兴起动因 - 端云协同逻辑的前提是AI使用频率不高,但随着手机AI发展方向转向“替你完成操作”,AI开始尝试理解屏幕内容、拆解任务目标、规划执行路径,形成完整AI Agent链路[7] - 一旦AI进入高频、连续、系统级交互场景,端云协同短板会迅速放大,例如弱网环境下云端响应延迟会导致操作出现明显断点,连续指令场景中网络中断可能让整个流程停滞[7] - 近期厂商频繁讨论“端侧大模型”,并非要彻底抛弃云端,而是希望把更多即时判断和关键决策留在设备本身,端云协同仍是当前阶段的最优解[7] 端侧大模型落地面临的挑战 - 本地大模型在手机端落地难主要受限于明确的硬件约束,内存、算力和功耗是端侧AI的三个核心条件[8] - 模型常驻后台会对系统资源形成持续占用,内存条件甚至迫使苹果提升了iPhone的内存空间[8] - 稳定性和维护成本也是挑战,云端模型可快速迭代、即时修复错误,而本地模型一旦部署,优化节奏只能依赖系统更新,对于系统级AI意味着更高风险和测试成本[8] 硬件进步推动端侧模型成为现实 - 2025年芯片能力大幅提升,让手机纯端侧大模型几乎成为现实[10] - 以第五代骁龙8至尊版为例,其Hexagon NPU在本地生成式任务中已可实现约200 token/s级别的输出速度,使端侧模型能够进行连续、自然的语言生成,这是AI执行复杂交互指令的前提条件[10] - 联发科天玑9500在NPU 990上引入更激进的能效设计,官方称在3B规模的端侧模型上,其生成效率提升的同时整体功耗还有明显下降,这意味着端侧模型开始具备更现实的常驻可能[10] - 搭载最新一代旗舰芯片的新机已利用芯片算力提升推出各种AI交互功能,例如荣耀的YOYO智能体在Magic8 Pro上已能够支持多达3000+场景的自动任务执行[10] 纯端侧AI实现复杂任务的现实难度 - 即便硬件进步,用纯端侧AI实现复杂任务仍有难度,例如被爆料内置本地大模型的Galaxy S26也需要通过定期清理系统资源来确保模型常驻运行[11] - 这本身说明完全依靠端侧模型去承载复杂AI任务在短期内仍然不现实[11] 主流厂商方案与行业趋势 - 从目前主流厂商选择看,端云协同仍然是最稳妥的方案,例如华为小艺的核心架构依然是典型的端云协同,端侧负责感知和基础理解,云端承担复杂推理[12] - 当AI开始深度介入系统和服务层,稳定性、效率和资源控制比激进部署更重要[13] - 今年引人关注的变化是AI开始尝试接管“操作权”,例如豆包手机助手尝试把大模型能力前移到手机交互层,让AI直接理解屏幕内容、规划操作路径,甚至模拟用户完成跨App行为[13] - 豆包手机助手、华为小艺、荣耀YOYO、小米超级小爱等一系列开启了“自动驾驶”的手机AI,代表着下一阶段AI手机必须掌握的前进方向[16] 端侧大模型的未来定位与影响 - 端侧大模型不会在短时间内彻底改变手机AI的整体方向,当前主流厂商的选择都是端云协同方案[16] - 手机并非为大模型而生的设备,必须在性能、功耗、稳定性和安全之间找到平衡点,一旦AI深度介入系统操作,就不能让用户体验出现问题,因此厂商不会贸然跟进[16] - 端侧大模型可能不会成为手机发布会上的“爆点”,但将悄然抬高旗舰机的技术门槛,让有端侧和仅云端的AI手机在AI功能实现的体验上出现差距,这个分水岭或许在不久的将来就会到来[16]
豆包和智谱,二线手机厂商的救命稻草
钛媒体APP· 2025-12-11 20:35
行业趋势与市场预测 - 埃隆·马斯克预测未来5到6年内传统智能手机及独立应用程序将会消失,未来设备将成为“AI推理的边缘节点”,主要负责显示、音频和通信,复杂任务由云端与本地AI协同完成[2] - IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,同比增长31.6%,占据整体市场的53%[17] - 端云结合将成为主流服务模式,厂商将更多调用外部云侧大模型,同时专注于端侧多模态模型的轻量化与深度推理能力建设[17] 新一代AI手机的核心突破 - 新一代AI手机的核心突破是“端侧大模型”的深度嵌入,将大型AI模型直接装入手机,赋予设备独立“思考能力”,可离线快速处理复杂任务并跨应用操作[7] - 早期手机厂商的AI功能多聚焦于单点辅助,如拍照美颜、智能翻译、简单日程提醒等,无法跨应用完成复杂流程[5][6] - 行业数据显示,新的协同模式使AI手机功能落地周期从早年的12个月缩短至3个月,应用覆盖场景从不足20个扩展至100多个[12] 豆包AI手机案例 - 豆包联合中兴推出努比亚M153工程机,被称为“豆包AI手机”,原价3499元,首批3万台已售罄,二手平台全新未拆封版本报价3999到4999元不等,最高报价炒至3.6万元,并衍生出日租金50到79元的短期租赁业务[2] - 该手机通过“系统级嵌入”将豆包大模型嵌入安卓系统底层,获取底层权限,能调动所有系统资源和APP,实现跨应用自动化操作,例如全网比价下单[7] - 首发仅3天后,该手机遭遇多家平台的使用限制,豆包紧急下线部分功能以适配各平台安全规范,官方强调这只是一款工程样机,公司没有开发手机的计划[9][10] 智谱的AutoGLM开源策略 - 智谱开源了AutoGLM模型,其凭借GLM-4.5与GLM-4.5V双模型驱动,具备强大的屏幕理解与操作执行能力,可稳定应对长达数十步的复杂任务流程[3][8] - 该模型已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,用户一句语音指令即可触发AI自主完成点外卖、订机票等操作[8] - 智谱采取“安卓式开放”思路,将包含50多个高频APP操作能力的AutoGLM模型、Phone Use框架及工具链全面开源,支持厂商“拿来即用”,快速形成生态[11] - 为解决安全问题,智谱将AI Agent置于云端的虚拟手机中运行,每个动作可回放、审计、干预,敏感数据严格隔离,并通过开源和私有化部署让使用方掌控数据[13][14] 生态竞争与行业影响 - 豆包与智谱采取了两种不同的落地路径:豆包将AI“下放”到手机底层系统以实现强大控制力;智谱通过开源与合作伙伴共建生态,但两者本质都是在争夺“AI时代的操作系统入口”[15][16] - 传统手机厂商正在为AI生态投票:豆包在扩展与更多手机厂商的合作;荣耀、三星则与智谱达成战略合作[16] - 苹果宣布将联合阿里巴巴为中国用户开发iPhone的AI功能[17] - 当AI Agent可以直接调度多APP完成服务,超级APP的用户留存、广告变现、数据壁垒将被瓦解,按周鸿祎的说法,这将“冲垮互联网大厂护城河”[18] - 用户习惯“一句话完成任务”后,超级APP将从“流量守门员”转型为AI Agent的“能力供应商”[19] 发展挑战与未来关键 - AI手机助手处于早期探索阶段,其直接调动系统能力引发了数据安全风险,各大公司出于安全考虑采取限制措施是可以理解的[10] - AI Agent面临的最大问题之一是如何在合规层面建立“AI操作认证体系”,以有效区分正常辅助与恶意外挂[20] - AI Agent在手机上的落地不仅是技术问题,更是生态协同问题,最终胜出者将是能平衡“用户体验、商业利益、安全合规”的生态协调者[20]
扒一扒安谋科技AI战略,这些IP产品够辣吗?
傅里叶的猫· 2025-11-27 11:33
公司战略与产品发布 - 公司于2025年11月密集发布“周易”X3 NPU IP与“星辰”STAR-MC3 CPU IP两款产品,标志着“All in AI”产品战略正式落地 [1] - 自研IP是“AI Arm CHINA”战略的核心支柱,旨在形成覆盖多场景的AI算力供给能力,从端侧AI推理到物联网AI赋能 [1] “周易”X3 NPU IP技术突破 - “周易”X3 NPU IP采用DSP+DSA混合架构,单Cluster算力达8-80 FP8 TFLOPS,单核带宽256GB/s,在Llama2 7B模型测试中,Prefill算力利用率72%,Decode带宽利用率超100% [3] - 该产品同算力下AIGC大模型能力提升10倍,通过架构创新提升有效性能,解决了端侧大模型效率低、精度差、适配难的痛点 [3] - 技术革新包括从传统定点计算转向浮点计算,支持FP4/FP8/FP16多精度融合,并采用W4A8/W4A16混合精度模式降低带宽消耗 [5] - 自研WDC硬件解压引擎可额外获得15%等效带宽,动态Shape技术减少无效计算,破解端侧“内存墙”难题 [5] - 软件层面Compass AI平台开源核心组件,支持Hugging Face模型一键部署,大幅降低开发门槛 [5] “星辰”STAR-MC3 CPU IP市场定位 - “星辰”STAR-MC3 CPU IP基于Arm v8.1-M架构,集成Arm Helium技术,着眼于AIoT领域的普惠化,显著提升CPU的AI计算性能 [6] - 在智能门锁场景中,搭载STAR-MC3的MCU可本地实现人脸识别,响应延迟低于300毫秒,功耗仅为传统方案的60% [6] - “星辰”系列已支撑超5亿颗物联网芯片出货,覆盖智能家电、工业传感器、可穿戴设备等领域 [6] - 产品演进体现“AI下沉”战略思路,从基础控制到增加安全功能,再到第三代强化AI能力,将AI算力渗透到物联网毛细血管 [6] 产品矩阵与技术研发 - 公司形成“周易”、“星辰”、“山海”SPU、“玲珑”多媒体IP四大IP协同矩阵,覆盖算力、安全、多媒体,满足从端侧推理到物联网赋能、从单一计算到多模态融合的全场景需求 [8] - NPU团队自2018年成立以来,已形成全栈式研发能力,从硬件架构到软件工具链100%实现本土开发与交付 [8] - 公司通过校招、社招吸纳全球AI人才,并与国内顶尖高校开展产学研合作,围绕大模型、具身智能等前沿领域进行技术攻关 [8] 市场反馈与战略价值 - 某智能汽车客户采用“周易”X3 NPU后,ADAS系统的环境感知延迟从50毫秒降至15毫秒,同时功耗降低40% [9] - 某物联网厂商基于“星辰”STAR-MC3开发的智能传感器,AI识别准确率提升至98%,开发周期缩短50% [9] - 自研IP是连接全球技术与本土需求的关键纽带,承接Arm架构能效优势并通过本土化创新适配中国市场场景需求,从底层算力推动AI在千行百业渗透 [9]
进博会开放首日,有啥“黑科技”?
21世纪经济报道· 2025-11-06 09:55
展会概况 - 第八届中国国际进口博览会在上海正式开幕 [1] - 3、4号馆作为全球"黑科技"首秀场,展现未来生活图景 [1] - 本届进博会共展示461项新产品、新技术、新服务 [1] 技术趋势 - 展馆内各类融合人工智能与尖端科技的创新产品亮相 [1] - AI技术在产业领域"落地开花",端侧大模型应用更加成熟 [1] - 展示成果中包含大量全球"高精尖"的科技创新成果 [1] 产品应用 - AI终端产品如AI眼镜、AI PC、机器人机器狗已融入生活 [1]