模型小型化与成本优化 - 14B模型使用显卡在零售业应用成本可控制在万元级别 若不用显卡 CPU可运行7B 8B模型 [1] - 8B模型适用于人流预测 商品检验 导购 14B可做简单报表分析 32B提供图谱指引 数据预警 70B可模拟区域经理角色 [2] - 32B模型在成本 效率 精准度间平衡较好 采用4张A770显卡方案可支持36-48台设备 整机成本4万-5万元 [8] - 单张酷睿Ultra SoC可支持14B模型 每秒生成12个token 无需独立显卡时CPU可直接运行7B 8B模型 [9] 零售业AI应用场景 - 零售场景AI最早实现商品自动识别 后扩展至AI自助防损 源于芯片算力冗余 [3] - 生鲜识别为最早落地应用 通过摄像头采集图像计算SKU 后续发展AI+通道识别 AI团餐识别方案 [3] - AI自主防损解决2%-3%未成功扫描问题 ToF传感器识别80%无意扫描异常 某超市每日平均止损65次 人力介入后日止损1066元 [5] - 大模型技术提升传统AI应用能力 如遮挡物品识别 1 5B模型仅能简单问答 7B 8B可文案生成 14B具备总结能力 32B-70B达专业水平 [7] 端侧芯片技术发展 - 端侧小模型对算力要求不高 独立GPU非必选项 与数据中心方案差异明显 [2] - Intel 18A制程进入风险试产 2024Q4量产 14A计划2027年试产 Panther Lake处理器将支持POS机运行大模型实现数字导购 [9] - 端侧推理CPU进步显著 但架构组成多元 x86目前主导笔记本市场 Arm阵营因省电特性有望快速成长 预计2029年Arm架构笔记本占40%份额 [10] 行业合作与案例 - 绝味食品与腾讯智慧零售发布AI垂直大模型 应用于顾客互动 智能排班 库存预测 [7] - 天虹股份子公司开发百灵鸟AI大模型 用于AI搜索推荐 导购功能 [7] - 工控主板厂商吉方工控采用英特尔CPU+显卡方案 评估万元级成本可服务20人公司 替代门店员工10万元/年成本 [8]
70B模型能当零售业区域经理!小模型加速端侧落地,芯片不一定要GPU