模型小型化

搜索文档
人间清醒朱啸虎:AI应用即将大爆发,下个“小红书”今年应该已经成立了!
创业邦· 2025-09-15 11:41
以下文章来源于出海研究院 ,作者AI观察员 来源丨出海研究院(ID: uniquerglobalai ) 作者丨AI观察员 图源丨Midjourney 要聊当下AI行业最有意思的观察者,朱啸虎一定在名单前列。这位金沙江创投的主管合伙人,从来不 爱说场面话,他的判断往往直白甚至带点"泼冷水",但正因如此,总能给行业带来最清醒的提醒。在 2025 Inclusion外滩大会上,他再一次给出了自己的思考:AI的能力边界其实已经显现,而真正的机 会,恰恰在模型之外。"明年应用肯定会大爆发,所以下一个字节,下一个快手,下个小红书,今年 应该已经成立了" 。 出海研究院 . 聚焦出海研究,深耕企服生态 2025 DEMO CHINA「AI创新应用专场」招募开启 产品能 Dem o,就有机会入选《2025早期AI创新先锋50强》,直面200+投资机构~ 点击右边链 接,专属报名通道走起➡️ 创业邦·2025 早期 AI 创新先锋50强报名表 AI行业的天花板与新机遇: 大模型之外的思考 朱啸虎的观点,总是从对行业现状的冷静判断开始。他认为,当前AI能力的上限已经基本明朗,这反 而为创业者带来了更多机会。 1. GPT-5: ...
朱啸虎论AI创业:避开大厂竞争,如何在AI外构建竞争优势?
搜狐财经· 2025-09-01 20:49
AI行业发展趋势 - GPT-5未达预期突破 核心智力提升空间有限 主要优化用户体验和成本 [3] - Transformer架构的AGI能力上限已明确 未来进步空间极为有限 [3] - 模型小型化成为未来两三年关键趋势 通过精简数据降低使用成本 [3] - 中国每日大模型Token消耗量突破30万亿 呈现爆发式增长 [4] - 文字类AI应用去年爆发 语音类今年崛起 视频类预计下半年至明年爆发 [4] 创业环境与竞争态势 - AI Agent创业门槛和成本降低 但市场竞争愈发激烈 [1][4] - 硅谷VC要求产品上线且达到200万美元ARR才考虑投资 [4] - 中国创业公司短期内可达到200万美元ARR 但需12个月内实现更高ARR才能获得持续关注 [4] - 真正爆发式增长的应用门槛极高 需在AI外建立护城河如编辑能力、复杂工作流整合能力 [5] - 会议纪要、AI专有硬件等领域技术门槛低但实用价值大 商业机会多 [5] 投资策略与成功案例 - 投资AI创业公司成功案例寥寥无几 绝大多数将回归地面 [1] - 模型能力上限明确反而为创业者提供更多涌现机会 [3] - AI创作者社区公司通过复杂编辑能力满足用户图片生成优化需求 [5] - AI眼镜等硬件产品在大湾区供应链优势下具备快速解决问题能力 [5] 技术挑战与突破方向 - 数据瓶颈和推理天花板成为主要问题 盲目增加参数和数据量可能损害模型性能 [3] - AI内容实时生成存在延迟 但未来两三年内延迟将大幅降低 [4] - 海外大厂探索AGI前沿 国内应聚焦模型小型化路线 [3]
最新发声!金沙江朱啸虎:远离大厂“炮火”,建立AI之外的“护城河”
搜狐财经· 2025-08-31 18:04
AI产业趋势 - AI大模型能力上限已基本明朗 GPT-5在核心智力上提升空间非常小 更多是用户体验和成本优化[4] - 模型小型化是未来两三年重要趋势 通过精简和提炼数据降低使用成本 国内更适合走此路线[4] - 数据瓶颈和推理天花板限制发展 盲目增加模型参数和数据量可能损害性能[4] 应用层发展 - AI应用Token消耗量大规模爆发 中国每日大模型消耗Token突破30万亿[6] - 文字类AI应用去年已成熟 今年语音类应用开始爆发 语音模型几乎无法分辨人声差异[6] - 视频类AI应用预计今年下半年或明年爆发 未来延迟可能降至1秒左右 颠覆内容生成方式[7] 创业环境变化 - AI Agent应用创业门槛大幅降低 3人团队即可创业 创业公司数量比以往多一个数量级[9] - 竞争更加残酷 硅谷VC要求产品上线后达到200万美元ARR才投资 中国公司3个月可达此标准[9] - 用户留存是核心挑战 第二个月续费率低 召回用户成本可能达10倍以上[9] 商业化路径 - 头部公司产品年增长可达10倍以上 稍大公司也能增长四五倍[10] - 技术成熟领域更易商业化 如会议纪要自动生成病历 节省医生时间[12] - AI专有硬件发展迅速 包括会议纪要卡片 AI电子名牌 AI眼镜等 需依托大湾区供应链优势[12] 竞争策略 - 需远离大厂直接竞争 所有护城河都要在AI之外寻找[1][12] - 编辑能力和复杂工作流整合能力可形成壁垒 如AI图片生成最后5%的细节微调[12] - 核心是定义好产品而非技术是否性感 需聚焦实际交付结果和用户付费意愿[9][12]
最新发声!金沙江朱啸虎:远离大厂“炮火”,建立AI之外的“护城河”
中国基金报· 2025-08-31 18:00
AI产业现状与趋势 - 当前Transformer架构下的AGI能力上限已基本可见 GPT-5在核心智力提升空间有限 更多是用户体验和成本优化[5] - 模型小型化是未来两三年重要趋势 通过数据精简和提炼降低使用成本 国内更适合走此路线提升性价比[6] - 大模型消耗量爆发式增长 中国每日Token消耗突破30万亿 部分企业单日消耗超百亿 较去年增长数十倍[8] 应用层发展路径 - 应用发展呈现从文字到语音再到视频的演进脉络 文字类应用去年已成熟 语音类今年爆发 视频类预计明年爆发[8][9] - 语音应用效果取决于拟真度 用户识别出AI的挂断率达80% 未识别的挂断率仅25%[8] - 视频生成延迟目前需10-30秒 未来两三年可能降至1秒以内 实现近乎实时交互[9] 创业环境变化 - 创业门槛显著降低 3人团队即可开发AI应用 创业公司数量较移动互联网时代增加一个数量级[11] - 投资门槛提高 硅谷VC要求产品达到200万美元ARR才投资 国内企业3个月可达此标准但12个月需达到500万美元ARR[11] - 用户留存成为关键挑战 第二个月续费率低 挽回用户成本可能达获取成本的10倍[12] 核心竞争力构建 - 技术壁垒难以建立 需在AI之外寻找护城河 如编辑能力、工作流整合能力等[14] - 商业化成功案例集中在实用场景:医疗病历自动生成、会议纪要硬件、AI电子名牌、电商客服等[14] - 硬件创业依赖供应链优势 大湾区100公里内聚集全部供应商 可快速解决量产细节问题[14] 产品与市场匹配 - 产品需超越"炫酷"演示 实际交付结果需达到用户付费标准 头部公司年增长率可达4-10倍[12] - 简单但有效的产品更易推广 如电商AI客服准确率99%且价格低廉 已获广泛采用[14] - 产品定义比技术先进性更重要 需聚焦真实需求而非追求"性感"技术[14]
70B模型能当零售业区域经理!小模型加速端侧落地,芯片不一定要GPU
第一财经· 2025-06-04 16:47
模型小型化与成本优化 - 14B模型使用显卡在零售业应用成本可控制在万元级别 若不用显卡 CPU可运行7B 8B模型 [1] - 8B模型适用于人流预测 商品检验 导购 14B可做简单报表分析 32B提供图谱指引 数据预警 70B可模拟区域经理角色 [2] - 32B模型在成本 效率 精准度间平衡较好 采用4张A770显卡方案可支持36-48台设备 整机成本4万-5万元 [8] - 单张酷睿Ultra SoC可支持14B模型 每秒生成12个token 无需独立显卡时CPU可直接运行7B 8B模型 [9] 零售业AI应用场景 - 零售场景AI最早实现商品自动识别 后扩展至AI自助防损 源于芯片算力冗余 [3] - 生鲜识别为最早落地应用 通过摄像头采集图像计算SKU 后续发展AI+通道识别 AI团餐识别方案 [3] - AI自主防损解决2%-3%未成功扫描问题 ToF传感器识别80%无意扫描异常 某超市每日平均止损65次 人力介入后日止损1066元 [5] - 大模型技术提升传统AI应用能力 如遮挡物品识别 1 5B模型仅能简单问答 7B 8B可文案生成 14B具备总结能力 32B-70B达专业水平 [7] 端侧芯片技术发展 - 端侧小模型对算力要求不高 独立GPU非必选项 与数据中心方案差异明显 [2] - Intel 18A制程进入风险试产 2024Q4量产 14A计划2027年试产 Panther Lake处理器将支持POS机运行大模型实现数字导购 [9] - 端侧推理CPU进步显著 但架构组成多元 x86目前主导笔记本市场 Arm阵营因省电特性有望快速成长 预计2029年Arm架构笔记本占40%份额 [10] 行业合作与案例 - 绝味食品与腾讯智慧零售发布AI垂直大模型 应用于顾客互动 智能排班 库存预测 [7] - 天虹股份子公司开发百灵鸟AI大模型 用于AI搜索推荐 导购功能 [7] - 工控主板厂商吉方工控采用英特尔CPU+显卡方案 评估万元级成本可服务20人公司 替代门店员工10万元/年成本 [8]