Workflow
28场锦秋小饭桌的沉淀:产品、用户、技术,AI创业者的三重命题
锦秋集·2025-09-03 09:32

多模态硬件入口 - 多视角拍摄设备叠加AI后普及度提升 多模态影像数据具备显著入口价值[20] - AI眼镜产品面向近视人群(中日韩近视率超80%) 因长时间佩戴需求为持续获取人眼视角数据奠定基础[20] - 某大厂AI眼镜出货量达10万+ 主力人群为25-48岁(男女比例7:3) 周末活跃度极高[20] - 眼镜AI调用频率为手机7倍 开始替代小音箱成为新IOT交互入口[20] - 眼镜具备10+tops算力 理论上可运行轻量级AI大模型但耗电问题暂未解决[20] - 未来可能叠加眼动追踪与麦克风阵列波束成形技术 提升AI个性化理解与训练价值[21] 多模态记忆技术 - 多模态记忆串联视频/音频/文本形成完整逻辑链 实现场景复现与高效需求响应[22] - 通过全模态集成与双端压缩技术突破传统记忆模式效率瓶颈 实现海量数据高效利用[22] - 高压缩比技术将10分钟视频压缩至2帧仍保持原性能上限 实现小数据承载全信息[24] - 输入端动态抽帧技术根据画面变化调整频率(5-10帧/秒捕捉快速动作)[24] - 精准搜索技术集成视频/音频/OCR/文本等多模态信息 避免单一文本局限[25] 多模态AI Agent发展 - AI Agent核心在于动态工具选择与上下文感知系统 避免工具箱扩展导致系统崩溃[25] - 正攻克多模态数据整合难题 通过对齐不同模态实现统一语义理解与记忆检索[26] - 分层架构解决工具生态开放后的复杂度问题(上层代理选工具/下层工具执行)[26] - Agent技术趋势从自动化向可复用+生态化演进 用户操作可生成MCP模块形成复用套路[32] - 可能出现AI能力交易市场平台 核心逻辑为AI时代能力可复用[32] 情感陪伴与社交产品 - 情感陪伴产品融入日常生活 兼具情感共鸣与工具价值(如分析聊天记录/设置提醒)[33] - 虚拟角色需打通角色与用户/角色间记忆以提升真实陪伴感 统一风格模板助力社交[33] - Tolan成功切中轻情绪场景并融合工具能力(拍照识图/日程提醒) 但用户context获取方式影响体验[33] AI内容消费与平台 - 新交互方式更易产生新平台机会 否则内容可通过推荐权重调整在原有平台曝光[34] - 用户主动发起的角色互动成为内容产品解法 使Feed流交互转变为问答模式[35] - 从爆款起高楼比空地起高楼更合理 可先通过IP多平台破圈再聚合形成平台[35] 技术供给展望 - 模型大厂因coding商业价值高而重心转回文本模态 多模态理解与生成仍有期待空间[35] - 多模态理解能力待解锁(如精准定位视频片段/融入现实知识) 此为AI抖音难做原因[35] - OpenAI GPT realtime推出使Agent"前台聊天+后台执行"模式可能成为产品范式[36] - 新终端(如autoglm)为Agent操作与AI内容消费提供更大机会 不依赖手机载体[36] 产品工具推荐 - Claude Code较Cursor交互轮次明显减少且更清晰 长期看Cursor价值被压缩[37] - Showrunner通过融合100集对话风格+大语言模型生成内容 用户消费核心为语言非画面[38] - Loom在录屏产品打磨最佳(zoom in/out/编辑/便捷分享等功能完善)[39]