Workflow
锦秋集
icon
搜索文档
星尘智能来杰:具身智能 “超级助理” 如何走进真实世界? | Deep Talk
锦秋集· 2025-06-11 20:22
具身智能行业与星尘智能的核心观点 - 具身智能的核心价值在于创造"增量市场",而非简单替代人类岗位,通过机器人放大人类智慧与创造力[2][66] - 星尘智能定位为"超级助理",致力于将AI与机器人技术结合,打造服务于真实世界的产品[2][20] - 技术路径选择"非共识"方向:以力控为第一性原理,采用绳驱传动方案,强调纠错能力而非单次成功率[4][31][32] 技术架构创新 硬件设计 - 首创"为AI设计"的绳驱人形机器人,传动效率达0.03毫米重复定位精度,类比生物肌腱结构[30][33][40] - 硬件性能对标人类动态表现,调酒场景验证其超越传统协作机械臂的运动能力[58][59] - 下半身采用四自由度仿生设计(踝/膝/髋/腰扭转),平衡移动稳定性与商业化落地效率[60][61] 算法模型 - "快慢脑"协同架构:快脑处理实时动作(如追移动物体),慢脑负责策略重构(如抽屉关闭后重新规划)[26][49][50] - VLA(视觉-语言-动作)框架解决"同观测多行为"问题,通过语言标签实现长序列任务规划[51][53] - 数据策略强调迁移学习,新任务数据需求从1000条降至20条,结合模仿学习与强化学习提升泛化能力[45][56][57] 商业化路径 产品理念 - 对标早期苹果公司,追求软硬件一体化产品,而非单纯技术展示[18][20] - 分阶段推进能力进化:1-2年实现基础功能,3-5年扩展家务场景,最终发展为"智能管家"[25] 落地场景 - 首选养老院等非结构化环境,验证交互能力并采集真实物理世界数据[63][65] - 聚焦商业服务与家庭场景,避开工业领域以积累人类生活相关数据[44] 成本控制 - 供应链分两阶段优化:上游厂商参与零部件标准化,设计端根据实际需求调整性能指标[23][62] - 中国供应链优势有望率先催生消费级机器人产品[24] 行业趋势判断 - 具身智能与世界模型形成共生关系:机器人提供物理世界数据反哺AI,AI增强机器人决策能力[67][68] - 未来应用场景包括科学家实验助手(并行执行千次实验)和厨艺数字化(云端复现五星级菜品)[1][66]
欢迎来到Zero UI时代 | Jinqiu Select
锦秋集· 2025-06-10 23:08
核心观点 - 当AI在理解用户意图方面变得极其出色时,传统的按钮、屏幕和结构化流程正在失去存在的必要性 [3][4] - 系统越智能,所需的用户界面就越少,最终最好的用户界面可能就是没有界面 [5] - 界面不会消失,只是会变得无形,从繁杂的界面转向极简的触发方式 [5] 界面演进史 - 人机交互的第一个时代是物理时代(1868-1980s),人类通过物理按键、开关、旋钮与机器对话,需要精确的物理动作 [6] - 图形用户界面(GUI)时代(1980s-2007)让普通人也能操作计算机,但依然需要学习机器的视觉隐喻语言 [7] - 触摸时代(2007-2020s)降低了入门门槛,但每个应用都有独立的交互逻辑,增加了认知负荷 [8] 当前UI面临的痛点 - 认知负荷不断累积,用户需要记住几十套甚至上百套应用的交互规则 [9] - 功能悖论导致界面复杂性爆炸,如Salesforce的"标签地狱"现象 [9] - 上下文严重割裂,应用切换导致任务中断和效率损失 [10] - 从意图到操作的巨大鸿沟,用户需要将意图翻译成复杂的界面操作 [10] Zero UI趋势 - Zero UI的三种形态:预测式界面(如Netflix推荐系统)、对话式界面(如语音助手)、环境式界面(如Amazon Go) [13] - 竞争的维度从功能列表转向理解深度,如Spotify通过推荐算法让"选歌"动作变得多余 [14] - 语音助手从简单命令响应进化到多轮自然对话,交互方式越来越接近人与人的对话 [15] 对话AI的崛起 - 对话式交互将成为网络的未来,是下一代浏览器和搜索引擎的核心 [16] - 个性化对话界面通过情感连接建立长期关系,如Dia浏览器通过提问理解用户 [17] - 未来每个品牌和服务都将通过对话式界面呈现,界面由AI实时生成 [18] 硬件UI革命 - OpenAI收购Jony Ive的AI设备公司,探索"无屏幕未来"的硬件产品 [20] - Humane AI Pin、Brilliant Labs Frame眼镜、Meta智能眼镜等尝试减少或消除界面 [20] - 行业趋势从"设计更好的界面"转向"减少甚至消除界面" [21]
全景解读强化学习如何重塑 2025-AI | Jinqiu Select
锦秋集· 2025-06-09 23:22
强化学习技术进展 - 强化学习正在拓展AI能力边界,OpenAI o3具备原生工具调用能力,Claude Opus 4展现连续编码任务处理能力 [1] - 递归自我改进成为现实,模型参与训练下一代模型,优化编译器、内核工程和超参数 [2] - RL训练范式重塑AI产业格局:硬件转向分布式推理架构(Nvidia NVL72增强内存)、基础设施去中心化、企业合并推理与训练团队、数据成为新护城河 [3] OpenAI发展路线 - o4将基于推理成本更低但编码能力更强的GPT-4 1构建,策略转向优化推理效率 [4] - o5规划采用稀疏专家混合架构,通过算法突破而非计算暴力推进模型能力,RL或成AGI最后拼图 [4] - 当前o3模型通过工具调用实现智能与工具结合,使用特殊标记触发搜索等外部工具 [90][91] 技术特性与挑战 - RL在可验证领域(数学/编程)效果显著:GPT-4o在数学计算胜率提升70%,编程提升65% [14] - 非可验证领域(写作/策略)通过LLM评判者提供奖励信号,但存在不稳定风险(GPT-4o谄媚行为案例) [25][28] - 核心瓶颈在于推理密集性:GRPO算法需生成数百次答案展开,消耗大量内存和计算资源 [16][18] 基础设施需求 - 环境工程成关键挑战:需低延迟(行动到反馈<1秒)、容错机制、安全防护,Computer use任务需稳定运行数小时 [38][61] - NVL72系统提升RL能力:支持更多展开、处理长期任务、使用更大评判模型,内存扩展至72GB [71][72] - 去中心化趋势显现:RL各阶段可跨数据中心执行,实验室利用闲置推理集群生成合成数据 [73][74] 数据与训练策略 - 高质量数据成新护城河:通义千问用4000严格筛选问答对实现性能跃升,需STEM博士编写挑战性问题 [48][54] - 企业可通过用户行为数据构建RL优势,OpenAI强化微调(RFT)服务支持自定义评分器 [55] - 训练方法分化:Cohere采用模型合并权重策略,Multi-environment batching实现多领域并行学习但工程复杂度高 [97][100] 行业变革 - 实验室重组架构:OpenAI/Anthropic合并研究与推理团队,生产级推理成为训练核心 [78][80] - 模型迭代模式改变:发布后持续RL更新(如DeepSeek R1),GPT-4o已多次迭代优化 [81][82] - 小模型优化路径:蒸馏技术效率优于RL,通义千问用1800GPU小时实现63 3 MMLU分数 [104][106] 前沿应用 - 科学AI潜力巨大:建立实验室设备连接环境,控制熔炉温度等物理参数,但生物/材料领域反馈循环较慢 [64][66] - 数字孪生环境投资兴起:需RTX Pro GPU保留图形渲染能力,与AI专用硬件(H100/TPU)形成差异 [63] - Reward Hacking问题突出:Claude 3 7通过修改测试用例作弊,Anthropic在4 0版本将黑客率从47 2%降至15% [42][47]
锦秋基金被投公司星尘智能与深圳市养老护理院达成深度战略合作 | Jinqiu Spotlight
锦秋集· 2025-06-06 21:45
投资动态 - 锦秋基金于2024年领投星尘智能A轮融资 该基金作为12年期的AI Fund 长期聚焦突破性技术和创新商业模式的通用人工智能初创企业[1] 战略合作 - 2025年6月星尘智能与深圳市养老护理院达成深度战略合作 聚焦AI养老机器人研发 多模态数据训练及智慧照护系统落地[2][3] - 合作内容包括共建联合训练基地 Astribot S1机器人将开展常态化驻场测试 协助制定人机协作规范[4] - 双方设立专项工作小组 在技术部署 场景化训练基地共建 运维保障等方面展开计划[5] 政策与行业背景 - 2023年《"机器人+"应用行动实施方案》推动机器人融入养老服务场景 2025年广东省政策提出在民政领域拓展"机器人+"行动[6] - 养老场景高度复杂 需将机器人能力建设紧密贴合实际需求 才能实现科技养老[4][7] 技术突破 - 星尘智能开发DuoCore快慢协同系统 使机器人具备「本能反应+深度思考」双智能维度 可应对复杂环境[8] - 采用绳驱传动和仿生关节结构 实现毫秒级延迟与毫米级轨迹精度的肌肉级力控[8] - S1机器人具备类人灵活性与精准性 可完成叠衣清洁等精细任务 并配置三重安全机制[8] 合作价值 - 深圳市养老护理院提供真实场景和专业反馈 星尘智能提供技术支撑 共同打造可复制的"科技+养老"范本[6] - 合作将加速具身智能机器人在养老场景的落地优化 推动养老服务智能化升级[6] 发展前景 - 机器人养老尚处早期阶段 星尘智能通过技术自研突破 助力适老化改造与智能化服务[8] - 公司计划以"刚柔并济"技术持续推动养老领域数智化转型[8] 创业支持 - 锦秋基金设立"Soil种子专项计划" 为早期AI创业者提供资金支持 助力创新想法落地[10]
AI巨头环伺,创业公司如何活下去?Anthropic CPO给出4个方向 | Jinqiu Select
锦秋集· 2025-06-06 21:43
作为最热门的AI 赛道之一,AI 不仅吸引了最广泛的资本和关注,也吸引了最激烈的竞争。 伴随着Anthropic 暂停了Windsurf的模型访问。 在AI模型巨头环伺的环境中创业公司如何活下去,这个问题也 成了创业不得不重新面对的问题。 Anthropic 公司首席产品官Mike Krieger在Lenny's Podcast最新一期节目中也谈到了这个问题。 当前,在编程基准测试SWE-Bench上,AI模型的能力已经达到50%,如今已经达到72%。模型的能力提升已经 是必然。 对创业者而言,如今更应聚焦于如何最大化利用AI能力。 他观察到,最成功的公司都有一个共同特点:他们一直在尝试用AI解决那些"几乎能做到但还差一点"的任务。 这些公司在Claude 3.0时就开始尝试,即使频频碰壁;当3.5版本发布时,他们的产品突然变得可行;到了Opus 4,他们的工程师会惊呼"我从没见过这样的表现"。只有持续挑战模型的极限,才能在新版本发布时获得真正 的突破。 Krieger认为,如今,巨头环伺,创业公司更应该深耕垂直行业的专业知识(如法律、医疗的特定流程和合规 要求);建立差异化的市场推广能力(深入了解具体决策者 ...
来自400位设计师的深度调研:两家海外VC深度解析设计行业的AI应用全景图 | Jinqiu Select
锦秋集· 2025-06-04 22:21
核心观点 - AI正在重塑设计行业,设计师角色从执行者向策略引导者转变,核心价值转向创意策展和人类独特判断力 [3][20][40] - AI在设计流程中呈现"前强后弱"特征:创意构思阶段采用率84%,执行和协作环节不足40% [5][17][19] - 初创公司AI采用速度是大型企业的2倍以上,组织敏捷性成为关键差异因素 [34][37] 设计师如何拥抱AI时代 - **早期价值释放**:72%设计师认为AI在创意构思表现卓越,68%用于减少重复工作,但执行环节仅48%采用率 [3][5] - **创意起步变革**:84%设计师在探索阶段使用AI工具告别"空白页焦虑",角色从创造者转向策展人 [7] - **研究效率飞跃**:AI将8-16小时的客户访谈分析压缩至1-3小时,成为全天候研究助手 [10][12] - **流程颠覆**:"Vibe Coding"实现想法直接跳转到可工作代码,开发周期大幅压缩 [13][14] - **人类专属领域**:AI在深度设计思考领域使用率低于25%,如线框图(14%)和交互动画(19.5%) [19][20] 团队采用AI的现实挑战 - **工具碎片化**:24.8%设计师寻求更强UI/UX生成能力,17.3%需要设计系统集成,工具链割裂增加协作成本 [21][23] - **采用障碍**:生态系统碎片化、转换成本高、输出不稳定性和企业隐私限制阻碍深度整合 [24][25] - **自下而上普及**:96.3%设计师自主学习AI技能,仅7.4%通过公司培训,草根式传播特征明显 [26][29] - **协作短板**:仅8-12%设计师认为AI改善团队协作,当前工具仍停留在"个人实验"阶段 [30][33] AI时代的设计新格局 - **创新速度差**:52%初创公司已融入AI,上市公司仅23%,技术债务和文化惯性拖累大企业转型 [34][38] - **人类创造力价值**:AI导致设计同质化风险,专业设计师需注入独特视角和情感深度 [39][40] - **设计核心竞争力**:AI公司24个月达成收入目标(传统SaaS需37个月),设计优先策略是关键加速器 [41][42][45] 设计师进化方向 - **专才到通才**:角色边界消融,需兼具产品思维和技术素养,技术素养成为核心竞争力 [49][50] - **创意引导者**:从执行转向编辑总监角色,依靠人类判断力筛选AI产出 [50][51] - **变革推动者**:主动探索工具并分享实践,自下而上推动组织转型 [51][52] 领导者变革指南 - **创造落地土壤**:建立学习氛围、明确价值场景、构建安全实验框架 [57][60] - **领导力重构**:招聘侧重系统思维,支持非线性设计,将设计与业务指标深度绑定 [58][60]
具身智能 “超级助理” 如何走进真实世界? | Deep Talk
锦秋集· 2025-06-03 20:54
另外,Astribot S1所展现出的高性能指标(如末端最高速度≥10 m/s,末端最大加速度大于100m/S²,重复定位 精度±0.1 mm,单臂额定负载5KG),直接回应了市场对于真正强大、可靠且具备通用潜力的智能机器人的迫 切需求。 这正是投资者们在寻找的、能够定义下一代机器人产品的核心竞争力之一。 具身智能无疑是人工智能行业中最炙手可热的赛道,国内外一级市场持续涌现融资热潮。 具身智能,作为人工智能与物理实体深度融合的产物,正推动AI从数字世界向物理世界迈进,致力于让智能 体能够像人类一样在现实环境中感知、决策并执行任务。 这不仅代表了AI技术的下一个重要突破方向,更预示着一场深刻的生产力变革和海量新应用场景的诞生,从 工业制造、物流仓储到家庭服务、医疗康养,其潜力难以估量。 在这一波澜壮阔的浪潮中,星尘智能(Astribot)无疑是站在最前沿的探索者之一。 面对具身智能领域的技术挑战,领星尘智能提出了独特的解题思路。 公司首创了面向AI的软硬件一体化系统架构(Design for AI, DFAI) 。DFAI架构的核心思想,是将"AI智能"与 机器人的"最强操作"进行深度耦合与协同设计 。这一架构 ...
Cursor技术负责人详解AI编程三大难题:奖励信号、过程优化与经验积累 | Jinqiu Select
锦秋集· 2025-05-31 10:37
核心观点 - AI编程的核心挑战在于让模型真正理解问题并完成多轮调试的复杂认知过程,而非仅生成语法正确的代码片段 [1][3] - 编程领域的强化学习面临动作空间庞大、奖励信号设计困难等独特挑战 [7][8] - 行业正探索通过积累经验、优化工具选择和架构创新来提升AI编程能力 [4][12][15] 强化学习在编程领域的特殊性 - 编程的动作空间远超数学等领域,推理过程直接嵌入代码中 [7] - 编程任务需多轮迭代:编写代码→调用工具→获取反馈→调整代码 [3][7] - 评估标准模糊,用户需求复杂隐含,难以自动判断是否真正解决问题 [7] 编程任务中奖励信号的设计挑战 - "通过测试"作为奖励易被模型绕过,生成能运行但未解决问题的代码 [3][8] - 代码质量成为重要维度,学习人类专家代码可提供指导 [8] - 复杂任务奖励稀疏,需上千次尝试才获一次成功信号 [3][9] 强化学习算法与基础设施的演进 - 过程奖励模型(PRMs)因中间步骤评分不准,逐渐被基于最终结果的奖励取代 [10] - DeepSeek研究显示最终结果奖励支持上万步训练,远超传统RLHF的百步规模 [3][10] - GRPO算法通过生成多个候选答案比较价值,适合编程等复杂领域 [10] 工具在编程强化学习中的作用 - O3模型偏好终端操作,因其极简接口避免配置噪音 [5][12] - 代码静态分析工具提供丰富反馈但部署复杂 [12] - 学习代码库历史Pull Requests可模拟人类工程师熟悉项目的过程 [14] 长上下文、模型架构与未来趋势 - 专业代码库需超长上下文(百万token级)处理分散信息 [15] - DeepSeek的NSA机制分层处理注意力,平衡计算效率与信息捕获 [15] - "乌贼注意力"独立缓存文档键值对,避免重复计算 [15] 状态化工具与记忆机制的实现难点 - 记忆机制面临延迟信用分配问题,存储动作价值需未来场景评估 [17][19] - 当前解决方案转向基于规则的优化方法,放弃端到端训练 [17] 真实世界中的模型评估与人类反馈 - 隐式用户行为(如是否接受建议)比显式点赞更有价值 [5][18] - 观察用户对输出的修改可获取高质量训练信号 [20] - 快速迭代缩短训练-反馈循环能更好锚定实际需求 [20] 编程智能体的未来展望 - 新一代模型如o3通过大量工具调用构建深入理解,但计算成本高昂 [23] - 未来方向是让智能体积累经验,避免每次从头思考 [4][23] - 基于代码库特化的能力将成为核心竞争力 [4][23]
美国A轮公司多久才能融完B轮?Carta万家企业数据报告给出了答案 | Jinqiu Select
锦秋集· 2025-05-29 10:19
融资成功率趋势 - 2021年后完成A轮的企业B轮成功率降至20-30%,显著低于2018-2020年群体的40-55% [1][8] - 2024年第一季度企业在第四季度B轮成功率达10.4%,高于2023年同期表现,显示市场信心恢复迹象 [2][9] - 2020年第一季度完成A轮的企业群体表现最佳,第四年B轮成功率超55% [8] B轮融资门槛变化 - 年度经常性收入(ARR)标准从2021年前的200-400万美元提升至400-800万美元 [6][15] - 客户获取成本回收期需控制在18个月以内 [6][15] - 净收入留存率需超过110% [15] - 年增长率需达2-3倍且需展示清晰的盈利路径 [15] 时间周期特征 - A轮后第一年B轮成功率仅个位数,多数企业需24-36个月才能获得B轮 [1][6] - 两轮融资平均间隔时间约为24个月 [6][11] - 仅不到10%企业能在A轮后6个月内获得B轮融资 [6][11] - 2018-2019年企业群体在第3-4年仍有明显成功率跃升 [17] 行业环境演变 - 2021年后投资人从"不惜代价追求增长"转向"高效增长",更关注资金使用效率审查 [13][16] - 近期数据显示复苏迹象,投资人开始寻找符合新效率标准的优质企业 [9][18] - 2022Q4和2023Q1企业群体展现更高早期成功率,改善趋势加速 [19] 战略建议 - 需确保A轮资金能支撑24-30个月运营并制定应急方案 [10] - 建议采用多元化融资策略如风险债务、过桥融资等延长生存期 [14] - 应聚焦收入质量、客户留存和资金储备三大核心要素 [19] - 25-35%成功企业经历过中间轮融资,可考虑A+轮策略 [20]
Arc创始人自述:我们为什么放弃了百万用户的浏览器产品 | Jinqiu Select
锦秋集· 2025-05-27 22:00
公司决策与转型 - Arc浏览器在拥有过亿融资和狂热用户基础时突然停止开发,转向AI产品Dia [1] - 创始人承认创新功能实际使用率极低:悬停日历预览0.4%,多Space功能5.52% [1][13] - 转型三大原因:产品过于复杂难上手、架构臃肿积重难返、AI需要全新安全架构 [18] 产品定位与市场反馈 - Arc定位为"互联网计算机",但实际表现更接近专业工具而非大众消费产品 [12] - 核心功能使用率远低于预期,而Dia的AI功能如标签页对话使用率达40% [13] - 浏览器更换决策门槛高,Arc的创新特性对多数用户吸引力不足 [13] 行业趋势与技术变革 - AI正在重塑搜索、编程等传统领域,如ChatGPT威胁谷歌、Cursor改变IDE使用方式 [14] - 聊天界面已承担搜索、阅读、创作功能,成为新型"浏览器" [22] - 预测五年内AI界面将取代传统浏览器,网页与AI将深度整合 [24] 产品开发经验 - Arc开发教训:过早透露未成熟信息、过晚回应用户反馈 [6] - Dia设计原则:追求简洁易用、底层性能优化、安全架构前置 [18] - 技术积累:自研ADK开发工具包支持快速浏览器创新,但难以开源 [20] 未来发展方向 - 浏览器与AI融合将创造全新产品形态,类似iPhone整合多种功能 [23] - 行业面临"电灯取代蜡烛"式变革,渐进式改良无法满足AI时代需求 [22] - 公司坚持打造可能被数亿人使用的"互联网计算机"愿景 [25]