AI计算架构

搜索文档
当宇树王兴兴、数美万物任利锋他们来到锦秋小饭桌……
锦秋集· 2025-08-12 22:09
锦秋小饭桌活动概览 - 锦秋基金每周五在北京、深圳、上海、杭州等地举办AI创业者闭门社交活动,已连续举办25场,聚焦多模态技术、AI计算架构、具身智能及AI硬件等前沿话题 [3] - 活动形式为创业者、技术专家和产品创新者围绕实景案例分享干货,避免商业互吹,强调真诚交流与创业经验 [3] - 未来活动预告包括8月15日北京Agent专场、8月22日上海运动AI专场、8月29日北京产品力专场及9月5日上海AI应用吐槽大会 [4][5][6][7] 具身智能发展 - 数据分为三层:低精度人类数据、高精度人类数据和真机遥操作数据,其采集成本和质量直接影响模型价值 [16] - 灵巧手产品成熟度低,高自由度设计未满足实际需求,低自由度产品功能近似夹爪,实用性受限 [16] - 触觉传感器需优先关注线性度和量程,绝对精度和切向力感知非核心因素,人类切向力感知依赖推断而非直接传感 [16] - 生成式世界模型需大量数据和算力,适合大厂主导探索,人形机器人需满足家庭基础要求如防跌倒、防燃烧及自主充电 [16] AI硬件创新 - 产品差异化依赖细节设计,例如Lovot机器人通过挠痒反馈和眼神交互提升情绪调动能力 [23] - 端侧算力需求增长,因视觉模态涉及隐私问题,云端处理存在存储和计算成本压力 [24] - 可穿戴硬件受限于小体积元器件,电池技术影响美观与体验,记忆解决方案需平衡成本与体验 [25] - 记忆系统需结合主观与客观数据,纯客观数据无意义,需理解用户mindset实现个性化 [26] - 细分市场策略有效,如高驰手表专注越野跑人群从Garmin抢占市场,美国航模市场依托高客单价和club文化 [27][28] - 创业者应选择非小米覆盖市场,避免中间路线摇摆,功能性与非功能性需明确二选一 [22][29] AI计算架构与算力需求 - 算力需求分生产力视角和消费视角:前者替代脑力劳动者所需算力有限,后者因每人调用多个AI Agent处理琐事可能创造无限算力消耗 [35] - 头部公司内部高端AI卡(如英伟达)争夺激烈,算力资源远未饱和 [36] - 模型训练进入下半场,互联网可用数据耗尽,需超越人类先验知识探索新解决方案 [38] - 强化学习成为下一代核心范式,奖励机制设计需平衡避免Reward Hacking或学习停滞 [39] - 下一代GB300集群采用液冷技术,但大规模运维经验不足,华为披露集群平均无故障时间小于24小时 [41] - 服务型AI(情商模型)侧重沟通能力,几十B参数即够,科研/生成式AI(智商模型)需高算力支持实时交互式生成 [42] - HBM5/6技术路线集成PIM功能,未来HBM堆栈可能新增HBF层存储模型权重,Transformer数据访问模式不规律挑战PIM架构 [43] 多模态技术落地 - 视频生成面临UGC痛点:生成速度慢和成本高,闭源方案即梦速度最快,实时生成需推理速度突破 [52] - 多模态交互升级方向包括视频生成与理解一体化,基于用户视频生成定制内容如衍生剧情和角色互动 [53] - 内容社区依赖评论区和高频互动提升活跃度,新平台采用"PGC起步-UGC引入-AI定义价值"模式 [54] - 用户行为呈现性别差异:女性偏好幻想和情感陪伴,男性倾向对抗性互动,平台需降低创作门槛并增强多样性 [54] - AI商业壁垒体现在数据、标注和场景深度,头部团队投入资金进行高质量标注训练模型 [55] AI应用场景与数据 - 手机AI调用中10%为口算计算器场景,大模型chatbot主要应用OCR,视觉模态落地监控和学习机拍照搜题 [30][31] - 数据标注质量对多模态模型至关重要,需对图片进行详尽多维标注 [51]
2025RISC-V中国峰会关键议题解读(2):NVIDIACUDA拥抱RISC-V:AI计算架构的三足鼎立与开放变革
海通国际证券· 2025-07-21 20:54
报告行业投资评级 未提及 报告的核心观点 - NVIDIA高管宣布其并行计算平台CUDA支持RISC - V架构,使RISC - V获进入主流AI计算领域“通行证”,将颠覆x86与ARM主导的算力格局 [1] - 全球AI计算格局从“双雄争霸”变为“三足鼎立”,RISC - V CPU能与NVIDIA GPU高效协同,推动高性能计算与AI创新 [2] - CUDA成RISC - V破局关键,RISC - V可“继承”CUDA生态财富,竞争焦点转向设计高效处理器调度管理NVIDIA GPU [3] - RISC - V开放中立属性重要,本土开发者和企业可借此设计自主可控芯片并接入全球主流AI软件生态,加速本土AI产业链发展 [4] - NVIDIA此举解放其GPU帝国,RISC - V从边缘走向核心、从学术走向产业腹地 [4] - 竞争焦点从“指令集优劣”转向“成本与定制化”,RISC - V有成本和定制化优势,AI系统构建逻辑将演进 [6] 根据相关目录分别进行总结 事件 - 2025 RISC - V中国峰会上,NVIDIA高管宣布CUDA支持RISC - V架构,RISC - V处理器可在基于CUDA的AI系统中承担核心应用处理器角色 [1] 点评 - 全球AI计算格局重塑,RISC - V获进入顶级AI生态“官方认证”,实现AI系统CPU选择“解绑” [2] - 未来RISC - V CPU与NVIDIA GPU高效协同,运行完整CUDA加速应用,在NVIDIA硬件生态中起关键作用 [2] 生态赋能胜过技术对决 - 新兴计算架构构建匹敌CUDA的软件生态系统困难,NVIDIA选择“赋能”RISC - V,使其发展加速 [3] 地缘政治与产业自主下的“开放选择” - 当前背景下RISC - V开放中立属性重要,为寻求技术自主的国家和地区提供不依赖特定国家或公司的技术路径 [4] - NVIDIA此举加速本土AI产业链成熟发展,为全球半导体产业格局增添新变量 [4] 核心竞争力迁移 - CUDA生态壁垒抹平后,RISC - V成本优势显著,降低芯片设计和制造成本,催生市场竞争与创新 [6] - RISC - V定制化优势突出,模块化设计可按需设计专用处理器,实现更高能效比和性价比 [6] RISC - V现状与进展 - 规格方面,自2022年超10个新规格获批,RVA23和Server SOC等也获批 [10] - 软件方面,75个软件包启用,成立RISE组织,但存在优化成熟度和高级应用栈问题 [10] - 主机CPU方面,可用开发板有限,无RVA23兼容主机CPU,存在中断、IOMMU等问题 [10] NV相关规格 - 介绍NV - RISCV32、NV - RISCV64、NV - RVV的相关指令集、功能及性能参数,还有NVIDIA定制扩展示例 [13]