Workflow
AI模型泛化能力
icon
搜索文档
王兴兴点评Seedance 2.0:全球遥遥领先
经济观察报· 2026-03-18 14:55
文章核心观点 - 宇树科技创始人王兴兴认为,具身智能的“ChatGPT时刻”即将到来,乐观估计需18个月,其个人预估需2-3年,其标志是AI模型能在80%的陌生场景下,通过语言/文字指令完成80%的任务且无需提前建图 [2] - 实现上述目标的最大挑战在于AI模型的泛化能力不足,而解决数据稀缺问题的关键路径在于视频生成模型(如Seedance 2.0)与机器人动作的对齐与统一,一旦突破将从根本上解决数据难题并诞生机器人计算模型 [1][3][4] - 宇树科技在硬件产品、数据采集、远程控制及AI强化学习等方面取得进展,为迎接“ChatGPT时刻”进行技术和产能储备 [2][4][5] 行业趋势与挑战 - **“ChatGPT时刻”预判**:具身智能领域类似ChatGPT的突破性时刻即将来临,定义为AI模型在80%陌生场景下通过语言/文字指令完成80%任务且无需提前建图 [2] - **核心挑战**:当前行业面临的最大挑战是AI模型的泛化能力不足,导致机器人在更换场景后成功率大幅下降 [2][3] - **技术路径分歧**:行业模型主要分为两大流派,即融合语言/文本模型的VLA模型,以及通过对物理世界进行预估和建模来驱动机器人的世界模型 [3] - **关键突破口**:基于视频生成的世界模型被高度看好,文生视频模型(如Seedance 2.0)的发展被视为解决机器人数据稀缺问题的关键,其核心难题在于生成的高质量视频与机器人实际动作无法良好对齐和统一 [1][3][4] 宇树科技的技术与产品进展 - **数据采集与远程操作**:公司开发了全身遥操作系统以实现人机动作同步,该系统具备两大实用功能:1) 大规模数据采集,计划在2026年底前部署上万台机器人每天采集10小时数据,以在2-3年内解决数据稀缺问题;2) 远程实时控制,例如在杭州操作异地机器人 [2] - **硬件产品迭代**: - 2025年发布了适用于工业级应用的新一代机器狗,具备防尘防水功能,满电空载续航超过20千米 [4] - 发布了更大尺寸(1.8米高)的H2机器人,力量更大,适用于工业或农业场景 [4] - 预计2025年年中,其人形机器人的百米冲刺速度能跑进10秒以内,超越人类纪录 [4] - **AI与算法升级**: - 2025年最大的软件升级是“功夫模式”,通过加装两颗128线3D激光雷达和预训练AI模型,使机器人动作可随时暂停或任意切换,灵活性大增 [5] - 开发了集群跑位算法,使机器人能从步行变为跑步变阵,衔接更自然,此能力已在2025年央视春晚表演中得到展示 [5] - **市场与出货量**:截至2025年底,宇树G1机器人全球出货量约5000台,最便宜机型售价约3万元;公司预测若AGI(通用人工智能)达到临界点,其年出货量可能飙升至百万台级别 [5]
医疗影像大模型,还需“闯三关”
36氪· 2025-05-19 07:14
医疗大模型应用现状 - 医学影像大模型已在影像科医生工作全流程中实现常态化应用,从辅助工具进化为诊疗生态核心驱动力[1] - 数坤科技发布"数坤坤多模态医疗健康大模型",探索多模态精准诊断、个性化治疗决策等方向[1][2] - 透彻未来研发全球首个临床应用级病理大模型"透彻洞察",基于亿级参数和海量高精度病理数据训练[2] 技术突破与解决方案 - 病理大模型通过通用特征底座方案解决病灶分割、细胞检测等多任务泛化性挑战,简化传统数十个小模型部署流程[3] - 采用RAG技术动态更新知识库内容,结合生成式与判别式AI协同验证,降低医疗大模型幻觉风险[8][9] - 通过统一多模态架构整合影像/文本数据,采用医学思维链训练增强推理能力,实现分步验证[9] 模型泛化能力提升路径 - 数据维度:扩大样本多样性,模拟不同设备/体位/病变阶段特征,覆盖长尾病例[4][6] - 模型维度:增加参数量至亿级,改进训练策略如临床指标加权损失函数,防止过拟合[6] - 部署维度:建立三级医院与基层医院的多场景反馈闭环,明确AI能力边界并由医生把关[7] 医院部署模式演进 - 医疗一体机成为主流选择,集成硬件/软件/大模型满足数据本地化与合规性要求[10] - 纯图像大模型可适配家用GPU,通用大模型需本地数据微调,一体机实现专科与通用场景覆盖[10] - 公有云部署在远程会诊中展现弹性算力优势,但面临数据隐私合规风险[11] 未来发展趋势 - 性能层面:医疗大模型敏感度达100%基础上提升特异性,应用医院数量从三四千家扩展至超万家[12] - 多模态融合:打破影像/文本独立发展局面,整合多维数据提升诊断准确性与个性化治疗支持[12] - 全科化演变:大模型向数字化"全科医生"发展,综合检查检验/影像/病理等多维度诊疗信息[12][13]