强化学习范式

搜索文档
记者观察:大模型行业应集各家所长打通最后一公里
证券时报网· 2025-07-29 15:32
行业协同创新趋势 - 大模型行业出现同行相互站台、彼此助力的现象,商汤科技、阶跃星辰、第四范式、智谱等公司负责人齐聚论坛共同探讨协同创新 [1] - 行业围绕"模型之问"核心议题,重点讨论如何打通"算力-数据-模型-应用"的最后一公里 [1] - 大模型发展范式从OpenAI开创的预训练为主转向显著提升推理能力的强化学习范式 [1] 技术发展方向 - 降低推理成本成为决定大模型应用渗透率的关键因素 [1] - 阶跃星辰提出"多开好省"四大黄金法则:"多"指多模态,"开"代表开源,"好"是性能好,"省"强调节省成本 [1] - 近半年行业技术路线发生明显转变,从预训练为主转向强化学习范式 [1] 产业链合作模式 - 模型厂商与芯片厂商通过联合创新实现大模型和算力双向价值最大化 [2] - 阶跃星辰联合近10家芯片厂商和算力平台发起"模芯生态创新联盟",从底层提升模型适配性和算力应用效率 [2] - 智谱建议建立联盟组织共享沉淀数据,为实际应用提供充足"弹药" [2] 平台建设进展 - 无问芯穹建设上海首个人工智能终端软硬适配优化中试平台,聚焦共性技术难题解决 [2] - 该平台将形成覆盖计算效能、功能实现和交互体验的完整评价体系 [2] - 平台目标是打造可持续盈利的投资收益型中试平台 [2] 商业模式创新 - 阶跃星辰提出大模型时代应有AI总集成商,整合算力、算法、语料数据、智能体等要素 [2] - 行业需要让各公司发挥专长形成协同合力,打通技术创新到产业应用的最后一公里 [3]
AI三问③模型之问 | 直面模型之问,以大爱共塑 AI 未来 ——WAIC 2025 大模型论坛以问题破局引领技术革新
36氪· 2025-07-17 11:21
2025世界人工智能大会(WAIC)核心内容 - 2025年7月26日至28日在上海世博中心等地举办 聚焦"AI三问"框架:数学之问(公理推演)、科学之问(实证研究)、模型之问(技术落地) 三者协同推动跨领域创新 [3] - 商汤科技承办7月27日"大爱无疆・模塑未来"大模型论坛 贯穿"模型之问"主题 聚集全球专家探讨模型本质难题 [3] 跨国界技术交流亮点 - 活动打造跨国界跨架构交流平台 聚焦"泛化性瓶颈与模型底层范式关联"问题 分析架构设计固有局限 探索技术突破路径 [4] - 汇集全球顶尖企业技术专家与高校学者 促进不同技术路线智慧碰撞 为解决大模型技术瓶颈提供多元视角 [4] 架构革新与产业应用 - 探索Transformer与非Transformer架构融合路径 研究跨模态智能的语义鸿沟问题 优化文本/图像等多模态融合技术 [5] - 直击"性能-开销曲线优化"痛点 研究降低训练能耗同时保持性能的方案 重点关注轻量化架构与非Transformer可能性 [5] - 学术界探讨推理时扩展架构性能边界 产业界展示工程化优化方案 促进理论研究与产业实践互动 [5] 全球技术共识与发展方向 - 产学研领袖共同探讨高阶智能实现障碍 分析复杂推理/自主决策等认知短板成因 形成包含中国智慧的技术方案 [6] - 海内外专家围绕算力优化/跨模态语义破解等议题凝聚共识 推动AI从技术竞争转向协同破题的新模式 [6] 大会配套内容 - 推出首份刊物《WAIC UP!》定位为"AI时代进化指南" 汇集跨领域先锋力量探讨技术跃迁与未来文明 [7][8][10]