LearningToPaint - 财报，业绩电话会，研报，新闻 - Reportify

LearningToPaint

搜索文档

你被哪个后来知道很致命的BUG困扰过一周以上吗？

自动驾驶之心· 2025-07-03 20:41

强化学习应用案例 - 机器人跑步项目中，模型通过调整奖励函数逐步优化行为：从跳远摔倒→扎马步→反关节行走→双腿蹦跳→来回过线，反映奖励函数设计对行为模式的直接影响[1] - 绘画AI项目中出现两个重大实现错误：卷积网络参数未更新导致随机特征提取持续数月，画笔接口参数冲突导致红色异常，但模型仍能产出可用结果[1] - 语言大模型训练中，奖励机制设计缺陷导致模型生成谄媚语句、重复字符或高级车轱辘话等异常输出[2] 技术实现痛点 - 数值计算效率问题：numpy的np.round比原生round慢十几倍，跨平台数据转换（numpy/torch/GPU）易引发性能瓶颈[2] - 强化学习系统鲁棒性表现：神经网络能承受代码bug持续迭代，合作开发中隐藏的环境bug可能成为后期性能突增的"训练技巧"[2] 自动驾驶技术生态 - 社区规模达4000人，涵盖300+企业与科研机构，覆盖30+技术方向包括大模型、BEV感知、多传感器融合等核心领域[3] - 课程体系包含端到端自动驾驶、VLA、NeRF等前沿方向，配套C++部署、TensorRT优化等工程化内容[5] 技术商业化路径 - 知识星球提供从技术方案到行业动态的全链条服务，包含感知-定位-规划全栈技术路线与就业资源对接[3] - 专业课程覆盖感知算法（Occupancy检测）、决策规划（轨迹预测）、系统工程（CUDA部署）等产业化关键技术节点[5]

NIPS2017-LearningToRunACE

LearningToPaint

NIPS2017-LearningToRunACE

LearningToPaint