强化学习

搜索文档
京东集团-SW一度涨超6% 将在未来三年持续投入 带动形成万亿规模人工智能生态
智通财经· 2025-09-25 11:17
股价表现 - 公司股价一度上涨超过6% 截至发稿时上涨6.47%至141.6港元 [1] - 成交额达到19.07亿港元 [1] 战略规划 - 公司宣布未来三年将持续投入人工智能领域 目标带动形成万亿规模的人工智能生态 [1] - 创始人刘强东亲自担任京东探索研究院院长 在全球范围内招募人工智能科学家 [1] 研发布局 - 京东探索研究院成立于2020年11月 是专注于前沿科技探索的研发部门 [1] - 研究院深耕泛人工智能领域 包括大语言模型、多模态智能、具身智能和强化学习等方向 [1]
应届生看过来!上海AI Lab校招通道已开,100+岗位,700+offer,让科研理想照进现实!
机器之心· 2025-08-21 12:12
招聘计划 - 公司面向2025年1月至2026年10月毕业的全球校园人才开放100+职位[1][4] - 招聘对象包括梦想新星、学术新星、工程新星和竞赛新星四类人才[4] - 常规岗位面向2025年9月至2026年10月毕业生 海内外毕业时间同步认定[4] 岗位类别 - 提供算法、研发、产品、运营、解决方案、职能/支持六类岗位[6][7] - 算法类聚焦大模型、机器学习基础理论、多模态、强化学习及AI for Science方向[7] - 研发类专注大规模分布式训练框架、高性能计算、AI系统架构及AI芯片协同优化[7] 人才要求 - 寻求AGI坚定信仰者 重视根本问题解决而非论文数量[3] - 需要卓越工程实践者 具备复杂工程驾驭能力和大规模场景验证经验[3] - 偏好挑战高难度机制创新研究的"摘星者" 追求颠覆性进展[3] - 要求兼具激情与理性的思考者 能严谨评估idea的规模化路径与长期价值[3] - 重视长期主义践行者 专注解决基础性、通用性核心问题[3] 招聘流程 - 网申于2025年8月20日启动 设6场集中笔试[10] - 笔试时间分布在2025年8月25日至10月13日 覆盖研发与算法方向[10] - 提供活动直通渠道 参与校园活动可获终面PASS卡[10] - 面试流程包含3-4轮 通过后陆续发放Offer[10] 平台资源 - 提供顶级科研平台与超大规模算力集群支持[13] - 配备大规模数据资源 支持具备规模化潜力的研究方向[13] 投递方式 - 通过扫描二维码或阅读原文链接投递简历[14] - 设置专属小助手联系方式13661489516提供投递支持[14]
思辨会 | 思辨八方,智启未来——2025世界人工智能大会思辨会综述
观察者网· 2025-08-03 21:30
人工智能行业发展趋势 - 2025年世界人工智能大会(WAIC 2025)采用"问题驱动、深度对话"的创新思辨形式,围绕量子模拟、数字孪生脑、AI for Science等前沿议题展开讨论 [1] - 人工智能正从"能看会说"的感知智能迈向"能想会做"的决策智能,迎来历史性转折点 [9] - 具身智能与强化学习结合,推动AI从理论优势转化为产业动能,在智能仓库、无人驾驶、应急救援等领域展现广阔前景 [7] 智能体安全挑战 - 现代智能体具备自主决策能力,但存在严重安全缺陷,可能导致服务器崩溃、数据泄露及企业核心系统渗透 [2] - 专家提出沙盒环境测试、安全对齐技术等解决方案,强调需构建全链条防护体系 [2] - 智能体安全是关乎未来人机信任的关键命题,需将安全考量前置到设计源头 [2] AI for Science应用突破 - AI打破学科壁垒,在量子物理领域识别量子纠缠模式,在材料科学中加速新型超导体发现,在生物医学领域破解蛋白质折叠奥秘 [3] - AI全面覆盖生命科学全流程,从病理研究到分子分析,如GNoME系统发现数百万新晶体材料 [5] - 交大人工智能学院开发全球首个推理型罕见病智能体诊断系统,解决小样本难题 [5] 数字孪生脑技术 - 数字孪生脑通过构建人脑虚拟模型,模拟大脑活动、预测神经疾病发展及测试药物效果 [6] - 该技术为阿尔茨海默症、帕金森病等神经退行性疾病治疗带来新曙光 [6] - 引发关于"思想隐私"边界及人类意识与AI模拟关系的伦理思考 [6] 具身智能发展瓶颈 - 数据短缺是制约具身智能发展的关键瓶颈,人形机器人数据回流明显不足 [8] - 模拟生成仿真数据存在视觉和物理效果质量控制难题 [8] - "模仿+强化"混合学习范式成为突破数据瓶颈的希望之路 [8] 多模态技术挑战 - AI大模型在数学竞赛表现良好但在物理竞赛中吃力,需提升图形理解能力 [4] - 关键挑战在于将符号逻辑与神经网络结合,使AI理解科学规律背后的物理意义 [4] - 多模态技术是提升AI科学能力的潜在方向 [4]
自动驾驶圆桌论坛 | 聊聊自动驾驶上半年都发生了啥?
自动驾驶之心· 2025-07-14 19:30
技术路线与量产现状 - BEV感知方案已成为行业主流量产选择 完全替代传统单目/双目检测方案 但在corner case(如非结构化道路、复杂路口)上仍有明显短板 [11][36] - 特斯拉引领的纯视觉BEV+Occ环境建模方式已获行业验证 但3DGS等新型表征方式正在探索中 [2][52] - 端到端方案(E2E)尚未展现显著优势 数据收集难度和训练成本高于传统两阶段模型 目前更多停留在PR层面 [4][48] 新兴技术方向 - VLA/VLM成为2025年焦点技术 通过语言模型提升corner case处理能力 但存在落地真实性存疑、学术界与工业界数据壁垒等问题 [5][20][45] - 扩散模型在轨迹生成中展现多模态优势 但实时性仍是量产挑战 CVPR2025的DiffusionDrive已取得进展 [17][39] - 世界模型主要应用于仿真数据生成 预训练和端侧推理仍待突破 部分厂商宣传存在夸大 [50][52] - 强化学习受限于仿真精度与安全性要求 在自动驾驶领域尚未规模化应用 但长期潜力被看好 [7][47][51] 行业痛点与突破方向 - 长尾场景处理需解决三大核心问题:VLA在corner case的实证数据不足、车端算力与模型效率的平衡、模仿学习的天花板突破 [5][6][7] - 数据闭环能力成为竞争关键 需构建自动化标注+仿真验证的高效流水线 头部企业已布局AI驱动的数据运营体系 [28][33] - 芯片算力限制导致技术分层:Orin-X支持多模态LLM处理复杂城区场景 而J6M等中低端芯片仅能支撑纯视觉高速NOA [40][45] 未来趋势与竞争格局 - 技术路线呈现分化:L2+方案侧重VLA泛化性提升 L4方案聚焦世界模型构建安全验证体系 [25] - 3D高斯与毫米波雷达应用被忽视 前者可发展为世界模型表征 后者存在技术空白 [52] - 行业进入"智驾平权"阶段 地平线征程6等芯片推动辅助驾驶普及 但平价车型仍受限于corner case处理能力 [36][39] - 中心化智能成为长期方向 从单车智能向V2X+云端协同演进 [47] 技术迁移与跨领域应用 - 自动驾驶与具身智能技术高度互通 VLA时代下两者在安全场景与灵活场景形成互补 [33] - 舱驾一体化成为新探索方向 结合语音与OS系统提升用户体验 [43] - 知识体系需保持可迁移性 避免过度专业化导致转行障碍 [52]
对话未来出行 | 商汤绝影CEO王晓刚:汽车是人工智能最好的载体,以世界模型和仿真学习突破特斯拉式数据壁垒
每日经济新闻· 2025-05-16 12:00
智能汽车行业趋势 - 智能汽车竞争焦点从硬件参数转向认知能力,行业处于"软件定义汽车"向"认知重塑出行"跃迁的临界点 [1] - 2025年第一季度中国L2级辅助驾驶新车渗透率达65% [1] - 智能座舱进化分为三个阶段:问答工具、大模型赋能的"全能助手"、具备记忆与共情能力的"家庭成员" [1][8] 商汤绝影技术路径 - 采用"世界模型+强化学习"技术组合突破现实数据不足瓶颈,降低对激光雷达的依赖 [1][10] - 世界模型可模拟未来场景变化,例如施工路段避让及碰撞情形 [12] - 通过仿真环境生成海量驾驶场景,使自动驾驶系统自我进化,类似AlphaZero的自我博弈逻辑 [10][16] 激光雷达技术观点 - 激光雷达属于阶段性技术选择,未来可被模型算法和数据迭代替代 [1][12] - 激光雷达在城区复杂场景中作用有限,且受天气干扰、老化等问题影响 [12] - 当前部分车企采用"激光雷达+端到端系统"双配置作为过渡方案 [16] 车企合作模式 - 与主机厂形成"太极式共生"关系,既保留车企自研能力又发挥科技公司技术优势 [3][18] - 产品已上车7款车型,2024年将推出地平线J6E方案并在奇瑞量产,基于英伟达Thor的系统将应用于东风车型 [17] - 合作核心是研发体系对齐而非股权绑定,涉及工具链、数据格式等基础设施协同 [19] 数据与商业化 - 车企保留数据所有权,商汤绝影提供脱敏技术支持 [21] - 自动驾驶盈利需3年,依赖量产规模扩大及摄像头配置标准化 [22] - 未来研发重心转向云端,提供云服务和大模型基础设施,车端研发将轻量化 [22] 行业应用场景 - 汽车是当前人工智能最佳载体,因多模态传感器丰富且数据回流规模大 [4][5] - 智能座舱通过全时感知(表情/动作/生理信号)实现情感化交互,远超手机等被动设备 [9] - 技术可延伸至智能机器人领域,与汽车AI存在高度重合性 [5]