端到端强化学习

搜索文档
以“类人”驾驶体验重塑智能出行,地平线携HSD亮相香港
南方都市报· 2025-06-13 16:43
公司动态 - 地平线在2025首届国际汽车及供应链博览会(香港)展示城区辅助驾驶系统HSD和车载智能计算方案征程6系列 [2] - 公司HSD系统获得2025中国汽车供应链创新成果奖 [2] - 地平线总裁陈黎明表示公司依托开放生态与十年技术沉淀构建全场景辅助驾驶解决方案体系 [2] - 地平线首创基于"用户智驾信任度"公式的城区辅助驾驶系统HSD [3] - HSD采用一段式端到端架构和端到端强化学习技术 [3] - 公司推出Horizon Cell"弹夹系统"实现硬件模块化和开发平台化 [3] - HSD系统提供HSD 300/600/1200三种配置满足不同需求 [4] - 地平线与奇瑞集团就HSD量产展开全面合作 预计2025年第三季度量产 [5] - 地平线与博世、电装、采埃孚等国际Tier-1企业达成合作 [5] 行业趋势 - 中国汽车智能化水平持续攀升 [2] - 智能驾驶行业正面临价值拐点 [2] - 行业需要性能最优、灵活可升级的智驾解决方案 [2] - 城区辅助驾驶系统需要关注用户信任度指标 [3] 市场表现 - 地平线前装量产出货数量已突破800万套 [5] - 当前市场每三台智能汽车就有一台搭载地平线方案 [5]
特斯联完成战略升级:三项核心业务聚焦空间智能
经济观察网· 2025-05-22 16:23
战略升级 - 公司向港交所递交更新版招股书,首次披露全新升级的三大战略板块:AIoT领域模型、AIoT基础设施、AIoT智能体,聚焦空间智能 [1] - 战略转型升级源于大模型浪潮驱动下,科技企业在GPU裸机上层搭建框架普遍需要额外投入,而公司具备软硬结合的基因,使贯通顶层模型、应用及底层基础设施的业务纵深向延展成为独特优势 [1] - 基础模型能力的不断跃迁,使得作为第三代AI核心方向的"空间智能"加速进入行业视野 [1] 业务架构 - 公司是中国AIoT行业的参与者,致力于以科技推动产业升级及空间智能以实现可持续发展,产品已获全球逾160座城市的800多个客户部署,覆盖阿联酋、新加坡、澳大利亚等国家 [2] - AIoT领域模型是公司空间智能的分析引擎,采用"多模态"及"模型+系统+应用"的商业化策略,打造专注于空间内各垂直场景的系列领域模型及智能应用 [2] - AIoT基础设施及其全栈智算产品套件是公司空间智能生态的基础,以高效能绿色智算体为核心产品 [2] - AIoT智能体作为公司空间智能解决方案的统筹交互界面,以机器人与智能穿戴设备为核心载体,作用于企业级用户级终端消费者 [3] 技术能力 - 公司推出全新升级版绿色智算体,全面支持华为昇腾、昆仑芯、寒武纪、燧源、沐曦、壁仞等信创芯片,并适配DeepSeek-R1/V3系列、Qwen系列等前沿大模型的推理和训练任务,构建具备"芯、网、云、智"能力的全链路工具包 [3] - 针对异构算力的纳管需求推出X-Stack智算云平台,提供计算虚拟化、存储虚拟化、网络虚拟化、资源池化、网络安全等服务,计算资源利用率最高可达97% [3] - 在类人思考方向,模型开创性地引入端到端强化学习方法,使用高质量数据微调训练出HALI基础模型,通过奖励函数引导模型在与工具/设备/环境的交互中不断优化策略 [4] - 在长期记忆方向,采用基于知识图谱的数据压缩存储和检索技术,使模型能够既保持超长的记忆,又能快速从历史数据中恢复记忆 [4] 财务表现 - 公司2024年年度收入为18.43亿元,相较2023年大幅提升83.2%,2022年、2023年、2024年收入分别为7.38亿元、10.06亿元及18.43亿元,三年年复合增长率达58.0% [5] - 2024年三费费用率由2023年的76.9%下降至45.0%,应收账款周转天数从2022年的238天、23年的180天进一步缩短至104天 [5] - 2024年AI产业数智化业务收入自2023年的6.24亿元大幅提升162.9%至16.4亿元,贡献了2024年业务收入的最大涨幅 [6] - 年度总客户数量由2023年的330个提升至342个,其中255个来自产业数智化业务,约占总客户数量的74.5%,截至2024年12月31日在手订单达23亿 [6] 资本动态 - 2025年1月起始,公司D++轮投资获得所得款项6.55亿元,新入股股东包含青岛汇铸、诺哲瑞英、青岛得厚、九江鄱湖、长沙经开、上海瑞力等 [6] 行业前景 - 2024年全球空间计算市场规模约为1495.9亿美元,并预计将在2034年突破10661.3亿美元,年复合增长率达21.7%,其中亚太市场年复合增长率为22.2%,高于全球平均水平 [7]
喝点VC|红杉对话OpenAI Deep Research团队:AI Agent将成为今年最具突破性技术,强化学习重新回归主流
Z Potentials· 2025-03-10 11:07
深度研究的核心技术 - 采用端到端强化学习方法针对复杂网页浏览和推理任务进行训练 显著提升智能体在开放环境下的决策能力 [4][10][24] - 基于OpenAI最先进推理模型o3的微调版本 结合浏览工具和Python计算工具增强信息处理能力 [24][25] - 通过"思维链摘要"机制动态调整搜索策略 相比传统搜索引擎具备更灵活的推理能力 [25][26] - 优化目标决定最终结果 直接针对用户需求进行端到端训练比人工拼接子系统更高效 [3][29] 产品功能与性能 - 将数小时的知识工作压缩至5-30分钟 在专业领域可覆盖90%以上核心信息 [6][17] - 支持多源信息整合与交叉验证 自动生成带参考文献的详尽报告 [6][19][32] - 具备表格化数据展示和图表生成能力 未来将拓展图片嵌入功能 [19] - 在模糊查询场景中主动澄清需求 通过交互优化提升回答精准度 [34] 应用场景 - 商业领域:市场研究、企业分析、代码开发等场景节省80%工作时间 [11][39][15] - 医疗领域:快速查找最新医学文献和临床试验 辅助诊断决策 [12][40] - 消费场景:高效完成购物比价、旅行规划等高价值决策 [18][41] - 教育领域:提供个性化学习路径和结构化知识报告 [21][43] 行业影响与发展趋势 - AI Agent将成为2025年最具突破性的技术方向 推动知识工作自动化 [50][51] - 强化学习因语言模型成熟而重新崛起 成为构建AGI的关键方法 [55][56][57] - 不会完全替代人类工作 而是提升1%-25%的工作效率 [38] - 咨询、医疗等依赖信息整合的行业将优先受到影响 [39] 未来规划 - 拓展私有数据搜索权限 增强复杂场景下的分析能力 [37] - 融入OpenAI的AGI路线图 实现更自然的跨工具操作 [33][37] - 优化模型可靠性机制 减少幻觉并提高引文权威性 [32] - 开发Plus版本降低使用门槛 探索新兴应用场景 [13]