Workflow
生成对抗网络
icon
搜索文档
TransDiffuser: 理想VLA diffusion出轨迹的架构
理想TOP2· 2025-05-18 21:08
文章核心观点 - 文章详细解释了Diffusion模型在自动驾驶轨迹生成中的应用,特别是理想汽车VLA(Vision-Language-Action)系统的技术架构和创新点 [1][4][6] - 理想汽车的VLA系统通过Diffusion模型生成驾驶轨迹,相比VLM(Vision-Language-Model)系统具有更强的拟人感和决策能力 [1][2][4] - TransDiffuser模型通过多模态感知信息融合和去相关优化机制,显著提升了轨迹生成的多样性和质量 [6][11][12] 什么是Diffusion - Diffusion是一种通过加噪和去噪过程学习数据分布的生成模型,核心思想类似于逆向拼图 [4] - 相比GAN和VAE等其他生成模型,Diffusion在生成质量和稳定性上具有优势 [4] - 理想汽车采用ODE采样器将Diffusion生成步骤从几十步减少到2-3步,大幅提升效率 [5] 理想VLA系统的技术特点 - VLA是一个具备快慢思考能力的单一系统,直接输出action token并通过Diffusion解码为轨迹 [4] - 系统能同时生成自车轨迹和预测其他交通参与者轨迹,提升复杂环境博弈能力 [5] - 当前系统输出轨迹而非直接控制信号,但未来可能演进到直接输出油门/方向盘信号 [3] TransDiffuser架构细节 - 模型采用编码器-解码器结构,融合图像/LiDAR/运动状态等多模态信息 [6][7] - 场景编码器处理前视图像(8视角)和LiDAR数据(5传感器),输出BEV/图像/点云特征 [7][10] - 去噪解码器基于DDPM算法,通过10步迭代生成覆盖4秒的8个waypoints轨迹 [9][11] - 在NAVSIM数据集上PDMS指标达到94.85,优于Hydra-MDP++等现有方法 [11] 关键创新点 - 无锚点轨迹生成:不依赖预设轨迹或词汇表,直接从感知数据生成轨迹 [11] - 多模态去相关优化:解决模式崩溃问题,提升轨迹多样性且计算开销低 [11][12] - 采用256批量大小分布在4个NVIDIA H20 GPU上进行训练 [10] 局限性与未来方向 - 模型微调存在困难,特别是感知编码器部分 [13] - 未来可能结合强化学习,并参考OpenVLA等先进模型架构 [13] - 直接输出控制信号(油门/方向盘)是更难的挑战,短期内难以实现 [3]
北京国电通申请基于生成对抗网络与大语言模型的人力资源管理专利,实现生成虚拟人力资源数据的多元化
金融界· 2025-05-14 11:56
金融界2025年5月14日消息,国家知识产权局信息显示,北京国电通网络技术有限公司和国网信息通信 产业集团有限公司申请一项名为"一种基于生成对抗网络与大语言模型的人力资源管理方法"的专利,公 开号CN119963144A,申请日期为2024年12月。 天眼查资料显示,北京国电通网络技术有限公司,成立于2000年,位于北京市,是一家以从事专业技术 服务业为主的企业。企业注册资本73000万人民币。通过天眼查大数据分析,北京国电通网络技术有限 公司共对外投资了4家企业,参与招投标项目2019次,财产线索方面有商标信息65条,专利信息948条, 此外企业还拥有行政许可21个。 国网信息通信产业集团有限公司,成立于2015年,位于北京市,是一家以从事软件和信息技术服务业为 主的企业。企业注册资本1502231.015155万人民币。通过天眼查大数据分析,国网信息通信产业集团有 限公司共对外投资了40家企业,参与招投标项目5000次,财产线索方面有商标信息311条,专利信息 4601条,此外企业还拥有行政许可7个。 专利摘要显示,一种基于生成对抗网络与大语言模型的人力资源管理方法,包括:通过生成对抗网络对 已获得的人力 ...
一文讲透AI历史上的10个关键时刻!
机器人圈· 2025-05-06 20:30
在为期六周的会议中,与会者进行了深入的讨论、辩论与合作,奠定了人工智能作为一个正式学科的基础。他们 尝试定义人工智能的概念、明确其研究目标,并规划可能的研究方向。会议成员探讨了一系列深刻问题,包括问 题求解、机器学习和符号推理等。 这次关键性的会议不仅开启了之后数十年人工智能研究与创新的大门,也凝聚了一个充满信念的学术群体——他 们相信机器有能力复制人类的认知能力。达特茅斯会议的深远影响在于,它确立了人工智能作为一门学科和实践 领域的地位,推动人类迈向一个智能机器与人类协作的未来。 #2 感知机(1957年) 2025年,人工智能已经不再只是前沿科技圈的热词,而是真真正正地走进了我们的日常:生成图像、写代码、自 动驾驶、医疗诊断……几乎每个行业都在讨论 AI,拥抱 AI。 但今天的大模型奇点不是一夜之间到来的,它背后是一条充满突破、争议、冷寂与复兴交织的进化之路。从1956 年达特茅斯会议开始,到如今数千亿参数模型引发的全球技术竞赛,AI的发展史是一部关于人类如何模拟、拓 展,乃至重新定义智能的故事。 本文将带你一起回顾这条历程中的10个关键的历史性时刻,帮你理清人工智能是如何一步步从纸上设想,走向今 天这场 ...