大语言模型

搜索文档
自动驾驶论文速递 | 多模态大模型、运动规划、场景理解等~
自动驾驶之心· 2025-07-13 16:10
自动驾驶算法模型研究进展 - MCAM模型在BDD-X数据集上驾驶行为描述任务BLEU-4提升至35.7%,推理任务BLEU-4提升至9.1%,显著优于DriveGPT4等基线模型[1] - TigAug技术使交通灯检测模型错误识别率降低39.8%,增强数据重新训练后mAP平均提升67.5%[12][17] - LeAD系统在CARLA仿真平台实现71.96驾驶分,路线完成率93.43%,超越现有基线模型[23][27] - DRO-EDL-MPC算法计算效率提升5倍,不确定场景下碰撞率接近于零[33][40] - 3DGS-LSR框架在KITTI数据集实现厘米级定位,城镇道路误差0.026m,林荫道误差0.029m[43][47] 自动驾驶数据集与框架创新 - NavigScene框架使nuScenes数据集平均L2轨迹误差降低至0.76m,比基线提升24%,碰撞率从32.48‱降至20.71‱[52][58] - LiMA框架在nuScenes数据集LiDAR语义分割mIoU达56.67%,3D目标检测mCE降至91.43%[61][68] - L4 Motion Forecasting数据集包含德美两国400+小时原始数据,覆盖250km独特道路[78][82] - 动态掩码与相对动作空间缩减策略使CARLA仿真训练效率提升2倍,车道偏离降低至0.07米[71][76] 技术突破与性能提升 - DSDAG因果图建模自车状态动态演化,为驾驶视频理解提供结构化理论基础[5] - TigAug单张图像合成耗时0.88秒,模型重训练平均耗时36小时[13] - LeAD系统通过LLM增强实现场景语义理解和类人逻辑推理[25] - DR-EDL-CVaR约束同时处理数据不确定性和模型不确定性[38] - 3DGS-LSR摆脱对GNSS依赖,仅用单目RGB图像实现厘米级重定位[46]
奇瑞墨甲抢招商,智元、宇树拿大单,人形机器人竞速跑
21世纪经济报道· 2025-07-12 22:16
人形机器人商业化进展 - 奇瑞与AiMOGA联合研发的墨甲机器人将于2024年9月底在国内发布,面向经销商和个人销售 [1] - 智元、宇树中标中国移动旗下公司1.2亿元人形机器人采购订单,其中智元获7800万元全尺寸机器人订单,宇树获4605万元小尺寸机器人及相关配件订单 [1][4][5] - 墨甲机器人已完成首批220台全球交付,资本市场曾炒作奇瑞链人形机器人概念 [1] 奇瑞机器人布局与技术应用 - 奇瑞从工业机器人切入人形机器人领域,2022年智造工厂配备660台工业机器人实现每分钟下线一辆车 [2] - 2023年与墨甲联合研发的人形机器人墨茵完成首轮测试,2024年8月发布CheryGPT大模型并应用于墨甲机器人 [2] - 墨茵机器人已落地汽车4S店场景,具备迎客、车型介绍等功能,招商会吸引超3000家经销商参与 [2] - 墨甲机器人注重仿真设计,墨茵拥有拟人化身材、面部细节及头发、牙齿等精细特征 [2] 行业场景落地与挑战 - 人形机器人分为生产力机器人和服务机器人两类,后者需情绪洞察能力推动交互升级 [3] - 汽车4S店场景中机器人可提升到店流量,但需解决客户留资与订单转化问题,目前难以替代销冠级销售能力 [3] - 运营商场景中,中国移动采购的机器人可能用于营销场景,需二次开发行业专用解决方案 [5] - 中国电信陕西公司计划与优必选合作推出AI大模型家庭桌面机器人,目标销量超10万台 [5] 技术演进路径 - 人形机器人技术发展分三阶段:通用技术开发→行业内容适配→个体体验优化 [6] - 当前处于第一阶段,机器人公司聚焦通用技术研发,后续需解决方案商参与行业内容开发 [6]
库克你赶紧退休,放过苹果吧
36氪· 2025-07-11 21:48
核心观点 - 苹果在AI时代成为落后生,核心AI高管跳槽至Meta,自研模型进展缓慢,考虑接入第三方模型[4][5][6] - 公司资源投入不足,2026年仅批准数十亿美元用于自研云端模型,远低于微软、Meta、谷歌的500亿美元年度预算[7] - 库克将更多资源投向MR头显,计划2027年推出智能眼镜和Vision Air[7] - 库克领导下的苹果缺乏破坏性创新,更擅长成熟产品的深度运营和延续性创新[22][23] - 公司在AI人才争夺战中表现被动,未采取积极措施吸引年轻人才[28][34] AI领域表现 - 苹果基础模型团队负责人Ruoming Pang跳槽至Meta,薪酬达每年数千万美元[4] - 智能版Siri频繁跳票,考虑接入Anthropic或OpenAI的大语言模型[5][6] - 自研模型项目"LLM Siri"仍在迭代,但进展缓慢[7] - 公司对AI投入不足,2026年预算仅数十亿美元,远低于竞争对手[7] - 高管判断失误和资源分配不当导致AI落后[8] 人才竞争 - Meta组建超级智能实验室,挖角OpenAI、Anthropic和谷歌等公司人才[14] - 扎克伯格为顶尖研究人员开出4年3亿美元高薪[15] - 2021年Meta从苹果挖走约100名工程师,库克被迫发放股票奖金留人[18] - 苹果在AI人才争夺中表现被动,未采取积极措施[28][34] - 行业趋势显示年轻人才成为AI创新的关键[29][31] 产品战略 - 库克终止苹果汽车项目,Vision Pro市场反响平淡[20] - 公司转向MR头显,计划2027年推出智能眼镜和Vision Air[7] - 库克时代产品策略以延续性创新为主,扩充iPhone产品线并推出可穿戴设备[23] - 软件服务成为第二增长曲线,推出多项订阅服务[24] - 软硬一体化战略推动市值增长,但缺乏破坏性创新[25] 行业对比 - 微软豪赌OpenAI并将AI融入核心业务,获得市场认可[27] - 英伟达通过频繁收购初创公司补强技术能力[35] - OpenAI和DeepSeek依靠年轻人才实现创新[29][30] - 大公司创始人积极争夺AI人才,库克未采取类似行动[33][34] - 苹果在AI时代的应对策略与竞争对手形成鲜明对比[27][35]
马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指
机器之心· 2025-07-11 16:27
Grok 4性能表现 - Grok 4在物理模拟测试中成功生成受地球引力和摩擦力影响的六边形弹球模拟代码,展示了对因果规律和时空关系的理解[5][7] - 在越狱攻击测试中,Grok 4成功抵御了提示词注入、身份探测、角色扮演注入和白色隐藏注入等多种攻击方式[12][13] - 在法律逻辑推理测试中,Grok 4能够详细解释公司债务违约后的法律和财务后果,表现优于竞品[15] - 在翻译和指令清晰度测试中,Grok 4完胜竞品o3[16] - 在8项综合测试中,Grok 4全部获胜,而竞品o3仅赢得2项[17] 应用场景展示 - 用户通过两个提示词即可用Grok 4创建完整的Flappy Bird游戏,并优化图形效果[21][22] - Grok 4在4小时内完成FPS射击游戏开发,展示出较强的游戏开发能力[24] - 仅用4个提示词即可创建交互式欧拉恒等式可视化工具,展示教育应用潜力[28][31] - 成功生成黑洞的交互式3D模拟,视觉效果惊艳[32] 性能局限性 - 在绘制印度地图轮廓任务中出现明显错误,准确性不足[36] - 处理数学问题时存在推理过程缺失问题,仅输出最终结果[42] - API接口目前不返回思考过程,影响用户体验[41] 行业反响 - 马斯克在发布会上宣称Grok 4所有学科达到博士后水平,可能实现科学新发现[2] - 尽管测试表现优异,马斯克仍表示产品"有改进空间"[44] - 网友调侃Grok 4性能提升依赖算力资源、华人工程师和加班文化[45]
华人2亿美元年薪破界,AI竞赛冰火两重天
搜狐财经· 2025-07-11 14:03
Meta高薪挖角AI人才 - Meta以超2亿美元年薪挖角前苹果AI/ML基础模型团队负责人庞若鸣 薪酬方案包含股票、签约奖金和绩效挂钩发放方式 需多年服务绑定和市值增长指标解锁 [4] - 庞若鸣是机器学习专家 精通ML和基础设施 曾领导苹果约100名工程师推进多模态大语言模型研发 负责Apple Intelligence核心功能 [7][9] - Meta设立"超级智能实验室" 由Scale AI创始人Alexandr Wang领导 已吸纳多位AI界资深人士 并通过持有Scale AI 49%股份强化战略布局 [8] 科技巨头AI转型与裁员潮 - 微软2025年第三轮裁员9000人 年内累计裁减1.7万人 核心工程师占比40% 创公司历史记录 [5] - 微软AI基础设施投入激增 预计12个月内资本支出达800亿美元 较上年560亿美元同比增43% [5] - 亚马逊累计削减2.7万个岗位 多个传统岗位实现AI化 谷歌、Meta和IBM等也在2024年不同程度裁员 [7] 苹果AI研发困境 - 苹果正评估放弃自研大型语言模型 可能引入Anthropic或OpenAI技术支持下一代Siri 因内部研发进展缓慢导致多名核心AI工程师退出 [9] - Meta近期挖角OpenAI、Anthropic与谷歌DeepMind等多家中坚力量 希望填补超大模型和智能助手研发差距 [9] AI行业人才竞争格局 - Meta对庞若鸣的巨额薪酬刷新企业对AI核心人才的估值边界 [4] - 科技公司调整人力结构 降低开支并将资源倾向AI 出现"AI岗位取代传统岗位"案例 [7]
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
量子位· 2025-07-11 12:00
强化学习与奖励模型 - 强化学习已成为AI迈向AGI进程中的关键技术节点,改变了大语言模型的后训练范式 [1] - 奖励模型的设计与训练是制约后训练效果和模型能力提升的瓶颈,缺乏系统性的预训练和扩展方法 [2] - 传统奖励模型基于绝对偏好,难以灵活应对不同定制化场景 [7] POLAR新范式 - POLAR是一种与绝对偏好解耦的奖励建模新范式,具备可扩展性和强泛化能力 [3] - POLAR根据参考答案为模型输出打分,可灵活适配不同风格的定制化需求 [5][7] - POLAR能处理开放问题和闭式问题,提供细粒度的偏好区分 [11] - POLAR完美契合强化微调框架(RFT),使通用场景应用成为可能 [14] POLAR训练方法 - POLAR通过对比学习衡量训练策略与目标策略之间的距离作为奖励信号 [21] - 预训练阶段使用自动化合成数据构建,从131个Base LLM和53个Chat LLM中采样 [22] - POLAR-1.8B使用0.94T Token预训练数据,POLAR-7B使用3.6T Token [23] - 预训练后使用少量偏好数据对齐人类偏好 [23][24] POLAR性能表现 - POLAR展现出Scaling效应,验证集损失随模型参数和计算量增加呈幂律关系下降 [28][29] - POLAR-1.8B在STEM任务中超越最佳基线24.9个百分点,POLAR-7B超越26.2个百分点 [32] - POLAR-1.8B仅1.8B参数即可与27B和72B参数的奖励模型相当 [32] - POLAR-7B微调的Llama-3.1-8B在所有基准测试中平均提升9.0% [34]
是的,LeCun要向28岁的Alexandr Wang汇报!这是Meta新AI团队的一些独家内部消息
机器之心· 2025-07-11 10:43
Meta AI部门重组与人才战略 - Meta近期展开大规模AI人才招募行动,以高达1亿至2亿美元天价挖角竞争对手(如苹果AI团队负责人庞若鸣)[3][4] - 新成立由Scale AI前CEO Alexandr Wang领导的「超级智能实验室」(MSL),整合原GenAI团队并赋予高管自主招募权[5][22] - 挖人行动重点针对OpenAI等竞争对手,力度空前导致对方CEO公开回应[3] FAIR与GenAI/MSL的架构差异 - FAIR(基础AI研究院)保持独立研究性质,600人团队专注长期开源研究,与GenAI/MSL的GPU资源、数据/代码完全隔离[8][12][14] - FAIR仅拥有GenAI部门5%的GPU资源且使用不同云服务商,Llama1团队因商业化成功被剥离至GenAI[14][15] - 图灵奖得主Yann LeCun向Alexandr Wang汇报属架构调整,FAIR自2022年起已多次变更上级部门(如Reality Labs、CPO)[10][11] 内部动荡与文化挑战 - GenAI和FAIR部门将面临裁员,MSL高薪招聘加剧内部资源竞争[21][22] - 员工抱怨公司文化侵蚀:2000人Llama团队目标模糊,GenAI同时承担多项冲突任务导致资源分散[25] - 技术声誉受Llama4「刷榜」争议影响,外部引入人才留存率低,内部流传文章批评组织失调[25] 研究方向与未来展望 - MSL研究方向未完全明确,但将整合原GenAI团队(负责Llama模型、Meta AI助手等产品级LLM)[16][21] - 扎克伯格改革力度激进,成效需待下一代大模型发布验证[23] - 生成式AI浪潮下FAIR学者(如田渊栋)转投GenAI部门,基础研究与应用开发界限模糊化[18]
7月19日,相聚北京!一起聊聊ACL 2025爆点研究
机器之心· 2025-07-10 16:35
AI领域发展动态 - 2025年AI领域持续高速发展,技术更新节奏极快,每隔几周甚至几天就有新突破[1][3][4] - 行业呈现"跟不上就会掉队"的竞争态势,从业者需频繁跟踪arXiv、GitHub等平台的前沿研究[5] - ACL 2025总投稿数达8000多篇创历史新高,反映NLP领域研究热度持续攀升[6] ACL 2025会议亮点 - 会议设置Keynote、论文分享、圆桌对话、Poster交流及企业展位等丰富环节[6] - 上午Keynote由哈工大车万翔教授主讲ACL 2025趋势及展望,分析NLP研究重点与演化方向[9][15][17] - 下午Keynote由上海交大刘鹏飞副教授探讨大模型强化学习与复杂推理的突破与应用[11][19] - 圆桌对话聚焦"上下文工程"的价值探讨,吸引行业高度关注[11] 重要研究成果 - 清华大学邱寒团队研究LLMs内在自我修正机制的潜在问题[9] - 北京大学团队探索语言模型对齐抵抗现象的数据证据[9] - 南京大学程紫峰提出无需训练的Token Prepending方法提升句子嵌入质量[12] - 哈工大团队开发Token Recycling技术加速大模型推理[12] - 清华团队研发APB技术通过跨GPU传递压缩上下文块加速长上下文推理[12] 行业活动与合作 - 机器之心联合举办多场顶级学术会议活动,包括ICLR、CVPR、NeurIPS等[25] - 活动提供企业展台等合作形式,助力合作伙伴吸纳人才和品牌建设[26] - 会议通过机器之心视频号和黄大年茶思屋科技网站进行双平台直播[21][23]
图书编辑要趁早转行吗?
虎嗅· 2025-07-10 15:47
行业现状与挑战 - 出版行业正面临前所未有的生态更迭和范式革命,而非周期性波动 [2] - 生成式人工智能以颠覆性力量冲击传统出版模式,核心业务价值被解构 [3][7] - 行业从"手艺"向"历史名词"演变,从业者普遍存在身份认同危机 [2][11] 消费端变革 - 读者行为发生根本性转变:从系统化阅读转向即时问答式知识获取 [4][7] - 大语言模型成为"全知图书馆",提供24小时在线的知识服务,替代传统图书功能 [6][7] - 严肃出版物的社会影响力持续衰减,可能沦为小众文化符号 [14] 生产端异化 - 编辑流程全面渗透AI应用:选题策划(生成20个选题)、文字润色、营销文案创作均实现自动化 [9][10] - 从业者陷入"共谋"困境:主动使用AI工具提升效率,同时加速自身职业价值贬值 [11][12] - 传统核心能力(需求挖掘、作者匹配、文本鉴赏)正被AI系统性超越 [12] 商业模式失效 - 内容分发权力结构转移:从深度图文作者→短视频博主→AI生成内容 [17] - 传统"优质内容为王"方法论崩溃,注意力获取成本飙升 [18] - 图书品类在流量平台中的商业价值持续下降,渠道资源加速流失 [17] 转型路径探索 - 必须重构能力模型:聚焦AI无法替代的审美判断、深度作者关系、人性洞察等稀缺资源 [23] - 需要彻底放弃过时的爆款逻辑,建立基于AI协作的新工作范式 [22][23] - 行业转型窗口期有限,被动等待将导致系统性淘汰 [24][27] 行业数据指标 - 典型工作场景效率提升:选题生成(20个/次)、文案创作(5种风格/次)实现秒级响应 [9][10] - 内容消费时长对比:传统深度文章(10分钟) vs 短视频内容(15秒) [17] - 流量转化率断崖:头部渠道图书佣金远低于快消品(口红/零食) [17]
马斯克xAI发布Grok 4:训练算力提升100倍,多项测试中领先第二名一倍
凤凰网· 2025-07-10 14:20
技术升级 - xAI发布新一代大语言模型Grok 4及多智能体协作版本Grok 4 Heavy,训练算力投入相比前代提升100倍[1] - Grok 4在HLE基准测试中解决25%博士级难题,Grok 4 Heavy版本提升至超过50%[1] - 模型演进过程中每代产品训练算力实现数量级提升,Grok 4强化推理和自我纠错能力[1] 技术架构 - Grok 4基于第六代基础模型构建,第七代模型将改善视觉理解能力[2] - 支持256K上下文长度的API接口,在商业场景测试中净资产收益率达竞争对手两倍[2] - 在GPQA、AIME等推理测试中领先,Grok 4 Heavy在Live Coding Bench获满分[2] 功能增强 - 工具使用能力整合进训练过程,可完成黑洞可视化、体育预测等复杂任务[2] - 语音交互延迟降低50%,新增高自然度语音选项[3] - 正在开发编程模型,计划启动视频生成模型训练,预计使用超10万张H200显卡[3] 商业化进展 - 推出Super Grok Heavy订阅服务,包含Grok 4和Grok 4 Heavy双版本[3] - API发布加速企业级应用落地,展现复杂商业环境应用潜力[2][3] 行业展望 - 传统考试测试意义减弱,现实应用效果将成为AI智能评判标准[3] - 预计Grok可能在年底或明年初实现有用技术发现,甚至发现新物理学知识[3] - 多智能体协作创新为AI技术实际应用开辟新可能性[1][3]