大语言模型
搜索文档
给自动驾驶感知工程师的规划速成课
自动驾驶之心· 2025-08-09 00:04
自动驾驶规划技术演进 - 模块化系统中机器学习主要影响感知部分,下游规划组件变革较慢[3] - 传统系统易于解释和快速调整,但机器学习可扩展性更强[4] - 学术界和工业界推动下游模块数据驱动化,通过可微接口实现联合训练[4] - 生成式AI和多模态大模型在处理复杂机器人任务方面展现潜力[4] 规划系统核心概念 - 规划系统需生成安全、舒适、高效的行驶轨迹[11] - 输入包括静态道路结构、动态参与者、占用空间等感知数据[11] - 输出为路径点序列,典型为8秒视野内每0.4秒一个点共20个点[11] - 分为全局路径规划、行为规划和轨迹规划三个层级[12] 规划技术方法 - 搜索、采样和优化是规划三大核心工具[24] - 混合A*算法通过考虑车辆运动学改进A*算法[28] - 采样方法通过参数空间采样解决优化问题[37] - 优化分为凸优化和非凸优化,后者依赖初始解[41] 工业实践 - 路径-速度解耦方法解决约95%问题,耦合方案性能更高但实现复杂[52] - 百度Apollo EM规划器采用迭代期望最大化步骤降低计算复杂度[56] - 时空联合规划处理剩余5%复杂动态交互场景[59] - 特斯拉采用数据驱动与物理检查结合的混合系统[117] 决策系统 - 决策本质是注重交互的行为规划,处理不确定性和交互问题[68] - MDP和POMDP框架将重点从几何转向概率[69] - MPDM通过有限离散语义级策略集合简化POMDP问题[102] - 应急规划生成多条潜在轨迹应对不同未来情景[112] 神经网络应用 - 神经网络可增强规划器实时性能,实现数量级加速[130] - 端到端神经网络规划器将预测、决策和规划结合成单一网络[133] - 世界模型最终形式可能是由MCTS增强的原生多模态大模型[138] - 神经网络从树结构中提取知识,形成正反馈循环[142] 发展趋势 - 规划架构趋向"端到端",更多模块被整合到单一系统[151] - 机器学习组件在规划中应用比例持续增加[151] - 算法从理论完美向工程实用演进,如Value Iteration到MCTS[153] - 确定性场景规划成熟,随机性场景决策仍是挑战[153]
Meta合同工爆料:见过脸书用户向AI聊天机器人泄露隐私
财富FORTUNE· 2025-08-08 21:05
用户与AI交互行为 - 用户过度沉迷与AI对话 向Meta的AI分享个人隐私信息如真实姓名 电话号码和电子邮箱地址 [1] - 用户会在Facebook和Instagram等平台分享高度私密的细节 包括自拍照和露骨照片 [1] - 与其他硅谷公司相比 Meta项目中未经删减个人数据的频率更高 [1] 行业背景 - 人类与AI聊天机器人过度亲密现象早有纪录 苹果 亚马逊和微软均存在类似情况 [2] - 苹果合同工曾接触Siri用户极端敏感信息 亚马逊员工手动审听Alexa用户录音 微软合同工录制审听语音内容 [2] Meta数据治理问题 - 公司依赖第三方合同工的做法及数据治理屡次失误 [3] - 2018年剑桥分析事件中 Facebook开发者平台存在广泛缺陷 开放数据接口缺乏监管 [4][6] - 公司管理层常将业务增长和用户参与度置于隐私安全之上 [6] - 2019年Facebook付费让合同工转录用户音频聊天 录音获取途径不透明 [7] 公司回应 - Meta表示制定了严格政策约束员工和合同工访问个人数据 [8] - 公司限制合同工可获取的个人信息范围 设置流程和安全防护措施处理敏感数据 [9] - 合同工根据公开隐私政策及AI条款可访问特定个人信息 未经授权数据共享将受处置 [9] 公司形象重塑 - 2021年公司更名为Meta 宣称面向元宇宙战略转型 但数据管理黑历史持续存在 [7] - 当前使用人工审核员优化大语言模型是行业惯例 但Meta最新爆料再度引发质疑 [7]
新网银行积极开展2025年全国金融科技活动周宣传活动
中国经济网· 2025-08-08 15:22
(责任编辑:华青剑) 与此同时,新网银行策划主题直播,两位AI专家在直播间细致讲解科技实践应用,生动展示 AIGC、大语言模型等前沿技术,多维度呈现人工智能带来的科技成果,营造热爱科学、崇尚创新的浓 厚氛围,并提高了公众对金融科技的认识和兴趣。直播中,嘉宾们还结合当前网络安全热点话题,提醒 观众在体验AI技术便捷性的同时,也要警惕各类"AI投毒""AI幻觉"。新网银行视频号、微博号、抖音号 多平台现场直播,累计观看人数实现10万+。 新网银行深化数字化战略布局,依靠自身力量,深度融合大数据、隐私计算与人工智能等数字技 术,构建起贯通多场景的开放生态平台,形成了全在线、全实时、全客群的银行业务模式。面向未来, 新网银行将深化前沿技术与金融业务场景的融合创新,通过打造多元化数字普惠金融产品,满足大众多 层次金融需求,以数字技术培育新质生产力,扎实做好五篇大文章的时代答卷。 近期,新网银行以全国金融科技活动周为契机,围绕"矢志创新发展,建设科技强国"主题,精心策 划并开展了一系列丰富多彩的金融科技宣传活动,积极面向公众宣传科普各类知识,为建设科技强国贡 献金融力量。 在全国金融科技活动周期间,新网银行充分利用线上渠 ...
探路数字金融,零售之王“智变”的求索与未来
中国经济网· 2025-08-08 15:22
核心观点 - 人工智能推动技术竞技 数字化成为银行必答题 招商银行是行业排头兵 [1] - 数字金融是技术金融创新叠加的高级形态 提升金融供给效率 促进普惠便捷智能服务 [2] - 公司完成全面上云 成为国内前7家系统性重要银行中首家实现该目标的银行 [2] - 智算平台成为第二大科技投入方向 专注金融垂直领域大模型开发 [3] - 数据获取与风控体系领先 依托AI机器学习实时计算 构建全生命周期风险管理 [4] - 小微金融风控创新 通过数字化纯信用贷款产品解决融资难题 [5][6] - 大语言模型已在120多个场景应用 显著提升效率并降低边际成本 [7] - 技术应用仍面临资源消耗 数据隐私 可解释性等挑战 需政策市场协同 [8] 数字化建设 - 2022年底完成全面上云工程 覆盖全部借记卡信用卡对公账户及所有应用系统 [2] - 基础能力跃迁体现于业务数据:招企贷累计放款超500亿元 服务5万小微企业 其中76%首次获得信用贷款 [2] - 在云南咖啡产区等场景 数字化授信使融资成本下降30% [2] 人工智能布局 - 2024年初将智算平台列为第二大科技投入方向 包括大语言模型训练与推理平台 [3] - 探索目标为金融垂直领域大模型而非通用模型 [3] - 采用FinTech基金方式 以有限容错成本撬动大模型潜能 [7] 数据风控体系 - 零售智慧风控生态体系依托AI机器学习实时内存计算引擎 迅速识别风险数据并精准拦截 [4] - 整合客户账户交易等多维度数据 结合账户分级AI语音外呼等手段 构建事前事中事后全周期管理 [4] - 反欺诈系统日均侦测交易风险千万次 [7] 小微金融创新 - 推出基于大数据模型的数字化纯信用贷款产品招企贷 实现数据业务终端"一体化" [5] - 累计发放超500亿元纯信用免抵押贷款 实现"一台手机秒级审批" [6] 大模型应用成效 - 全行超120个场景应用大语言模型 [7] - 超2000万用户享受手机银行智能服务 [7] - RPA机器人替代50%人工操作 [7] - 前端客服流程从5分钟缩短至秒级 营销文案生成效率大幅提升 [7] - 天秤风控平台利用神经网络算法精准识别风险 [7] 发展挑战 - 面临数字资产计量确权 大模型黑箱风险 数据隐私伦理等挑战 [3] - 存在资源消耗巨大 数据隐私保护要求高 答案生成可解释性较弱等问题 [8] - 呼吁政务企业个人数据权属建立分级授权机制 [8]
SuperX首发全栈式多模型一体机,开创多模态智能体协同新纪元
中国产业经济信息网· 2025-08-08 15:17
产品发布核心信息 - Super X AI Technology Limited于8月7日正式发布多种规格的多模型一体机[1] - 该产品是继7月30日推出SuperX XN9160-B200 AI服务器后的又一重大创新AI产品[1] - 产品预搭载OpenAI最新发布的GPT-OSS-120B和GPT-OSS-20B大语言模型,并可选择下载其他热门开源模型[1][2] 产品特性与技术创新 - 产品开创性地实现多模型协同架构,具备“开箱即用、多模融合、场景穿透”三大特征[1] - 首次实现推理模型、通用模型、多模态模型、语言合成/识别模型、嵌入模型、重排模型、文生图模型的预设、调用、加速、管理和迭代[3] - 通过认知跃迁功能实现多种智能体协作,支持文本描述直接定位视频片段等复杂业务场景[3] - 依托内置门户助手与知识库系统进行知识赋能,能够支持60+预置场景智能体[3] - 实现云端协同缓存模型赋能,通过本地与云端模型仓库联动让用户第一时间体验最新模型[3] 性能与成本优势 - GPT-OSS-120B在多项关键基准测试中表现已能媲美甚至超越部分业界顶尖闭源模型[2] - 产品融合软硬件深度优化技术,实现分钟级开机部署,无需额外配置服务器和运维团队[5] - 面向中大型企业的一体机可以集群方式提升吞吐性能,平替主流公有云MaaS API服务[5] 市场定位与定价策略 - 产品适合全球千行百业需要本地部署AI的行业客户,面向不同规模企业推出多种规格[1] - AI服务器B200标准版定价50万美元,集群版定价400万美元[5] - AI工作站标准版定价5万美元,旗舰版定价25万美元[5] - 标准版适配中小企业,集群版可覆盖全场景;工作站标准版适合企业级个人使用,旗舰版适合专业人员及团队[5] 行业背景与发展前景 - 以DeepSeek为代表的开源模型引发业界对算力需求发展变化的新一轮思考[2] - AI大模型需求正呈现指数级增长,在教育、科研、医疗、金融、汽车、泛工业等领域有广泛应用场景[5] - 多模型协同被视为AI通向AGI服务人类应用演进的关键一步[6]
亏到发疯,AI编程独角兽年入2亿8,结果用户越多亏得越狠
36氪· 2025-08-08 15:13
收入与估值表现 - AI编程公司年经常性收入表现突出:Windsurf达4000万美元[1]、Cursor达5亿美元[1]、Replit达1亿美元[1]、Lovable预计2025年6月达7000万美元[1] - 公司估值快速增长:Windsurf半年估值翻倍至30亿美元[1]、Cursor估值99亿美元[1]、Replit估值11.6亿美元[1] - Replit在18个月内实现收入增长10倍[1],Cursor创下SaaS行业最快达到1亿美元年经常性收入纪录(12个月)[1] 成本结构与盈利困境 - 行业普遍存在高运营成本问题,毛利率呈现显著负值[4],Windsurf运营成本远高于收入[4] - 大语言模型调用成本是主要支出项,按Token计价的可变成本随用户量增加而上升[5] - 模型供应商持续更新产品迫使公司跟进升级,进一步推高成本[5] - 所有代码生成产品利润率接近盈亏平衡或处于亏损状态[6],可变成本占比普遍在10%-15%之间[6] 市场竞争环境 - 行业面临多重竞争压力:包括Cursor、Replit、Bolt、Lovable等新兴公司[7] - 基础模型供应商如Anthropic和OpenAI直接进入市场参与竞争[7] - 行业存在重投入、高使用成本特性且难以形成有效护城河[7] - 用户对价格高度敏感,存在快速转向更优替代工具的可能性[12] 盈利改善尝试 - 通过自研模型降低对外部供应商依赖:Cursor母公司Anysphere于今年一月宣布自研计划[9],但七月份出现核心团队成员回流Anthropic的事件[9] - Windsurf因成本考量放弃自研模型计划[9] - 部分公司寄希望于大语言模型成本下降:预期新一代模型如GPT-5可能通过提升计算效率降低推理成本[10] - 直接调整定价策略:Anysphere将Claude模型新增成本转嫁给高活跃度用户,专业版订阅价格调整引发用户争议[12] 行业特性与挑战 - 商业模式存在根本性矛盾:用户增长导致模型调用量增加,进而推高可变成本,与传统软件行业的规模效应相反[5] - 当前推理成本处于历史最高水平[12],且最新AI模型因处理复杂任务需求增加,部分成本不降反升[12] - 公司面临战略选择困境:Windsurf选择通过出售公司在市场被巨头瓜分前锁定回报[9]
亏到发疯!AI编程独角兽年入2亿8,结果用户越多亏得越狠
量子位· 2025-08-08 13:34
核心观点 - AI编程公司表面收入高增长但实际普遍亏损,商业模式面临高可变成本与低利润率的挑战 [1][4][6] - 行业竞争加剧且护城河薄弱,模型供应商亲自下场加剧生存压力 [12][31] - 扭亏尝试包括自研模型、寻求收购、转嫁成本,但均存在显著执行障碍 [15][19][25] 行业现状 财务表现 - Windsurf年收入4000万美元但运营成本远超收入,毛利率为负值 [2][7] - Cursor年收入5亿美元创SaaS最快破1亿ARR纪录(12个月),估值99亿美元 [2] - Replit年收入1亿美元(18个月增长10倍),估值11.6亿美元 [2] - Lovable预计2025年6月ARR达7000万美元,获1430万欧元融资 [2] 成本结构 - 大模型调用费占成本大头,按Token计价导致用户越多成本越高 [8][10] - 可变成本占比普遍达10%-15%,所有代码生成产品利润率接近平衡或亏损 [11] - 基础模型频繁升级迫使公司持续投入,形成成本恶性循环 [9][10] 竞争格局 - 参与者包括Cursor、Replit、Bolt、Lovable等初创公司及Anthropic、OpenAI等模型供应商 [12] - 用户价格敏感度高,产品替代性强难以建立忠诚度 [30][31] - 行业重投入、高使用成本特性加剧生存难度 [12] 扭亏尝试 自研模型 - Windsurf因成本过高放弃自研计划 [17] - Cursor母公司Anysphere宣布自研模型但核心人才流失 [18][19] 资本运作 - Windsurf选择以30亿美元估值出售,趁市场未饱和锁定回报 [20] 成本转嫁 - Anysphere调整定价结构,向活跃用户转嫁Claude模型新增成本 [26] - 价格策略引发用户不满,CEO被迫公开道歉 [27][28] 外部依赖 - 部分公司寄希望于大模型成本下降,但新一代模型推理成本不降反升 [21][24]
汽车早报|恒大汽车继续停牌 日本七大车企利润或将大幅缩水
新浪财经· 2025-08-08 08:42
地方政府汽车消费补贴政策 - 成都锦江区对购置家用乘用新车提供至高4500元购车补贴 [1] - 成都成华区对限上汽车企业购置家用乘用新车提供至高6500元购车补贴 [1] 新能源汽车产品动态 - 武汉经开区2025年底拟上市20款新能源汽车 [2] - 上汽奥迪E5 Sportback将于8月18日开启预售 搭载高通骁龙8295芯片及火山引擎大语言模型定制系统 [2] 企业技术研发进展 - 理想汽车获防撞梁新专利 通过储气腔设计减轻整车重量并提升抗变形能力 [3] 汽车销量数据 - 本田中国7月终端汽车销量44,817辆 同比减少14.75% [3] - 赛力斯7月新能源汽车销量44,581辆 同比增长5.7% [3] - 本田中国1-7月累计销量359,969辆 [3] - 赛力斯1-7月新能源汽车累计销量216,689辆 同比下降10.87% [3] 充电基础设施建设 - 特斯拉全球超充桩数量超7万个 其中国内超11,700桩 [5] 产能扩张计划 - 丰田汽车在日本爱知县购置土地新建制造厂 计划2030年代初投运 [6] - 现代汽车与通用汽车联合开发五款车型 预计年销量超80万辆 [6] - 联合开发车型包括四款中南美市场车型及一款北美电动商用货车 首批计划2028年推出 [6] 供应链合作 - 通用汽车与Noveon Magnetics签署稀土磁体供应协议 7月已开始交付 [6] 国际贸易影响 - 美国汽车关税可能导致日本七大车企2025财年营业利润减少2.67万亿日元(约1,302亿元人民币) 相当于上财年利润三成多 [6]
面对AI业务的困境,苹果选择了吃“回头草”
36氪· 2025-08-07 19:51
苹果AI战略调整 - 公司低调成立新内部团队AKI 旨在开发类似ChatGPT的AI聊天机器人 由前Siri开发主管罗比·沃克领导[3] - 软件工程主管克雷格·费德里吉成为苹果AI团队新负责人 原Siri主管被边缘化 公司可能采取内部赛马机制并行开发个性化Siri与AKI项目[3] - 公司2023年曾否认开发聊天机器人 但在Apple Intelligence表现平淡及个性化Siri延迟后重新对聊天机器人产生兴趣[1] 股价表现与市场压力 - 2025年以来公司股价下跌约16% 在"美股七姐妹"中表现仅优于特斯拉[5] - 尽管iPhone、Mac和服务等核心业务线均实现超预期增长 华尔街分析师认为AI竞赛失利是股价下跌原因之一[6] - CEO库克在8月1日员工会议上强调AI革命重要性 将其与互联网、智能手机、云计算和应用程序并列称为"转折点" 承认公司起步较晚但强调历史上有后来居上先例[6] 人才流失与技术挑战 - 基础模型团队AFM负责人庞若鸣以2亿美元身价转投Meta 团队中杰出工程师马克·李、汤姆·冈特及多模态专家张博文也陆续加盟Meta[6] - AI研究人员身价被抬高至媲美体育明星 因AI开发高度依赖天才研究人员 关键人员流失对Apple Intelligence基础模型构成重大挑战[8] - 个性化Siri开发面临技术难题 因其作为通用智能体需调用iPhone多项功能 对技术实力和工程能力要求极高 而公司追求产品稳定性的调性导致项目延期[10][12] 产品战略转向 - AI聊天机器人开发难度相对较低 文生文本是大语言模型基础能力 使用场景单一化降低系统性风险[12] - 只要基础模型能力不被ChatGPT、Gemini大幅领先 公司AI聊天机器人有望提供合格体验[12] - AKI团队被视为应急产物 旨在应对友商端侧AI竞争压力 避免忠实用户失望[12]
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
量子位· 2025-08-07 18:13
强化学习探索难题 - 传统RL框架下大语言模型存在探索与利用严重失衡问题,模型熵值迅速下降导致推理路径固化[1] - 过早收敛现象削弱了模型多样性生成能力并限制性能上限突破[2] FR3E框架设计原理 - 核心思想受OpenAI论文启发,采用"先返回,再探索"两阶段结构[2][4] - 通过识别高不确定性关键token作为锚点引导多样化展开,系统性重建探索机制[4] - 采用双难度混合数据策略:低难度数据稳定初期训练,高难度数据激发深层推理[23] 算法实现细节 第一阶段:First Return - 对每条prompt进行多次rollout收集轨迹及奖励信号,采用拒绝采样过滤全正确样本[12] - 构建基准路径并计算token生成熵,筛选top-n高熵token划分partial rollout[13] 第二阶段:Entropy-Eliciting Explore - 在GRPO++基础上引入动态优势调制机制,公式化定义优势调制因子αj[16][17] - 调控后的Advantage A'根据价值边际改善动态缩放学习信号[18] - 正向影响时降低advantage保留探索空间,负向影响时放大信号突破瓶颈[20][22] 实验结果验证 - 在GSM8K等7个数学推理基准测试中,FR3E平均表现较GRPO++提升1.8%-3.1%[25] - Qwen2.5-32B模型在AIME24基准取得6.1%显著提升[25] - 训练动态显示FR3E熵值衰减更慢,响应长度更长,突破微调模型僵化困境[26] - 全正确轨迹数量显著增加,全错误轨迹比例大幅降低[27] 方法论价值 - 结构化探索范式有效解决LLM强化学习中探索不足的核心瓶颈[28] - "结构化反馈+自适应调节"思想具备良好可扩展性,为未来训练提供新范式参考[29]