Workflow
大语言模型
icon
搜索文档
论道AI与低空经济,如何引领下一轮产业革命?
凤凰网财经· 2025-09-25 14:12
人工智能技术应用与进展 - 人工智能已深度融入日常生活 成为推动传统行业智能化转型的重要力量 中国一半新建地铁实现无人驾驶[3] - AI驱动的无人机系统在封闭环境中实现自主建图与路径优化 通过反复飞行提升作业精准度 交控科技与港铁合作研发隧道无人机巡检方案[5] - 大语言模型具备跨语言关联能力 采用混合语料训练缓解中文语料不足问题 需挖掘高质量中文数据提升模型能力[5][7] - 高质量高知识密度内容资源可提升中文模型能力 数据总量持续快速增长 关键在于筛选利用高质量数据避免同质化[7] 低空经济发展路径 - 低空经济发展将经历从赋能传统行业到物流爆发再到全面普及的过程 类比汽车工业早期阶段[12] - 电动垂直起降飞行器通过降低飞行员和航油成本释放空域生产要素 相比传统直升机更具成本优势[12] - 空中航路建设成本显著低于地面设施 可实现点对点高效连接 低空经济本质是经济 核心在于成本更低更具普惠性[12] - 中国具备低空经济后发优势 空域管理严格导致环境相对干净 有利于构建无人驾驶航空器为主的管理体系[12] 飞行汽车技术路线 - 小鹏汇天实施三步走发展战略 第一步计划2026年量产交付分体式飞行汽车 初期主要用于空中观光而非通勤[8] - 第二步研发倾转旋翼和六旋翼构型产品 实现长航程高航速飞行 可满足省内甚至跨省飞行需求 成为真正交通工具[10] - 第三步开发一体式飞行汽车 可实现陆行与空中模式切换 目前原理样车受电池能量密度限制仅能飞行3分钟[10] - 飞行汽车属于高安全要求复杂系统产品 现阶段AI可帮助提效但人工检查仍不可或缺 关键数据需人工兜底[11]
京东集团-SW一度涨超6% 将在未来三年持续投入 带动形成万亿规模人工智能生态
智通财经· 2025-09-25 11:17
股价表现 - 公司股价一度上涨超过6% 截至发稿时上涨6.47%至141.6港元 [1] - 成交额达到19.07亿港元 [1] 战略规划 - 公司宣布未来三年将持续投入人工智能领域 目标带动形成万亿规模的人工智能生态 [1] - 创始人刘强东亲自担任京东探索研究院院长 在全球范围内招募人工智能科学家 [1] 研发布局 - 京东探索研究院成立于2020年11月 是专注于前沿科技探索的研发部门 [1] - 研究院深耕泛人工智能领域 包括大语言模型、多模态智能、具身智能和强化学习等方向 [1]
地缘经济论 | 第七章 制造业:创新驱动增长中的角色与关税效果分析
中金点睛· 2025-09-24 07:58
点击小程序查看报告原文 摘要 Abstract 夯实制造业基础在美国竞争性地缘经济战略中占据重要地位,一方面或源于制造业在生产网络中依然占据重要位置,另一方面是因美国政府认为其有助于 改善就业、巩固国防、推动创新与增长。这一认识值得商榷。制造业就业乘数效应虽超过其他产业,但自身吸纳的就业较少,且整体平均薪酬在非农大类 产业中最低。制造业对国防至关重要,由于美国国防工业实际产出持续增长,相关企业数量与就业人数下降不构成判定美国国防工业衰落的理由,国防工 业对于全球产业链的依赖是其主要担心所在。增长角度看,制造业更利于后发国家加速追赶,对先发国家主要体现为自身高研发投入及驱动IT产业创新。 关于制造业岗位流失是否削弱先发国家创新能力尚存争议,学界主流认可全球产业链合作利于双方创新,部分观点认为除"高模块化+高制造技术成熟 度"的产品创新型行业外,其他行业外包均需谨慎,以防削弱本土创新能力。无论美国政府对于制造业的期待是否合理,特朗普2.0均已决心通过竞争性地 缘经济战略夯实制造业,但其青睐的关税并非制造业回流充分条件,还可能引发通胀与效率的代价。关税对加征国福利的影响,取决于能否改变贸易条 件、引导消费者选择本国 ...
OpenAI发布报告解析大语言模型幻觉根源与治理路径:从机制机理到评测优化
海通国际证券· 2025-09-23 19:26
行业投资评级 - 报告未明确提及具体行业投资评级 [1][8][13] 核心观点 - OpenAI报告系统阐释大语言模型产生幻觉的内在机制 根源于概率生成范式下的表征偏移与训练数据偏差 [1][8] - 研究提出从评测体系构建与训练流程优化双路径入手建立治理框架 推动AI行业向精细化高可信方向演进 [1][8] - 该研究为AI可信性治理提供理论依据与方法支撑 将带动AI全产业链估值体系重构 [1][8] 幻觉产生机制 - 即使训练数据完全正确 基于统计概率的预训练目标必然导致一定比例的错误生成 [2][9] - 模型在预训练阶段输出校准较好 但经过人类反馈强化学习后呈现过度自信特性 [2][9] - 个人生日或论文题目等任意事实在训练语料中出现频次很低 高稀疏性是导致模型更易产生幻觉的关键原因 [2][10] - 通过单例率量化稀疏性 证明其数值构成模型在该类问题上最低错误率的下界 [2][10] 评测机制缺陷 - 主流评测基准普遍采用二元评价体系 正确计1分错误或不知道计0分 [3][7][11] - 该机制激励模型在不确定时仍倾向于猜测而非拒绝生成 系统性地加剧幻觉风险 [3][11] - 现有评估框架与实际应用安全性对齐方面存在明显不足 [3][11] 治理路径优化 - 建议在主流基准中设置信心阈值及错误惩罚机制 如规定仅当把握度高于75%方可作答 [3][12] - 该设计可维持测试覆盖广度 同时有效激励模型在低确定性情况下主动表达不确定性 [3][12] - 相比开发专用幻觉测试集 该方法更能够系统性地对齐实际应用场景对输出可靠性的需求 [3][12]
广东组团赴沪鲁高校开启“最强秋招”
新浪财经· 2025-09-20 21:10
招聘活动规模与参与主体 - 广东"百万英才汇南粤"秋季招聘活动覆盖全国超百所重点高校 计划吸纳超100万名应届高校毕业生留粤来粤就业创业[3] - 上海山东站12场招聘吸引1464家次企事业单位报名 累计提供岗位8.23万个次 其中线下岗位5.87万个次[3] - 深圳联合汕尾河源组织名企优岗赴外招聘 涵盖世界500强企业及55家上市公司 包括华为腾讯比亚迪等龙头企业[1][5] 岗位结构与薪酬分布 - 按学历划分岗位:本科生岗位5.27万个次 硕士岗位1.97万个次 博士岗位9889个次[3] - 年薪20-50万元岗位3.69万个次 50-100万元岗位8454个次 100万元以上岗位446个次[3] - 上海交通大学单场招聘提供岗位1.59万个 含博士岗1930个硕士岗3551个 其中年薪50万元以上岗位3008个[4] 产业聚焦与人才需求方向 - 招聘紧扣深圳"20+8"战略性新兴产业集群 聚焦半导体量子信息人工智能生物医药新能源智能网联汽车等前沿领域[8][9] - 岗位涵盖量子芯片设计大语言模型异构化多模态语音算法等高端技术岗 同时提供产品运营管理等职能岗位[5][6] - 新增低空经济与空天产业 人工智能升格为独立产业集群 工业母机激光增材制造精密仪器合并为高端装备产业集群[9] 区域联动与高校覆盖 - 上海站覆盖复旦上海交大等9所高校 由深圳福田罗湖宝安龙岗四区承办9场专场招聘[3] - 山东站覆盖山东大学中国海洋大学等3所高校 由深圳光明区会同河源汕尾市承办3场活动[3] - 上海财经大学专场聚焦金融审计财务岗位 上海外国语大学专场侧重跨语种项目支持与国际合作拓展岗位[6] 参与企业类型与特色 - 汇聚73家事业单位包括深圳大学香港中文大学南方科技大学等高校及鹏城国家实验室等科研机构[5] - 65家国有企业含中广核招商局鲲云信息等 55家上市公司包括奥比中光云天励飞影石科技等[5] - 宝安区专场汇聚欣旺达大族数控等先进制造企业 涵盖生物医药新能源电子信息等战略性新兴产业[6]
中金 | 具身智能系列(四):机器人大模型,多模融智,硅基具升
中金点睛· 2025-09-19 07:37
机器人大模型是迈向通用具身智能的关键路径 - 机器人大模型通过融合视觉、触觉等多模态信息弥补机器人物理常识不足 是推动产业向通用具身智能发展的重要路径[2][4] - 行业重心已从人形机器人硬件转向小脑+大脑系统研发 投资重点转向通用基础能力构建[2][18] 传统机器人存在专一性瓶颈 - 传统机器人控制存在三专一低特征:任务专一(仅完成1-2种预设任务)、场景专一(离开特定场景性能骤降)、数据专一(依赖人工标注小样本数据)、泛化能力低[10][12] - 传统控制依赖规则编程和模块化算法 难以满足复杂动态环境需求[10] 现有成熟模型应用于机器人存在局限 - 大语言模型虽在自然语言处理成熟 但存在幻觉现象 无法直接解决物理操作问题 主要充当顾问角色而非执行者[4][24][25] - 自动驾驶模型与机器人有技术相通性 但机器人面临更复杂场景和更高通用性要求 难以突破极端场景泛化不足问题[4][29] 机器人大模型解决物理常识缺失问题 - 通过多传感器融合视觉、触觉、力量感应数据 构建物理属性表征 在仿真环境中训练弥补物理常识缺失[17] - 采用仿生学习路径 如RTR框架实现实时模型更新 模仿学习通过人类示范数据初始化策略[17] 商业化路径分化为硬件优先与模型优先 - 硬件优先路径由车企和机器人企业主导 侧重硬件本体研发和运动数据积累[41] - 模型优先路径由AI企业主导 先构建智能大脑再反向定义硬件需求[41] - 2025年上半年国内机器人产业链披露88起融资事件 同比增长近80% 融资规模超50亿元[36] 产业发展趋势与挑战 - 多数企业将聚焦垂直领域实现通用/柔性应用 仅少数全栈能力企业有望定义具身智能标准[5][43] - 产业将向专业化分工模式演进 形成技术层与商业层分工协作体系[46] - 面临数据稀缺问题 真机数据、仿真语句和互联网视频是主要训练数据来源[47] - 存在安全隐患 对抗攻击可导致系统性能下降21.2%-30.2%[49] 技术实现方式与案例 - 海外机器人大模型如谷歌RT-1/RT-2、PaLM-E等已展现端到端控制、对象泛化性和零样本能力[34] - 多模态融合技术整合视觉、语音、触觉信息 提升环境感知与操作精度[27]
智能世界2035_华为
华为· 2025-09-17 13:13
AI技术发展现状与挑战 - AI技术自本世纪初迅猛发展 标志着科技革命进入新纪元 但发展仍处于起步阶段 应用主要集中在问答功能为主的AI助手[4] - AI系统通常被视为"黑盒子" 其属性难以像传统ICT系统那样被完全理解和保障 有待解决的关键问题是如何将基础模块有效组合 打造人类智能水平的系统[4] - AI在工业和服务领域应用潜力巨大 但尚未得到充分挖掘[4] 智能世界2035愿景 - 报告描绘AI发展愿景 探讨技术融合推动工业和服务智能系统转型 包括自主交通系统 智能电网 智能工厂与农场 自主通信网络等[5] - 全面分析AI在医疗 教育 智能家居 智慧城市和商业创新等服务领域的应用及影响 强调AI与其他创新技术的协同效应[5] - 教育应用将动态分析学生知识掌握情况 帮助教师实时生成个性化教学方案 医疗行业将融入由AI 数字行为建模 远程医疗和合成生物学等技术驱动的全球健康生态系统[5] 技术挑战与突破方向 - 实现愿景需克服超越通用人工智能范畴的技术挑战 目标不仅是创造理解学习人类智力任务的机器 更在于让机器整合自身能力自主行动感知环境[7] - 智能系统构建颠覆传统系统工程 需将传统ICT模型开发与数据驱动AI技术结合 通过混合解决方案确保安全高效决策[7] - 系统验证从理性主义向经验主义转变 需开发更严格验证技术 通过基于知识监测技术弥补可靠性降低影响[7] 未来技术发展趋势 - 迈向通用人工智能关键在于走向物理世界 机遇包括更有效感知世界 更智能模型算法 更高效算力芯片[11][12][13] - 新一代传感器可能成为新"奇点" 向脑智能学习可能带来重要突破 光计算 量子计算 存算一体等新范式有望变革智能"物质基础"[11][12][13] - 智能本质在于对物理世界理解互动与重塑能力 真正突破或将源于数据空间和物理空间深度融合的新架构[16] 算力与基础设施需求 - 2035年全社会算力总量比2025年增长10万倍 计算领域将迎来历史性变革 在计算架构 材料器件 工程工艺 计算范式四大核心层面实现颠覆性创新[30] - 数据成为推动AI发展"新燃料" 到2035年人工智能存储容量需求比2025年增长500倍 占比超过70%[31] - 全球数据中心耗电量将高达1.5万亿度 能源供给需要发生大变革 可再生能源发电量占比将突破50%[31] 产业应用与影响 - 智能体将从执行工具演进为决策伙伴 驱动各产业发生智能化革命 预计2035年人工智能应用率超过85% 提升劳动生产率60% 产品缺陷率降低至0.05%以下[29][32] - 医疗行业将从"以疾病为中心"转向"健康全周期管理" AI将助力预防超过80%慢性病[32] - 超过90%中国家庭将拥有智能机器人 人类将逐渐进入全息生活空间时代[32] 生态与商业模式变革 - 移动互联网生态从App走向多Agent协同 用户从"驾驶员"变为"指挥官" 生态本质从"人找服务"变为"服务找人"[101] - 商业模式从注意力经济(广告)转向直接价值交换 如智能即服务 API和Token调用 基于委托任务成功的支付[106] - 端云协同成为新生态最优解 最大化发挥端侧快和云侧强优势 解决信息安全隐患和云端算力成本问题[107] 具身智能发展前景 - 具身智能是AI走向物理世界关键体现 融合AI技术 感知交互 计算存储 通信网络 三电等多领域技术[109] - 智能驾驶已跨越技术鸿沟 2035年将实现L4+自动驾驶 L5启动试商用[113][116] - 智能机器人将跨越技术鸿沟 2035年家庭机器人售价低于1万美金 产业进入爆发期[118][120]
面对已读乱回的AI,到底要如何分辨真假?哈工大&华为大模型幻觉综述!
自动驾驶之心· 2025-09-17 07:33
大模型幻觉定义与分类 - 大模型幻觉指大语言模型在回复中出现的常见错误,包括事实矛盾、事实编造、指令不一致、内容不一致和逻辑不一致 [2][8][9][10][11] - 事实型幻觉分为事实矛盾(实体错误和关系错误)和事实编造(不可验证和夸大幻觉) [8] - 忠实型幻觉分为指令不一致、内容不一致和逻辑不一致 [9][10][11] 大模型训练与幻觉原因 - 大模型训练包括预训练、监督微调(SFT)和从人类反馈中强化学习(RLHF)三个阶段 [7] - 数据部分导致幻觉的原因包括错误数据、社会偏见、知识边界和低质量未校准数据 [17][18][19][21][23] - 训练部分导致幻觉的原因包括预训练阶段模型结构限制、微调阶段过拟合和RLHF阶段谄媚现象 [26][30][32] 幻觉检测方法 - 事实检测分为事实提取和事实验证(外部检索和内部检查) [42] - 不确定性估计方法包括LLM内部状态(标记概率、熵、自我评估)和LLM行为(直接查询、间接查询、多agent视角) [42][43][44] - 忠实性幻觉检测指标包括基于事实、分类、问答、不确定性和LLM评判的方法 [47][48][49][50][51] 幻觉基准 - 幻觉评估基准量化LLM产生幻觉的倾向,重点关注长尾知识和易引起捏造虚假的问题 [53] - 幻觉检测基准评估现有幻觉检测方法性能,针对特定任务如数据生成文本和机器翻译 [54] - 现有基准包括TruthfulQA(817条数据)、REALTIMEOA(动态数据)、HaluEval(30,000条通用数据)等 [55] 幻觉缓解策略 - 通过数据减少幻觉的方法包括数据过滤、模型编辑(定位-编辑和元学习)和检索增强生成(RAG) [57][58][61] - 减少训练产生幻觉的方法包括优化模型结构、训练方式以及避免SFT和RLHF阶段数据冲突 [62] - 减少推理产生幻觉的方法包括事实增强解码和忠诚增强解码(上下文一致性和逻辑一致性) [64][65] 检索增强生成中的幻觉 - 检索失败原因包括用户查询制定(盲目检索、模糊查询、复杂查询)、检索数据源可靠性和检索器性能 [68][69][71][72] - 生成瓶颈涉及上下文感知(嘈杂检索、上下文冲突、未充分利用上下文)和上下文对齐(来源归属和忠实解码) [74][75]
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长
36氪· 2025-09-16 15:46
Scaling Law与模型规模扩大的经济价值 - 研究发现虽然单步任务准确率提升幅度减小,但这些微小进步叠加能使模型完成任务长度实现指数级增长,这在现实中更具经济价值 [1][2] - 论文指出模型在现实世界的价值往往源于智能体能够完成任务的长度,从这个角度观察,更大的模型非但没有收益递减,反而能将单步准确率微小提升复合放大,在任务完成长度上实现指数级跃升 [2] - 人类劳动报酬按时间计算,如果智能体经济价值源于能够完成任务时长,那么单轮或短任务基准可能并非评估进一步投资大语言模型计算资源所带来收益的可靠参考 [18] 长程任务执行的挑战与突破 - 长程任务执行一直是深度学习的致命弱点,自动驾驶demo很炫酷但要真正上路跑长途用了十多年才实现,AI能生成惊艳图片但拍一段连贯一致的长视频仍是难题 [4] - 研究通过解耦推理或智能体任务中规划和执行需求来解决问题,规划涉及决定检索什么信息或使用什么工具及顺序,而执行是让规划变成现实 [6] - 实验证实即使去除规划和知识要求,长时程任务执行对LLM仍具有挑战性,即使是表现最佳模型Qwen3-32B准确率在15个轮次内也降至50%以下 [23] Self-Conditioning效应的影响 - 研究发现随着任务推进,每步错误率本身会上升,这与人类通过练习进步形成对比,推测模型以自身容易出错历史为条件会增加未来出错可能性 [8] - 实验显示随着历史中错误率升高,后续步骤准确率急剧下降,验证模型会进行self-conditioning,这种性能下降不会通过增大模型规模而得到缓解 [8][26] - 与长上下文问题不同,扩大模型规模不能缓解self-conditioning效应,即使是参数2000亿以上的前沿大型模型仍然容易受到self-conditioning作用影响 [30] 思考模型的关键作用 - 近期思考模型不会受到先前错误影响,能够修正self-conditioning限制,顺序测试时计算量显著提升模型在单轮对话中可完成任务长度 [9] - 在没有思维链情况下,前沿大语言模型如DeepSeek V3连两步执行都无法完成,而具备思考能力版本R1则能执行200步,凸显行动前进行推理的重要性 [9] - 借助思维链,模型在单轮中能够执行步骤数量显著增加,经过强化学习训练的思维模型DeepSeek R1性能显著优于其经指令微调的对应模型DeepSeek-V3 [35] 模型性能基准测试结果 - 对前沿思考模型基准测试发现GPT-5思考版本(代号Horizon)能够执行超过1000步,远超能执行432步的Claude-4-Sonnet [9] - 实验显示开源权重模型在长时程执行方面仍在追赶仅通过API提供的模型,这凸显未来研究的机遇 [35] - 研究发现在显式提供所需知识和规划后,scaling模型大小仍能显著提高模型成功执行轮次数量,说明scaling模型价值不仅体现在让模型记住更多知识或更会寻找问题解答上 [7]
重塑创新增长 2025 Inclusion·外滩大会在沪开幕
证券日报网· 2025-09-11 15:18
大会概况 - 2025 Inclusion·外滩大会于9月11日在上海开幕 主题为"重塑创新增长" [1] - 大会设置1场开幕主论坛 44场见解论坛及科技展览和系列科创活动 [1] - 参会嘉宾来自16个国家和地区共550位 包括全球顶尖学者 产业界人士和科学家 [1] 内容聚焦 - 大会聚焦金融科技 人工智能与产业 创新创投生态 全球对话与合作 负责任创新与普惠未来五大内容主线 [1] - 内容呈现国际化 多元化特色 [1] 人工智能发展 - 人类正在进入"智能体群(agent swarm)"时代 智能体之间交互执行任务交换数据信息 [2] - 模型和GPU算力成为未来组织核心资产 企业需要扩大算力强化模型丰富数据 [2] - Agent将重塑企业流程 "超级个体+agent"带来巨大结构性变革 [2]