大语言模型
搜索文档
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点LatePost· 2025-04-10 22:52
自动驾驶技术路线 - 行业存在多种技术路线实现无人驾驶 包括基于高精地图的RoboTaxi路线和特斯拉的渐进式路线 [2] - 元戎启行提出新解法RoadAGI 借鉴大语言模型发展路径 从弱专家到通才再到强专家模型 [2][3] - RoadAGI旨在打造移动能力通才系统 可应用于汽车/摩托车/配送小车等多种终端 为L5级自动驾驶奠定基础 [3][5] 技术演进与创新 - 智驾技术范式经历多次迭代 从Transformer到BEV再到端到端 特斯拉曾是主要引领者 [3] - 元戎启行率先采用前融合/无高精地图/端到端/VLA等新技术范式 是国内三家量产城市NOA的供应商之一 [3] - 通才模型通过多终端数据训练 可实现能力跃迁 如1000公里接管的通才系统在汽车上可能达到10万公里接管 [6] 行业竞争格局 - 特斯拉FSD进入中国市场 虽未完全本地化但基础能力强大 国内智驾水平相当于FSD V12阶段 [12] - 比亚迪/吉利等车企将智驾门槛降至10万元以下 多数车企选择与供应商合作 二线供应商已遭淘汰 [3] - 当前量产车辆达4万台 预计2024年提升至20万台 数量级差异对数据收集的影响呈对数关系而非线性 [10] 工程与商业化 - 工程能力与技术能力同等重要 元戎启行通过首个量产项目建立体系 接单效率从30人/项目提升至10人/项目 [9] - 供应商需平衡技术迭代与客户服务 元戎启行目标在实现L5基础上发展物理世界通用AI 而非单纯追求规模 [12][13] - 车企与供应商数据共享形成共赢 模型迭代可提升产品效果促进销售 [11] 未来发展方向 - L5级自动驾驶被视为可实现目标 大模型方法出现后五年内落地概率显著提升 [12] - 终局阶段智驾差异化将减弱 核心是提供符合用户偏好的"司机"体验 但当前技术距真正好用仍有差距 [12] - 物理通用人工智能(AGI)成为更长期愿景 超越单一自动驾驶范畴 [15]
招商银行首席信息官周天虹:大语言模型给银行业带来的四重变化
财经网· 2025-04-10 20:22
文章核心观点 2025年4月10日“人工智能与金融未来”国民财富发展研究合作平台2025春季峰会在北京召开,招商银行首席信息官周天虹称大语言模型这波人工智能浪潮主角,其在银行业有广阔应用空间,能带来积极影响 [1] 大语言模型为银行业带来的变化 - 服务模式从“以重点客户为中心”转变为“以每个客户为中心”,此前80%投入服务20%客户,大语言模型助力实现“千人千面”个性化服务覆盖所有客户 [2] - 工作模式形成人类员工和智能体员工高效协同新局面,智能体员工可协助甚至一定程度替代人类员工完成简单重复性工作 [2] - 交互模式从“GUI”演变到“GUI+Chat”,基于客户意图动态组织界面,带来更好感受 [2] - 数据分析方面大模型提升分析效率、降低门槛,使“人人都能做数据分析” [3]
昌平区仲裁院立案庭上线调解仲裁智能体
新京报· 2025-04-09 19:28
公司产品与服务 - 公司推出名为“昌小仲·智慧仲裁”的调解仲裁智能体,该产品是“DeepSeek大语言模型+昌小仲AI数智员工”交互应用的全新探索 [1] - 产品集成了“智慧申请”、“智能问答”、“智学课堂”等核心功能板块 [1] - “智慧申请”作为主要板块,具备语音智能转写、光学字符识别、联网数据自动抓取、线上快捷打印等功能,可“一键生成”规范的电子仲裁申请书 [1] - 产品支持通过智能一体机或手机扫码两种方式完成操作,为申请人提供了便利 [1] 运营效率与模式创新 - 该创新改变了传统工作模式,取代了以往工作人员人工指导手写申请书、人工审核材料的流程 [2] - 产品的应用大大提高了仲裁立案受理效率 [2] - 产品的应用提升了群众在调解仲裁活动中的服务体验感 [2] - 公司计划持续探索智能体在仲裁案件处理中的全场景应用,打造仲裁案件全生命周期高效智能管理框架 [2] 市场定位与客户价值 - 产品旨在为劳动者和企业提供“少跑路”申请仲裁的服务 [2] - 产品旨在提供“无障碍”沟通问询的服务 [2] - 产品旨在提供“全流程”案件追踪的服务 [2] - 产品旨在提供“不打烊”暖心服务 [2]
【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建
广发金融工程研究· 2025-04-08 11:35
大语言模型在金融领域的应用 - 大语言模型(LLMs)凭借强大的文本理解、信息提取和推理预测能力,正在改变传统金融分析和决策方式,为投资管理、市场分析、风险控制等领域带来新机遇 [1][9] - LLMs能处理海量非结构化数据如新闻报道、社交媒体、企业财报等,帮助投资者更快获取关键信息,并具备情感分析能力识别市场情绪变化 [9] - DeepSeek系列模型基于Transformer架构,使用GQA和FlashAttention2技术优化,开发成本仅600万美元,每百万输入Tokens价格0.14美元,显著低于ChatGPT 4.0的2.50美元 [15] 基金季报行业观点定量解析方法 - 通过DeepSeekV3模型对约18000份主动型权益基金季报观点文本进行行业观点解析,样本筛选标准包括存续超5年、权益仓位超60%、规模超2亿等条件 [28] - 模型输入需加入特定提示词明确任务目标,输出格式设定为"行业名称:得分",单次计算平均耗时10秒,总耗时约50小时处理20M输入和3M输出tokens [35][36] - 行业观点统计显示电子(58.55%)、电力设备(65.25%)、计算机(55.98%)等行业提及率最高,机械设备看多比例达91.18%,房地产看空比例54.15% [44] 行业轮动策略构建与表现 - 构建14个行业观点指标,包括看多/看空比例、关注度及其环比变化等维度,指标间相关性分析显示关注度与看多比例呈正相关(0.92) [61][62] - 测试发现基于看空比例及其环比变化的策略在熊市表现优异,而看多比例策略仅在牛市阶段跑赢行业平均 [67][71] - 结合看多比例和关注度的组合策略中,"低比例关注+低比例看多"组合表现最佳,而"高比例关注+高比例看多"组合未跑赢行业平均 [77][80] 行业关注度动态变化特征 - TMT板块关注度在2023Q1(AI概念行情)和2024Q3显著上升,电子、计算机等行业长期保持高关注度 [47] - 消费板块中食品饮料、医药生物关注度较高但呈下降趋势,纺织服装、轻工制造平均提及率不足10% [49] - 上游周期板块2021年关注度短暂上升后回落,煤炭行业因红利风格保持相对高关注度 [51] - 中游制造板块电力设备、汽车行业关注度随新能源行情波动,机械设备行业关注度稳定 [54]
【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建
广发金融工程研究· 2025-04-08 11:35
大语言模型在金融领域的应用 - 大语言模型(LLMs)凭借文本理解、信息提取及推理预测能力,正在改变传统金融分析和决策方式,为投资管理、市场分析、风险控制等领域带来新机遇 [1][7] - LLMs能处理海量非结构化数据(如新闻、财报、政策文件),识别市场情绪变化,辅助投资决策 [7] - DeepSeek-R1模型成本效益显著,开发成本低于600万美元,每百万Tokens输入价格0.14美元,远低于ChatGPT 4.0的2.50美元 [13] 基金季报行业观点定量解析方法 - 使用DeepSeekV3模型解析约18000份主动型权益基金季报观点文本,筛选标准包括存续超5年、权益仓位>60%、规模超2亿等 [26] - 通过特定提示词控制模型输出格式,统计看多/看空行业数量及占比,构建14个行业观点指标 [33][56] - 样本基金季报观点文本长度中位数约600字符,80%集中在300-1000字符范围 [26][27] 行业观点分布特征 - 电子、电力设备、计算机等行业关注度最高,提及频次超50%;纺织服饰、轻工制造等行业关注度不足10% [42] - 机械设备行业看多比例达91.18%,房地产行业看空比例达54.15% [42] - TMT板块关注度受AI概念驱动显著上升,如2023Q1 ChatGPT行情带动计算机等行业关注度提升 [45] 行业轮动策略构建与表现 - 策略基于看多比例、关注度及其环比变化构建8种组合,调仓频率为季频(1/4/7/10月末) [62][74] - "低比例关注+低比例看多"组合表现最佳,"高比例关注+高比例看多"组合未跑赢行业平均 [75] - 关注度下降且看多比例下降的行业组合在回测中表现优于市场平均水平 [76] 主动型权益基金行业配置效果 - 2025年偏股混合型基金指数累计收益率4.65%,跑赢中证800指数5%,行业配置贡献0.89%超额收益 [19][20] - 超额收益主要来自TMT板块配置比例上调,显示主动权益基金的行业配置观点具备参考价值 [19]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
文章核心观点 - 中国科学技术大学MIRA实验室王杰教授团队提出一个创新框架KG-SFT,旨在通过引入知识图谱来提升大语言模型在特定领域的知识理解和处理能力[1] - 该框架通过生成蕴含丰富领域知识和逻辑关系的推理过程,解决了LLMs在专业领域知识理解和推理能力弱的问题[6][7] - 实验结果表明,KG-SFT在多个领域和语言的数据集上效果显著,尤其在低数据场景下性能提升明显,并成功入选ICLR 2025[2][19][20] KG-SFT框架工作机制 - 框架核心是将知识图谱与监督微调相结合,通过生成逻辑严密的推理过程解释来增强LLMs对知识和逻辑的理解[6][7] - 框架包含三个关键组件:Extractor、Generator和Detector[8][10] Extractor组件 - 负责对问答对中的实体进行识别,并从外部知识图谱中提取相关的推理子图[11] - 通过命名实体识别和多条推理路径检索,有效揭示Q&A对背后的知识关联和逻辑[12][13] Generator组件 - 利用图结构重要性评分算法对推理子图中的实体和关系进行评分,选择高分部分作为重要内容[14] - 使用大型语言模型生成逻辑清晰、流畅的解释草稿,帮助LLMs理解问题与答案间的关系[15][16] Detector组件 - 对生成的解释草稿进行句子级别的知识冲突检测,确保解释的正确性[17] - 通过自然语言推理模型和重新引导机制,标记并纠正可能存在的知识冲突,提高解释可靠性[18] 实验结果与性能 - 在低数据医学问答任务中,KG-SFT在英语场景下仅使用5%的训练数据就比传统方法提高近14%的准确率[20] - 具体数据表明,在5%训练数据下,MedQA英语准确率从26.02%提升至40.00%,MedQA中文从35.57%提升至38.83%[21] - KG-SFT可作为插件式模块与现有数据增强方法结合使用,进一步提升性能,例如与AugGPT结合在MedQA英语上从40.29%提升至40.92%[23][24] - 该方法在多个领域数据集上展现出广泛适用性,尽管在形式逻辑等复杂推理领域表现稍逊,但整体竞争力较强[24][25]
速递|谷歌换帅Gemini:NotebookLM之父接棒,能否扭转流量仅为ChatGPT十分之一的困局?
Z Potentials· 2025-04-03 11:48
谷歌Gemini团队人事变动 - 谷歌于4月2日更换Gemini聊天机器人负责人 由实验室产品孵化器负责人乔希·伍德沃德接替原负责人萧茜茜 [1] - 萧茜茜长期任职于谷歌 此次调任新职 具体职责未披露 [1] - Gemini团队内部代号为Bard 此次调整旨在争夺OpenAI的ChatGPT市场份额 [1] Gemini与ChatGPT竞争态势 - Similarweb数据显示 Gemini网络流量仅为ChatGPT的十分之一 [1] - ChatGPT近期使用量激增 对谷歌形成明显竞争压力 [1] 伍德沃德领导的产品创新 - 其团队已开发AI Studio软件 帮助开发者基于Gemini大语言模型构建应用 [1] - 正在开发Project Mariner智能体产品 可在浏览器中执行操作 尚未发布 [1] - NotebookLM去年秋季引发关注 该产品能根据用户上传文档生成AI播客 [1]
对话科辉智药创始人:以AI驱动新药的差异化优势,需寻求软硬件与制药场景的更优协同
IPO早知道· 2025-04-03 11:33
大模型若要成为可信的研发工具,还要实现科学的ranking技术、可解释性提升等问题。 本文为IPO早知道原创 大模型 加速分子设计、优化,但可解释性仍然不够 科辉 AI 平台包含数据分析软件、分子设计软件,并且公司于 2024 年 11 月上线了内部大语言模 型。朱 振东 表示,大语言模型作为 AI 工具的一种,在药物研发的智能化升级、生物医学文献与知 识管理、基因组学与蛋白质组学的研究解读和临床诊疗与健康管理的革新等领域都带来了显著的效率 提升。 以药物研发的关键环节为例来看,首先在 疾病机制与靶点发现 方面,大语言模型可通过分析海量基 因组、转录组、蛋白质组、文献、专利和数据库,挖掘疾病相关基因的调控网络和信号通路,快速识 别潜在药物靶点(如蛋白质、基因),并预测其与疾病的关联性。 作者|罗宾 微信公众号|ipozaozhidao DeepSeek 等大语言模型( LLMs )在很多行业已经引领了智能化的变革,它们 在新药研发行业 是否已接近技术的拐点?人工智能正以多大程度推动药物研发的进步? IPO 早知道对话了科辉智药创始人、董事长 朱 振东博士 ,他分享了 AI 运用于制药行业中的成功经 验与 未来 ...
浩辰软件: 苏州浩辰软件股份有限公司2024年度独立董事述职报告(范玉顺)
证券之星· 2025-04-02 22:02
独立董事履职情况 - 独立董事范玉顺2024年度严格遵循《公司法》《证券法》等法律法规及公司章程,履行独立董事职责,维护公司和股东权益[1] - 范玉顺具备清华大学自动化专业博士学位,现任清华大学教授,2020年11月起担任公司独立董事,无影响独立性的情形[1] 会议参与情况 - 2024年度出席全部7次董事会会议(其中6次以通讯方式),无缺席或委托出席,参加2次股东大会[2] - 作为审计委员会成员出席6次会议,提名委员会成员出席3次会议,非战略委员会及薪酬与考核委员会成员[3] 专业履职与监督 - 独立董事审阅公司2023年报、2024年一季报及半年报,监督外部审计质量,与立信会计师事务所沟通审计意见[4] - 重点关注中小股东权益,通过股东大会交流及议案审议保障其利益[4] - 定期现场考察公司经营、财务及内控状况,提供专业建议[4] 技术交流与人才发展 - 独立董事与公司高层及技术骨干多次探讨CAD软件发展趋势,包括人工智能、大语言模型与CAD技术的结合应用[5] - 就技术人才培养、高层次人才激励等问题与公司深入交流[5] 重大事项审议 - 公司续聘立信会计师事务所为2024年度审计机构,独立董事认可其执业能力及历史表现[6][7] - 第六届董事会聘任胡立新为董事长、陆翔为总经理等高管,独立董事认为人员资质及程序合规[7][8] - 审议通过2024年限制性股票激励计划,向激励对象首次授予股票[9] 公司治理评价 - 独立董事认为公司财务报告及内控评价真实完整,符合会计准则,无重大违法违规[6] - 关联交易、承诺履行等事项合规,未发现损害股东利益的情形[5][6] 未来履职方向 - 独立董事将持续关注公司治理,提升董事会决策科学性,维护中小股东权益[9][10]
智元机器人首席科学家罗剑岚:如果机器人实现“操控”,是比大语言模型更高级的智能
每日经济新闻· 2025-04-02 15:35
公司合作与技术发展 - 智元机器人与Physical Intelligence(Pi)达成合作伙伴关系,将在具身智能领域展开深度技术合作,重点关注动态环境下的长周期复杂任务 [1] - 罗剑岚加入智元机器人并全面领导具身智能研究中心,同时推进双方深度合作 [1] 机器人自主决策与智能等级 - 遥控与自主决策的核心差别在于机器人需具备感知、预测、行为生成的泛化能力,并建立Internal Model(世界模型)以预测未来和执行动作链 [1] - 机器人实现Manipulation(操控)的智能等级为7至8,远高于大语言模型(LLM)的3级 [1] 关键技术路径 - 强化学习和DeepSeek R1的推理能力是关键技术,但模仿学习不足,需结合世界模型预测环境变化 [1] - 核心挑战在于构建开放数据链的鲁棒策略,以及感知、预测、行为生成机制的泛化能力 [1] 数据收集与场景部署 - 人形机器人缺乏大规模应用场景数据,需通过部署产生数据循环(如1000台机器人在星巴克工作可快速积累数据) [1] - 机器人部署难度低于智能驾驶,可从封闭或半封闭空间开始,逐步生成数据 [1]