RAG技术 - 财报，业绩电话会，研报，新闻 - Reportify

RAG技术

搜索文档

DeepSeek变冷淡了

经济观察网· 2026-02-12 12:57

公司产品更新 - 深度求索公司于2月11日对其旗舰模型进行灰度测试，核心更新是将模型上下文窗口从128K Tokens大幅提升至1M Tokens，实现近8倍的容量增长 [1] - 升级后的1M Tokens窗口意味着模型可以一次性吞吐约75万到90万个英文字母，或处理约8万到15万行代码，并能一次性读入并精准理解约90万字的《三体》三部曲全书内容 [1] - 此次灰度版本的知识库从2024年中期版本更新至2025年5月 [1] - 该灰度版本仍未同步上线视觉理解或多模态输入功能，专注于纯文本和语音交互，处理文件时仍采用转录为文本Token的逻辑，而非原生多模态理解 [2] - 深度求索公司未对此次灰度测试作出回应，且模型在用户询问时明确表示本次灰度版本“不是DeepSeek-V4”，没有固定的版本号 [3][4] 市场竞争与定位 - 与GPT-5.1、Gemini 3 pro、Claude 4.5等大模型相比，深度求索公司依然主打性价比，以约十分之一的价格提供了1M文本上下文处理能力 [2] - 对比来看，Google的Gemini 3 Pro支持2M以上长文本处理，并能同时处理大量视频、音频和文本的复杂媒体任务 [2] 用户反馈与产品变化 - 用户发现模型更新后文风大变，被形容为“文绉绉的”，在深度思考模式下常吐出短句，像在写诗 [2] - 部分用户控诉模型不再称呼用户设定的昵称，而统一称为“用户”，此前深度思考模式下以角色视角展示细腻心理描写的特性消失 [2] - 有用户反映模型回复出现“爹味”，即习惯说教、居高临下的言行风格 [3] - 用户尝试更换多个模型版本或用提示词重新训练，均无法调回此前的文风，有用户感觉“好像失去了一位知心朋友” [3] - 部分用户自发号召向官方提意见，希望不要为了超长文本舍弃深度思考，也不要为提升数学、代码编程等理工科能力而降低对文本表达、共情理解等能力的支持 [3] - 有用户选择到豌豆荚下载旧版本，或在腾讯元宝里使用DeepSeek [3] 行业技术解读 - 在AI大模型领域，上下文窗口决定了模型在单次交互中能够记忆和处理的信息量上限 [1] - 行业人士解释，此前128K Tokens的上下文长度可应对长篇论文或中等规模代码文件，但处理超长文学作品或较大体量编程工作时，往往需借助RAG技术，这可能导致信息碎片化和推理精度下降 [1] - 有国产大模型厂商人士认为，此次灰度版本类似于极速版，牺牲质量换速度，是为2026年2月中旬将发布的V4版本做最后的压力测试 [3]

Seek .(US:SKLTY)

上下文窗口

DeepSeek大模型

上下文窗口

DeepSeek大模型

十年磨一剑，伊克罗德信息在AI时代的创新与安全进阶之路

搜狐财经· 2026-02-02 13:21

公司发展历程与战略转型 - 公司自2014年成立起即与亚马逊云科技合作，从最初的“云架构师”和“业务负载搬运工”角色，成功转型为“AI技术引路人” [1][3] - 在最初五六年，公司核心业务是帮助客户规划上云迁移并提供托管服务，通过扎实技术和FinOps实践帮助客户平均节省30%以上的云上开支 [3] - 2020年前后，公司敏锐把握AI浪潮，成为首批投入Amazon SageMaker和机器学习认证的合作伙伴，并在2023年生成式AI爆发时积极取得相关能力认证 [3] - 2024年，公司与亚马逊云科技签署为期4年的独家战略合作协议，标志着合作进入深度融合新阶段 [11] 核心业务模式与创新理念 - 公司不追求颠覆型创新，而是基于对客户业务模式的深刻理解，在其既有业务链条上进行“迭代创新” [6] - 公司推出了基于Amazon Bedrock构建的核心Agentic AI解决方案——ECRobot企业智能体解决方案，旨在像“数字员工”一样嵌入客户工作流 [6] - 公司致力于为客户提供从策略到交付的一站式服务，将AI安全、可靠地嵌入企业的核心业务流 [11] 产品解决方案与落地成效 - ECRobot解决方案已在互联网、金融、医疗等多个行业落地 [8] - 在视频社交领域，ECRobot使视频审核效率提升10倍，人工成本降低65%，准确率达98.7% [8] - 在头部出海短剧应用平台，ECRobot打造的“情感复写”系统将AI翻译准确率提升至96%，情感表达保真度提高85% [8] - 为云原生UEM解决方案提供商KiwiCloud构建高可用架构，实现全球100%的策略到达率，并将多区域部署效率提升40%，端到端延迟减少20% [9] 出海服务与全球化布局 - 公司已服务超过1000家中国出海客户，帮助其应对技术“硬实力”与合规“软难题”的双重挑战 [9] - 公司提供从人力招聘到会计准则咨询的一站式“软性支持”，助力客户在海外市场实现高效、平稳的本地化运营 [9] - 作为云原生信息安全服务伙伴，公司提供全栈安全解决方案，确保客户云端环境安全可靠 [9] - 未来公司将依托亚马逊云科技全球基础设施，积极拓展全球版图，重点投向中国香港地区和东南亚市场 [11] 公司概况与市场定位 - 公司是一家专注于赋能企业数智化转型的企业服务公司 [13] - 提供云端架构咨询、项目迁移、云环境托管、培训等多样化云上解决方案，以及AI智能体、RPA+AI、向量检索等生成式AI解决方案与服务 [13] - 服务全球企业超过数千家，客户横跨零售电商、金融、医药、制造、专业服务等行业 [13]

亚马逊(US:AMZN)

ECRobot企业智能体解决方案

ECRobot企业智能体解决方案

2026，进入AI记忆元年

36氪· 2026-01-27 18:16

行业趋势：AI竞赛进入以记忆为核心的下半场 - 自2023年年中起，SOTA模型的迭代周期被快速压缩至35天，曾经的SOTA模型在短短5个月就可能跌出Top5，7个月后连Top10都难以进入[3] - 模型技术进步进入瓶颈期，而过去两年多围绕AI记忆的技术和产品（如向量数据库、记忆框架）则呈现“你方唱罢我登场”的热闹景象[4] - 市场正诞生出越来越多跑通PMF的细分爆款，如代码补全、情感陪伴、智能客服等“模型+记忆”的商业模式[4] - 大模型的叙事正从以scaling law为核心的参数闪电战，切换至以记忆为主导的马拉松式下半场，记忆能力已成为拉开不同模型和Agent表现的核心来源[33] 对AI记忆的行业误解与红熊AI的解决方案误解一：记忆等于RAG加长上下文 - 2023-2024年AI基础设施爆发期，RAG技术一度成为AI记忆的代名词，行业普遍认为叠加长上下文窗口和检索优化算法就能解决AI健忘问题[8] - 红熊AI创始人指出，传统RAG在落地中暴露出短板，例如在法律场景中，语义相似但适用范围天差地别的法条细节会被整体相似性掩盖，且无法遵循法律体系的优先适用规则[9] - 在客服AI场景中，RAG方案会导致每天重复回答相同问题时产生不必要的检索成本，并且在用户跨会话咨询时出现记忆丢失[10] - 基于语义检索的RAG方案只能解决不到60%的真实需求，其本质是被动的检索工具，无法解决“记不住”的核心矛盾，且通常只能以周为单位做离线数据更新，无法实时写入[10] - 红熊AI借鉴人脑记忆逻辑，打造了完整的记忆科学体系，将AI记忆拆解为显性记忆、隐性记忆、联想记忆以及动态进化记忆，不同层之间通过智能算法动态流转[12] - 该体系为记忆加入了情感加权、智能遗忘、跨智能体协同等能力，从底层重构了AI记忆的逻辑，解决了存储数据量爆炸带来的成本飙升和上下文过长问题[12] 误解二：事实检索重于一切 - 红熊AI团队曾将准确率当作记忆系统的唯一KPI，这在金融风控、技术运维等事实优先的场景中运行顺畅[15] - 但在情感咨询等场景中，用户需要的是被理解、被安抚、被肯定，而非精准的事实答案[17] - 这倒逼红熊AI攻克了记忆系统的情感难题，通过给每段记忆贴上情感权重标签，从多维度量化用户情绪（如文本中的负面/正面词汇密度、句式、情绪强度词，综合算出0-100分的情感分数）[18] - 情感权重不仅决定记忆的优先级，更影响AI的回应逻辑，例如当用户有高负面评价历史时，AI会优先安抚再同步事实信息[18] 误解三：Agent的未来是标准化 - 尽管市场期待超级Agent，但红熊AI认为Agent类产品的宿命是革命传统SaaS，但也必须走上SaaS非标碎片化的老路[22] - 没有一套标准化的记忆系统能适配所有行业，甚至同一行业的不同品类都需要差异化定制，例如电商中卖手机壳和卖手套的商家关注的关键词和记忆规则都不同[22] - 不同行业的情感权重占比天差地别：售后客服、教育场景情感权重占40%-50%，必须优先安抚情绪；医疗、金融风控场景仅占10%-20%，事实优先；通用陪伴场景占20%-30%[23] - 红熊AI必须在做好标准化能力的基础上，接受在解决方案环节的非标准化[24] 红熊AI的产品与能力建设 - 红熊AI在今年1月推出记忆熊v0.2.0，构建了完整的记忆科学体系[12] - 在记忆熊v0.2.0中，公司强化了集群化Agent记忆协同能力，通过引入统一记忆中枢，实现多Agent间的最小化、按需式记忆共享，解决传统多Agent系统的记忆冗余、冲突问题[24] - 针对多模态数据处理，公司推出了三大解析引擎实现100%版面还原，支持PPTX高保真解析、音视频以文搜音，并通过向量+图谱双驱动检索，将多跳推理准确率提升至92.5%[24] - 非标环节集中于行业词汇库积累和知识图谱打造，首次拓展新品类客户时，前期与客户共建及知识梳理就需要几周时间，用户数据处理消耗整体25%上下的成本[27] - 公司需要不断学习积累不同行业知识，例如医疗行业的负面词是“疼痛、过敏、并发症”，金融行业核心词是“平仓、建仓、净值”[29] - 这种前期非标准化的缓慢开拓，会成为企业的先发优势和核心壁垒，遵循SaaS行业从灯塔客户到细分行业解决方案再到全行业拓展的成长路径[30][31]

记忆熊v0.2.0

记忆熊v0.2.0

中辉期货申请基于RAG技术的期货研报攥写方法专利，提升了数据检索精准度

金融界· 2026-01-24 11:22

公司专利申请 - 中辉期货有限公司于2025年10月申请了一项名为“一种基于RAG技术的期货研报攥写方法、系统及存储介质”的专利，公开号为CN121388192A [1] - 该专利方法包括四个核心步骤：通过数据采集模块采集并预处理多维度期货市场数据；根据用户输入主题生成关键检索词，采用双路召回和精排优化的检索机制获取高关联度数据；从检索结果中提取关键特征并输入预训练大模型以生成研报内容；通过合格校验模型对研报进行规则、语义和格式校验并优化 [1] - 该专利旨在提升数据检索精准度，消除大模型幻觉，强化合规性保障，提升多维度分析能力，为投资者提供全面决策支持 [1] 公司背景信息 - 中辉期货有限公司成立于1993年，位于上海市，是一家以从事资本市场服务为主的企业 [2] - 公司注册资本为14300万人民币 [2] - 根据天眼查大数据分析，公司共对外投资了2家企业，参与招投标项目3次，拥有专利信息6条以及行政许可10个 [2]

基于RAG技术的期货研报攥写方法

系统及存储介质

基于RAG技术的期货研报攥写方法

系统及存储介质

双核智能，驱动写作；审校全程护航，辅助全程在线

21世纪经济报道· 2025-12-29 15:45

公司核心产品与定位 - 公司核心产品为“常闻写作助手”，是一款以“知识审校”为核心能力的高标准内容生产与质量控制工具 [1] - 产品核心价值在于检查“内容对不对”，区别于市面上仅能检查错别字、语法问题的普通写作工具，能从事实、概念、规范、专业术语等知识层面进行深度审校 [1] - 产品旨在为用户提供一套完整的内容生产与质量控制系统，确保内容写得正确、合规、符合事实 [1] 核心功能与技术能力 - 产品具备智能生成功能，可根据用户输入的核心观点或数据，快速生成新闻通稿、工作汇报、调研报告等高质量内容 [3] - 产品支持多格式内容生成，从简短社交媒体文案到长达百页的深度白皮书均可一键生成初稿，大幅缩短起草时间 [3] - 产品支持风格定制，可根据不同行业需求调整生成内容的语言风格，如党政风、学术风、媒体风 [3] - 技术护城河建立在权威知识图谱与RAG（检索增强生成）技术上，通过实时检索权威数据库来抑制大模型的“幻觉”问题，确保判断有据可查 [12][13] - 公司具备从数据采集、清洗到模型训练、应用开发的全栈自主可控技术能力，可为高敏感客户提供私有化部署，确保数据安全 [13] 行业应用与解决方案 - 在图书出版行业，产品可充当“初审+质检”双重角色，在编辑介入前完成第一轮深度清洗，标记出90%以上的潜在错误，已有超过5家大型出版集团采购应用 [6] - 在政府及事业单位，产品内置最新政策法规库与公文写作规范，严格把控公文格式、措辞得体性及政策引用准确性 [7][8] - 在教育与科研领域，产品可辅助科研人员进行文献溯源、数据核对、术语标准化检查及学术不端检测 [9] - 在新闻媒体行业，产品可作为“智能主编”，在稿件发布前毫秒级核实人名、地名、时间、背景数据，确保新闻的准确性与时效性 [10][11] 产品差异化与市场定位 - 产品是面向专业场景设计的工具，而非泛娱乐写作工具，其核心是“知识审校” [15] - 产品功能覆盖写作全流程，且已在真实行业场景中落地应用 [15] - 产品定位为服务于对文字准确性、规范性有高标准要求的专业工作场景 [15]

常闻写作助手

常闻写作助手

下一个“AI卖铲人”：算力调度是推理盈利关键，向量数据库成刚需

华尔街见闻· 2025-12-24 12:17

AI基础设施软件行业概览 - 生成式AI应用加速渗透，AI基础设施软件成为应用落地的关键“卖铲人”，行业正迎来黄金发展期 [1] - 与模型训练环节被巨头垄断不同，推理和应用部署环节为独立软件厂商打开了新的商业空间 [1] - 当前两类产品最为关键：算力调度软件和数据类软件 [1] 算力调度软件 - 算力调度能力是决定模型推理服务盈利水平的核心变量，直接决定毛利率 [1][6] - 在单日10亿查询量场景下，使用H800芯片，单卡吞吐能力每提升10%，毛利率能够提升2-7个百分点 [1][6] - 敏感性分析显示，当单卡吞吐从基准值的0.6倍提升至1.4倍时，毛利率可从52%提升至80% [6] - 海外云厂商毛利率差异显著，2025年三季度谷歌云毛利率43.3%，微软智能云34.6%，亚马逊AWS仅为23.7%，硬件调度能力影响关键 [8] 国内厂商算力调度实践 - 国内模型价格战激烈，成本控制至关重要，例如Deepseek V3定价为每百万token输入2元、输出3元，远低于海外同类产品1.25-5美元的价格 [5] - 华为Flex:ai实现异构算力统一调度，通过芯片级切分技术，在特定场景下可将平均利用率提升30% [5] - 阿里巴巴Aegaeon实现token级动态调度，将10个模型所需GPU数量从1192张锐减至213张，资源节约率达82% [5] - 英伟达Run:ai可将GPU利用率提升5倍，Deepseek自研调度系统实现成本利润率545% [6] 向量数据库与RAG技术 - 向量数据库是RAG应用的刚需基础，Gartner预测2025年企业RAG技术采用率将达68% [1][10] - 2024年全球已有45%的企业在智能客服、数据分析等场景部署RAG系统 [10] - 向量数据库核心价值在于支撑海量数据的毫秒级检索，需在亿级数据规模下保持高QPS实时检索能力 [10] - 从2024年四季度开始，通过API接口接入大模型的Token消耗量一年内翻了近10倍，直接拉动了向量数据库需求 [11] 数据库格局重塑 - 生成式AI时代，数据架构正从“分析优先”转向“实时运营+分析协同”，高频、低延迟的实时事务处理需求凸显OLTP数据库优势 [12] - MongoDB凭借低门槛、高弹性契合中小客户AI落地需求，2026财年一至三季度核心产品Atlas收入增速分别为26%、29%、30% [15][16] - MongoDB在2025年2月以2.2亿美元收购Voyage AI补齐向量检索能力，其嵌入模型在HuggingFace RTEB测评中排名前列 [16] - 2026财年三季度MongoDB毛利率达76%，预计年底经营利润率达18%，全年营收增长率约21%-22% [16] 数据平台厂商的应对策略 - Snowflake与Databricks选择向上下游纵向拓展，打造全栈工具链 [15][17] - Snowflake 2025财年收入达36.26亿美元，同比增长29.21%，预计2026财年收入44.46亿美元 [17] - Databricks 2025年年化收入超48亿美元，同比增长55%，数据湖仓产品年化收入超10亿美元，净留存率超140% [17] - 截至2026财年三季度，Snowflake年消费超100万美元的高价值客户达688家，福布斯全球2000强企业中已有766家成为其客户 [17] 存储架构技术升级 - AI推理进入实时化、PB级数据访问新阶段，存储IO性能至关重要，LLM推理的KV缓存访问粒度仅8KB-4MB，向量数据库检索粒度低至64B-8KB [18] - 英伟达推出SCADA方案实现GPU直连SSD，将IO延迟从毫秒级降至微秒级，测试显示1颗H100 GPU的IO调度效率是Gen5 Intel Xeon Platinum CPU的2倍以上 [18] - 向量数据库需进行技术升级，包括采用GPU适配的列式存储、将检索算法改为GPU并行版本、自主管理GPU显存分配 [19]

向量数据库

向量数据库

一个 RAG 项目，在真实训练中是怎么被“做出来”的？

36氪· 2025-12-19 08:11

RAG技术的本质与定位 - RAG技术远非简单的数据注入模块，而是重塑AI理解与决策的核心框架[1] - RAG项目不是简单的“加模块”技术问题，而是一整套数据与判断体系[1] - 决定RAG效果的关键并非“有没有资料”，而是“资料怎么被用”[2] - RAG项目是许多大模型走向“可用”的关键一环[11] - 在真实业务中，RAG往往不是过渡方案，而是长期存在的基础设施，是连接“稳定模型”与“变化世界”的桥梁[12][17] RAG项目的核心构成与挑战 - RAG项目由问题、参考材料、回答三部分构成，且没有一块是“天然可靠”的[3] - 用户问题本身可能存在问题，例如语义不清、上下文矛盾、逻辑跳跃或包含不合理意图，并非每个问题都值得被认真回答[4][7] - 参考材料并非权威答案，仅是候选证据，常存在与问题不相关、信息不完整、多条材料互相冲突或包含常识性错误等问题[5][8] - 最终交付物是用户能直接使用的回答，需满足理解用户真实意图、不违背材料事实、信息完整、表达自然等要求[9][14] - RAG项目中90%的难点在于“判断”而非“生成”，大量工作仍需依赖人类判断[1][9] RAG项目所需的核心能力 - RAG项目训练的是模型的三种底层能力：信息取舍能力、上下文对齐能力、结果导向能力[16] - 信息取舍能力指判断什么该用、什么不该用、什么只能作为背景[16] - 上下文对齐能力指确保回答是嵌在一段对话中的，而非独立存在[16] - 结果导向能力指目标不是“材料写了什么”，而是“用户看完能不能用”[16] - 项目中的许多关键判断，如材料不全是否要补、材料有错是否纠正、材料冲突信哪一条、历史对话有问题是否跳过，本质上是人类在替模型建立判断边界[10][15] RAG在对话式AI中的工作场景 - 在对话式AI助手场景中，RAG面对的是非标准问答的复杂结构[3] - 模型需要完成理解对话语境、判断材料有用性、整合信息、最终给出对用户有帮助的回答这一系列任务[3] - 从训练视角看，这本质上是材料阅读理解、问题理解、信息整合与表达控制的结合[3] - 系统输入通常包含一段历史对话、用户最新问题以及系统检索到的1–3条参考材料[6]

对话式AI助手

对话式AI助手

AI帮你做用户研究？这两大场景超实用！

搜狐财经· 2025-12-04 16:43

文章核心观点 - AI大语言模型正在变革用户研究行业，通过处理海量文本数据提升效率，使研究人员能专注于关键决策 [1] - AI在用户研究中的应用主要聚焦于短文本反馈分类和长文本分析洞察两大核心场景 [1] - AI是强大的辅助工具而非替代者，研究人员需在利用技术的同时守住专业底线 [11] 短文本反馈分类 - 针对短文本分类，存在通用模型分类和SFT微调模型分类两种主流AI解决方案 [2] - 通用模型分类适用于偶发、数据量不大或处于探索分类标准阶段的任务，操作灵活便捷，无需复杂训练数据 [3] - 通用模型分类使用门槛低，可利用常见对话式AI工具或API接口实现高效处理，但在处理高复杂度或深奥行业术语时可能出现偏差 [3] - SFT微调模型分类通过监督微调将通用模型培养为特定领域的专家，适合拥有大量历史数据、业务稳定、需长期监测且对准确率要求高的场景 [4][6] - SFT方案前期需投入精力准备高质量标注数据并进行训练，但成功后准确度与效率出众，缺点是分类标准发生根本变化时需要重新训练 [6] - 提升SFT模型效果的关键在于提供高质量的标注数据，需明确角色、说清任务、讲透规则、提供示例并引导模型进行思维链思考 [7] - 标注数据需确保准确并经交叉检查，同时覆盖各种场景以保持类别均衡，并随业务变化及时更新 [8][12] 长文本分析洞察 - 对于长文本分析，AI可化身“超级管家”，运用RAG等技术处理访谈记录等资料 [9] - 具体运作流程包括：整理切分文本构建知识库，搭建智能体并下达指令，AI根据问题检索相关原始语料并生成洞察报告 [9] - RAG技术极大提升了信息处理效率与完整性，能在几分钟内完成原本需数小时的工作，并基于数据关联分析发现深层洞察 [10] - 优化长文本分析效果需合理拆分文本保证语意完整，采用关键词加语义理解双重优化检索方式，控制上下文参考资料量，并通过指令明确工作规则防止AI“瞎编” [13]

SFT微调模型

对话式AI工具（豆包

SFT微调模型

对话式AI工具（豆包

零代码落地！DeepSeek+ChatWiki，打造企业专属智能客服

搜狐财经· 2025-11-27 10:51

产品解决方案核心价值 - 解决企业普遍存在的客服困境，如大促期间咨询爆单导致消息遗漏、新客服培训期长且回答质量差、夜间咨询无人响应导致订单流失 [2] - 通过DeepSeek大模型与ChatWiki的RAG知识库结合，为零代码快速搭建精准高效的AI客服系统提供可能 [2] - 全流程零代码操作，1天内即可完成部署，极大降低企业技术门槛与时间成本 [2] - 某教育平台接入后，夜间咨询响应率从0提升至100%，转化率直接翻倍 [8] 技术实现与功能特点 - 兼容全球20多种主流AI模型，企业只需申请DeepSeek API Key并在ChatWiki后台一键配置，技术小白也能轻松上手 [3] - 支持上传ODF、PDF、Word、Excel、网页链接等多种格式文档，自动完成文本清洗、向量化转换与QA分割以构建知识库 [4] - DeepSeek负责精准捕捉客户意图并从知识库提取信息，以自然流畅语言组织回复，避免大模型胡编乱造和传统知识库答案机械罗列的弊端 [6] - AI机器人可无缝接入H5链接、企业官网、微信公众号、小程序，以及飞书、钉钉等办公平台，实现全渠道覆盖 [8] 企业级管理与协作 - 提供精细化权限管理，管理员可按需为成员分配角色，精准管控知识库编辑和机器人配置权限 [10] - 实现数据隔离与安全管控，保障核心业务数据安全，同时提升团队协作效率，适配复杂组织架构需求 [10]

Seek .(US:SKLTY)

零代码开发

Artificial Intelligence

零代码开发

Artificial Intelligence

西部机场集团AI战略下的银川实践 “数智大脑”激活空港新动能

中国民航网· 2025-10-16 09:19

智慧机场建设方略 - 公司以4A架构为核心的智慧机场建设方略持续扎实推进，伴随“AI + 专项行动”全面深化 [1] - 企业级AI助理“小西”实现规模化应用，银川机场航站楼管理部弱电中心自主搭建“AI智能体+本地RAG知识库”融合平台 [1] - 该平台作为集团AI技术落地的重要标杆，首批覆盖安全、生产、培训等核心场景，将分散数据转化为决策能力 [1] 技术架构与核心优势 - 技术路径为“RAG + 本地大模型”，通过检索增强生成技术破解大模型“幻觉”难题，用本地部署保障数据安全 [1] - 采用RagFlow搭建本地知识库，集成DeepSeek大模型与自定义智能体，通过向量数据库实现“检索-推理-生成”全流程本地化运行 [2] - 该架构契合集团“数据专有、价值专享”的私域大模型建设原则，核心优势凸显 [2] - 平台通过Prometheus+Grafana监控体系实现检索延迟低于500ms、模型调用成功率超95%的生产级运行标准 [2] 运营效率提升 - 平台解决了知识分散、检索低效的瓶颈，值班人员检索“三大规程”从耗时十几分钟以上提升至秒级 [1][2] - 新员工独立处理工单的熟练度提升60%，相当于为每个班组配备了全天候“AI老师傅” [2] - 撰写事件调查报告无需在千余份历史文档中人工筛选，输入巡检记录后智能体自动匹配设备型号与历史故障案例 [1][2] 安全与风险管理 - 安全态势实现秒级研判，上传工单与巡检数据后，AI助理内生成含风险等级、趋势预判、处置建议的可视化报告 [2] - 该功能实现“一页总览”的全局管控，已助力受限航班保障及时率提升 [2] - 智能体输出“风险点+整改清单”，隐患锁定时间压缩至“分钟级” [2] 试点成果与推广 - 依托集团“1+N”数字化协同模式，弱电中心将试点成果向全部门辐射 [3] - 安全质量室上线“法规制度指引助理”，实现千余项民航规章的“秒级检索”，替代传统“翻册核对” [3] - 引入隐患风险库的“方案智慧助理”，在施工方案审查中自动识别合规缺口，推动管理从“事后整改”向“事前预防”升级 [3] 未来发展规划 - 平台与集团“小西”AI助理形成能力互补，其多模态扩展方案未来将实现安检图像分析、语音交互等功能 [3] - 按照建设路线图，平台将逐步接入航班动态、旅客服务、能源消耗等鲜活数据，推动AI能力向“预测决策”跨越 [3] - 该实践验证了RAG技术在航空领域的独特价值，正逐步推动该架构在西北机场集群的规模化部署 [3]

AI智能体+本地RAG知识库融合平台

企业级AI助理“小西”

AI智能体+本地RAG知识库融合平台

企业级AI助理“小西”