数据湖 - 财报，业绩电话会，研报，新闻

数据湖

搜索文档

”数据湖”龙头拉响警报！易华录预亏最多21.91亿元，净资产转负面临被实施退市风险警示

每日经济新闻· 2026-01-30 22:46

核心观点 - 易华录预计2025年度将出现巨额亏损且净资产转为负值，面临退市风险警示，公司正通过加速处置资产、终止募投项目等方式进行战略收缩以自救 [1][6] 财务表现与亏损原因 - 预计2025年度归母净利润亏损21.76亿元至27.91亿元，归母扣非净利润亏损22.42亿元至28.05亿元 [1][2] - 预计2025年度营业收入在3.98亿元至5.39亿元之间，较上年同期的4.65亿元呈现波动 [2] - 巨额亏损主要源于对数据湖业务相关资产及部分参股投资计提大额资产减值准备 [4] - 公司财务费用等固定支出较大，高昂的运营成本侵蚀毛利，导致尚未实现经营扭亏 [4] - 尽管智慧交通、数据要素等新业务新签合同实现同比增长，但增长被历史包袱和高成本抵消 [3][4] 资产处置与自救措施 - 终止两大核心募投项目（超级存储研发项目和人工智能训练资源库及全域视频感知服务平台项目），两项目投资进度分别仅为25.22%和19.77% [7] - 拟将终止项目后剩余的约3.55亿元募集资金永久补充流动资金，但其中近8000万元处于司法冻结状态 [7] - 2025年12月，以1478.06万元转让严重资不抵债（净资产为-5693.65万元）的参股公司聊云公司35%股权，预计对合并报表利润产生约1471.42万元正向影响 [7] - 2025年10月，以832.95万元转让盈利的新加坡控股子公司INFOLOGIC PTE LTD 60%股权，旨在降低境外投资风险并获取现金流 [8] - 上述两笔资产受让方均为关联方海南太昊数据科技有限公司，交易构成关联交易 [8] 公司现状与风险 - 预计2025年度归属母公司净资产为负值，若经审计证实，公司股票将被实施退市风险警示（*ST） [1][6] - 公司在技术迭代和市场环境变化的双重挤压下，面临新旧动能转换期的结构性矛盾 [4] - 通过战略收缩换取生存空间的效果仍有待市场检验 [1]

齐鲁晚报· 2026-01-22 20:05

核心观点 - 济南市计划在2026年迈入数智化建设高质量发展新阶段，锚定“全国一流数智先锋城市”目标，聚焦五大重点领域以提升城市核心竞争力与市民生活品质 [1] 数字基础设施与算力建设 - 2025年济南已建成全市通用共享“数据湖”，累计汇聚数据474亿条，保障数据共享调用54.43亿次 [1] - 2025年全市算力规模达6451P，其中智能算力占比83.2% [1] - 2026年将构建泛在智能基础设施体系，强化算力支撑能力建设，促进算力资源集聚化、集约化发展，并落实算力券等补贴政策 [1] 数据标注产业发展 - 2026年将加快建设数据标注产业园，引育数据标注企业累计达60家 [2] - 围绕人工智能和卫生健康等重点领域发展专业化数据标注，并组织召开省会都市圈数据标注供需对接会以推动产业高质量发展 [2] 数字经济与智慧治理 - 2025年济南规模以上数字经济核心产业企业营业收入占比预计达19%以上 [3] - 2026年将深化行业算力应用效能，加强政务云建设，为数字政府提供底座支撑 [3] - 依托智慧泉城运行管理中心建强城市智能中枢，构建统一规划的“城市大脑”，推进城市全域感知能力建设 [3] 政务服务与“一码通城” - 计划使85%的政务服务事项办理实现材料免提交和表单免填写（除特殊情况外） [4] - 完成“碰一碰”快速办理酒店入住、精准授权电子证照“免材料”办事、经营主体“守护码”深度融合3个应用场景打造 [4] - 持续推进“人、企、物”三位一体“城市码”服务体系建设，拓展“档案码”、“泉城爱车码”等行业应用，创新无感刷码等场景 [4] 人工智能产业发展与应用 - 以“数据+算力+算法”为核心驱动，构建AI能力支撑体系 [6] - 立足“大模型工场”模式，依托国产化算力资源，提供AI转型赋能工具与模型资源，大力发展智能原生技术、产品和服务体系 [6] - 加快培育智能原生企业，打造端到端解决方案，力争落地20个案例项目 [6] - 推进“人工智能+”民生，包括联合卫健部门建设人工智能底座平台，加快智能辅助诊疗、用药推荐等应用，推进智慧医院建设 [6] - 在康养领域推进人工智能、可穿戴设备等智能设备的集成应用，并在公共文化领域深化数智技术融合应用 [6]

齐鲁晚报· 2026-01-20 23:01

核心观点 - 济南市计划在2026年迈入数智化建设高质量发展新阶段，目标是成为“全国一流数智先锋城市”，以“人工智能+”和“数据要素×”为双轮驱动，聚焦五大重点领域，提升城市核心竞争力与市民生活品质 [1] 数字基础设施与算力建设 - 济南已建成全市通用共享“数据湖”，累计汇聚数据474亿条，保障数据共享调用54.43亿次 [2] - 2025年，全市算力规模已达6451P，其中智能算力占比83.2% [2] - 2026年将构建泛在智能的基础设施体系，强化算力支撑能力建设，促进算力资源集聚化、集约化发展，并落实算力券等补贴政策 [2] 数据要素与产业发展 - 2025年，北方健康、云鼎科技2个行业数据集入选国家级医疗卫生、智慧能源领域高质量数据集建设先行先试名单 [3] - 将深化“一人一档、一企一档”建设，动态更新个人和企业全生命周期数据集 [3] - 围绕全市“13+34”条标志性产业链，实施“一链一集”计划，每个产业链每年至少打造1个高质量数据集 [3] - 将大力发展数据标注产业，引育数据标注企业累计达60家，并围绕人工智能和卫生健康等重点领域发展专业化数据标注 [3] 数字经济与产业升级 - 2025年，济南规模以上数字经济核心产业企业营业收入占比预计达19%以上 [4] - 将深化行业算力应用效能，加强济南政务云建设，为数字政府提供坚实底座支撑 [4] - 将依托智慧泉城运行管理中心建强城市智能中枢，推动建立城市运行体征指标体系 [4] 智慧政务与民生服务 - 2025年，济南市电子证照库累计归集534类电子证照数据，为73个“高效办成一件事”重点事项提供共享服务，实现事项办理时间、环节数量、申请材料平均压减79%、85%、70% [7] - 深化无证明城市建设，目标使85%的政务服务事项办理实现材料免提交和表单免填写 [5] - 持续推进“人、企、物”三位一体“城市码”服务体系建设，拓展“档案码”“泉城爱车码”等行业应用，提升“一码通城”应用成效 [5] 人工智能创新与应用 - 将立足“大模型工场”特色模式，依托国产化算力资源，提供AI转型赋能工具与模型资源，大力发展智能原生技术、产品和服务体系 [7] - 加快培育智能原生企业，打造端到端解决方案，赋能人工智能产品培育和企业智能化转型，力争落地20个案例项目 [7] - 着力推进“人工智能+”民生，包括在医疗领域建设人工智能底座平台，加快智能辅助诊疗、用药推荐等应用 [8] - 在康养领域推进智能设备集成应用，在公共文化领域完善公共文化云平台 [8] - 通过AI技术赋能水安全治理，提升水质安全监测管理水平 [8] - 建设AI就业大模型，分析海量招聘信息，精准匹配岗位，提升就业成功率 [8]

打破医药供应链的「不可能三角」：一场静悄悄的系统性「破局」

36氪· 2025-12-20 18:34

文章核心观点 - 医药流通行业乃至更广泛的制造业和零售业，其供应链复杂度已超越人类经验处理极限，正经历从经验系统向可计算系统的历史性迁移，而人工智能（AI）是驱动这一转型的关键引擎 [11][20] - 广西柳药集团作为典型案例，通过与华为云合作，构建了由数据湖、盘古预测大模型和天筹AI求解器组成的三层智能供应链系统，实现了需求预测、运筹优化和自动决策，显著提升了运营效率并降低了成本 [4][12][19] - 供应链智能化正从企业自发升级转变为国家产业能力建设的一部分，成为未来几年最确定的结构性投资方向，而华为云凭借其数据治理、行业大模型和求解器工程能力，正在成为该领域重要的基础设施建设者 [10][11][22] 行业趋势与挑战 - **行业复杂度极高**：医药流通行业具有上万SKU、多仓协同、强时效（如两小时送达ICU）与强合规监管等特点，形成了时效性、合规性、经济性的“不可能三角”约束 [3][5][6] - **成本压力与效率瓶颈**：中国社会物流总成本占GDP比重约18%，显著高于美国的8%，产业链中段存在大量“无效流动”推高成本，行业利润空间被挤压，降本增效成为必答题 [9][6] - **政策与市场双重驱动**：未来三年，超过60%的中国大型企业将在供应链关键环节部署AI与智能调度系统；工信部相关规划已将智能调度、运筹优化列为制造业必备的数字底座能力 [10] - **全球共识形成**：到2027年，全球超过50%的大型跨国企业将采用AI等技术构建供应链控制塔，以增强实时可视化与智能决策能力 [8] 柳药集团的智能化转型实践 - **转型背景**：作为广西区域龙头医药流通企业，业务覆盖医院、药店与B2B客户，日常运营需处理来自多区域仓的数百条配送请求，面临跨仓调拨、需求波动等动态调度难题，人工排车需一小时以上 [3][4] - **核心解决方案**：与华为云合作，构建三层智能供应链系统 - **数字底座（数据湖）**：整合分散数据，实现供应链全局状态分钟级可视化，为预测与优化奠基 [13][14] - **智能预测（盘古大模型）**：基于数万SKU历史数据及多维特征进行SKU级需求预测，公开实践显示预测准确率可达89%以上 [14] - **最优求解（天筹AI求解器）**：在拣货路径、配送排车、采购补货等多约束场景下进行全局优化，自动生成最优解 [15][16][18] - **实施成效**：调拨决策时间显著压缩，仓间调拨成本与物料成本下降约20%，拣选与配送效率提升15%–18% [18] 华为云的角色与能力 - **战略定位**：从云服务商向“数据+AI”底座演进，致力于解决行业中最复杂、最难抽象的问题，成为智能供应链的基础设施建设者 [22][23] - **核心能力**： - 数据治理与安全能力达行业领先水平 - 大模型可进行行业适配 - 求解器工程能力可在千万级变量上稳定运行 [22] - **落地策略**：具备长期ToB基因，将AI能力拆解为聚焦具体行业的“小分队”，与企业共同将业务逻辑转化为可计算、可验证的系统能力 [24] - **业务规模**：已帮助超过500家企业走向全球，云基础设施服务170多个国家，覆盖全球34个Region、101个可用区 [22] 智能供应链的系统性价值 - **从成本中心到增长引擎**：供应链从后台支持走向前台驱动，成为影响经营质量的关键变量，并可复用于零售、制造、快消等多个领域 [6][19][26] - **获得自我进化能力**：当数据湖、预测模型、求解器形成闭环后，供应链能提前预判、自动优化、持续学习，形成系统级的结构竞争优势 [20] - **技术周期成熟**：2020–2030年被视为供应链AI落地的黄金十年，运筹优化与AI结合成为共识，大模型、云计算算力等技术条件、产业需求与组织能力已同时成熟 [26]

36氪· 2025-12-15 14:16

数据湖的定义与核心价值 - 数据湖是一种集中式存储系统，允许企业以任意规模存储所有结构化、半结构化和非结构化数据的原始数据，并保持其原始格式，直到需要进行分析时才进行提取 [6] - 与采用“写入时模式”的传统数据仓库不同，数据湖采用“读取时模式”，数据仅在需要时才进行结构化，为各种分析和人工智能用例提供了灵活性 [6] - 数据湖是现代分析、人工智能和机器学习流程的基石，能够实现实时洞察、自助式商业智能和预测建模 [2][6] - 企业每天产生的数据量超过2.5万亿字节，数据量和复杂性呈爆炸式增长，传统数据库已无法满足企业对信息速度、规模和多样性的需求 [2] 构建数据湖的业务与技术驱动因素 - 业务驱动因素包括：数据量和数据种类不断增长，需要可扩展的存储；企业希望立即获得洞察以进行实时决策；跨部门团队需要轻松访问可信数据以实现数据民主化和自助式BI [8][9][10] - 技术优势包括：基于云的解决方案（如AWS S3、Azure Data Lake Storage）可实现近乎无限的可扩展性和灵活性；通过存储和计算分离实现成本效益；数据湖作为数据湖屋框架的骨干，将数据湖的灵活性与数据仓库的性能相结合 [10] 数据湖的五层核心架构 - **第一层：摄取层**：负责将来自数据库、应用程序、物联网设备等来源的批量或流式数据引入数据湖，常用工具包括Apache NiFi、AWS Glue和Azure Data Factory [12] - **第二层：存储层**：将数据保存在可扩展且经济高效的云存储库中，如Amazon S3，采用扁平化架构使数据易于访问，并将存储与计算分离以独立扩展 [13][14] - **第三层：处理层**：通过清洗、验证和丰富等步骤，将原始数据转换为可用的格式，常用工具如Apache Spark、Databricks，数据通常被组织成青铜区（原始）、白银区（清洗后）和黄金区（业务就绪） [15] - **第四层：治理层**：确保数据在其整个生命周期内保持可信、安全和合规，涉及数据目录、访问控制、血缘追踪和数据质量规则，工具如Unity Catalog、AWS Glue Catalog [16] - **第五层：消费层**：为用户提供从数据中提取价值的工具，包括商业智能平台（如Power BI）、数据科学笔记本和SQL查询引擎（如Amazon Athena），实现组织内数据访问的民主化 [17] 数据湖实施的关键步骤 - **第一步：明确目标**：列出优先用例（如客户流失分析、物联网监控）并将其转化为关键绩效指标，梳理数据源、用户和未来12-24个月的预期数据增长 [23] - **第二步：选择云平台**：根据技能和集成需求选择主要云平台，如AWS（S3, Glue, Athena）、Azure（ADLS Gen2, Synapse, Purview）或GCP（Cloud Storage, BigQuery, Dataflow） [24][25][26] - **第三步：设计数据架构**：采用分层（Medallion）设计，包括Raw/Bronze（原始数据）、精炼/Silver（清理后数据）和精选/Gold（业务就绪数据）层，并定义命名约定、分区和文件格式 [27][28][29] - **第四步：构建ETL/ELT流水线**：从各种来源提取数据，使用变更数据捕获，验证模式并设置质量检查，使用调度程序实现自动化运行 [30] - **第五步：实施治理与安全**：指定数据所有者，将数据集注册到目录，跟踪数据沿袭，强制执行IAM角色、行/列级安全以及数据加密 [31] - **第六步：启用分析和机器学习**：将整理后的数据暴露给BI工具，搭建用于特征工程和模型训练的笔记本和机器学习管道，并设置MLOps [32] - **第七步：监控、扩展、优化**：创建仪表盘监控管道运行状况和成本，优化分区和压缩，利用生命周期策略对冷数据进行分层存储，并合理配置计算资源 [33] 数据湖实施的最佳实践 - 从小处着手，先从明确的、高价值的应用场景（如客户分析、物联网监控）入手，在规模化之前验证架构和投资回报率 [36] - 强制执行命名规则和元数据标准，以提高可搜索性，支持数据目录等管理工具 [37] - 尽早启用数据质量检查和血缘跟踪，以确保准确性、透明度，并简化审计过程中的调试工作 [38] - 实施基于角色的访问控制，对静态和传输中的数据进行加密，遵循最小权限原则 [39] - 集成数据目录工具（如AWS Glue数据目录、Azure Purview）以提高可发现性、血缘可见性和合规性管理 [40] - 通过分区和分层优化存储，按日期、地区等对大型数据集进行分区以加快查询速度，使用压缩和分层存储来降低成本并提高性能 [41] - 持续记录和测试流程，维护数据流程的文档，并定期测试数据摄取和转换管道以及早发现问题 [42] 数据湖实施的常见陷阱及避免方法 - **缺乏治理导致“数据沼泽”**：应从一开始指定数据管理员、强制执行数据保留策略并使用编目工具，以保持数据的组织性 [45] - **缺乏元数据管理导致发现困难**：应实施自动化元数据提取和标记，以确保数据集可搜索且文档齐全 [46] - **忽略成本优化导致不必要的云支出**：应实施生命周期管理，自动对冷数据进行分层存储，并使用原生云成本仪表板监控支出 [47] - **早期设计过于复杂延缓价值实现**：建议从简单、模块化的流程入手，随着系统成熟度的提高再逐步扩展，可使用标准化的Medallion架构 [48] - **忽略安全控制措施增加合规风险**：应启用静态/传输中数据加密，应用最小权限原则，并与身份提供商集成以实现强身份验证 [49] - **变更管理不善影响可靠性**：应建立版本控制、变更审批工作流程和自动化测试以维持稳定性 [50] 数据湖的实际应用案例 - **壳牌能源**：在微软Azure上构建数据湖，整合全球网络中的物联网、运营和能源管理数据，将数据准备时间缩短了60%，加快了洞察速度并改进了预测性维护 [55] - **康卡斯特**：利用Databricks Lakehouse整合客户互动、计费和服务数据，支持大规模预测模型以识别服务降级风险并提高客户留存率，实现了近乎实时的分析 [56] - **汇丰银行**：采用基于云的数据湖升级其风险管理和合规框架，整合风险、交易和监管数据，从而能够进行用于压力测试和反洗钱工作的高级分析，提高了监管报告的准确性和透明度 [57]

人民银行党委表示加快建设科技赋能监测监管设施

中国证券报· 2025-09-23 04:23

金融基础设施建设 - 加快建设科技赋能监测监管设施包括研究制定金融业网络安全管理制度扩大金融网络安全态势感知平台监测范围组织细化完善应急预案 [1] - 加强国库建设和管理加强国库系统业务监测扎实推进国家金库工程业务跟踪测试上线工作 [1] - 加强金融市场基础设施监管和互联互通推动银行间和交易所市场互换便利工具等联通项目落地制定出台《金融基础设施监督管理办法》 [1] 信息科技改革 - 制定信息化项目管理办法及规程积极推进全行信息系统整合加强数据中心集中管理 [1] - 制定数据湖应用工作方案编制应用系统上云计划推动数据湖和央行云使用率明显提升 [1] 金融立法推进 - 反洗钱法已正式出台施行中国人民银行法修订取得重要进展 [2] - 配合推动金融稳定法草案后续审议商业银行法票据法外汇管理条例等制修订取得阶段性成果推动完善金融稳定保障基金管理规则 [2] 未来工作方向 - 持续推进巡视整改融入贯彻落实党中央决策部署坚持稳中求进工作总基调贯彻新发展理念营造良好货币金融环境 [2] - 进一步压实化解金融风险责任防范金融风险持续加力建设自主可控安全高效的金融基础设施体系 [2]

Bill Inmon：为什么你的数据湖需要的是 BLM，而不是 LLM

36氪· 2025-07-26 14:42

大数据项目失败现状 - 85%的大数据项目失败，大多数企业无法从文本数据中提取价值 [2] - 2023年数据湖市场规模达152亿美元，增长20%以上，但实施效果不佳，被Bill Inmon称为"污水池"和"数据沼泽" [2] 通用大语言模型的问题 - ChatGPT每日运营成本高达70万美元，中型企业每月运行成本为3,000至15,000美元，处理10万次查询的API成本每月达3,000至7,000美元 [2] - 生成的是非结构化文本而非可操作数据，95%的内容与特定业务无关 [4][6] - 87%的数据科学项目未投入生产，因模型不可靠且会产生幻觉 [7] - 主要银行和跨行业公司投入数百万美元构建重复的通用模型，形成"军备竞赛" [8][10] 商业语言模型(BLM)的解决方案 - 由行业特定词汇(ISV)和通用商业词汇(GBV)组成，微软已与拜耳、Cerence等合作推出行业定制模型 [12][14] - 银行业BLM包含贷款、合规等术语，餐饮业涵盖菜系、运营等，词汇不重叠实现精准分析 [14][15] - 能将非结构化文本转为结构化数据，80-90%商业数据为非结构化，仅18%公司有效利用 [21] - 医疗、金融等行业应用显示：呼叫处理时间减少40%，转化率提高50% [17][23] 市场数据与实施路径 - 2024年AI市场规模达2350亿美元，2028年将超6310亿美元，70%企业仍处试验阶段 [10][25] - 预先构建的BLM覆盖90%行业需求，定制仅需调整不到1%词汇量 [24] - 实施步骤：评估现有文本分析→确定行业词汇→选择预建BLM→最小化定制→整合现有工具 [27] 非结构化数据挑战与机遇 - 每日产生3.28亿TB数据，2025年将达181 ZB，2024年企业管理非结构化数据量翻倍 [21][25] - 54%组织面临基础数据迁移困难，BLM可将数据负债转化为竞争优势 [27][28]