Data Governance
搜索文档
Cloudera利用基于人工智能的联盟架构及其数据追溯能力,推进数据的统一访问与治理能力升级
Globenewswire· 2025-11-20 22:07
平台更新核心内容 - 公司宣布重大平台更新,整合了Trino、Cloudera SDX和Cloudera Octopai数据追溯能力 [1] - 更新旨在为整个数据资产提供统一的数据访问、控制、治理及追溯能力 [1] - 平台以人工智能为核心,自动执行数据质量检查、分类和概况分析等关键数据架构操作 [2] 解决的关键行业问题 - 企业加速推进人工智能项目时,数据可访问性是关键障碍,仅9%的IT领导者表示其所有数据可供使用,仅38%称大部分数据可用于人工智能 [1] - 数据常被困于分散系统,治理与安全策略支离破碎,导致数据孤岛 [1] 技术功能与优势 - 借助Trino的联盟架构能力,企业可使用自然语言界面安全查询分布式数据,无需移动数据即可提升效率与可信度 [1] - 与SDX的集成统一了元数据与访问控制,简化管理并实现安全自助式数据访问,提供单一且安全的访问端点 [2] - Cloudera Octopai数据来源追踪功能可追踪数据的端到端流转过程,为所有数据转换提供透明度和可信度 [2] - 客户可在数据中心或公共云端部署Trino,并使用经过认证的连接器实现跨多系统的数据联盟 [2] 公司定位与行业影响 - 公司定位为唯一一家在任何地方都能将人工智能应用于数据的公司,助力大型企业为人工智能计划提供可信数据支持 [1][3] - 公司依托经过验证的开源基础架构,提供始终如一的云体验,融合公有云、本地数据中心和边缘环境 [3] - 此次更新被视为将人工智能驱动的自动化、治理和访问功能整合到一个平台的重要一步 [2]
9 takeaways from the Finance and Accounting Technology Expo
Yahoo Finance· 2025-11-18 18:00
行业活动概况 - 2025年金融与会计技术博览会于11月13日至14日在纽约贾维茨中心举行 [1][2] - 活动汇集了首席财务官、技术领导者、财务决策者和技术提供商 [1][2] - 主要讨论议题包括现代化、数据治理、人工智能应用和不断发展的金融技术栈 [1][2] 技术采购趋势 - 财务决策者正推动技术供应商提供更清晰、更具体的答案 [4] - 与会者关注数据提取、集成故障率、宕机历史、报告中断责任以及防止管理滥用的保护措施等问题 [4] - 行业趋势显示财务领导者在技术栈方面对透明度和尽职调查的要求正在提高 [4] 企业资源规划系统实施重点 - 行业讨论重点从争论何种ERP品牌过时转向团队如何构建其工作结构 [5] - 运营更稳定的组织通常紧密锚定单一记录系统并限制插件和附加系统 [5] - 当ERP与多个相邻工具争夺权威时往往会出现问题 [5] - 与会者和演示反复提到需要清晰、规范地执行ERP实施计划、流程和时间表 [5] 技术集成与遗留系统依赖 - 几乎每个产品讨论中都会出现“如何将其集成到NetSuite中”的问题 [6] - 供应商对此问题给出了范围广泛的答案 [6] - 许多与会者与各行业首席财务官一样在评估其财务职能采用新技术的能力时仍依赖传统供应商的灵活性 [6]
VCI Global Declares Special Dividend of V Gallant Shares as Cybersecurity & AI Subsidiary Prepares for Nine-Figure Nasdaq IPO
Globenewswire· 2025-11-17 21:08
公司行动:特别股息分配 - VCI Global董事会批准以子公司V Gallant Limited 10%的股权作为特别股息,按比例分配给所有VCIG股东[1] - 此次股息分配旨在让股东更广泛地参与V Gallant,降低公司股权集中度,从而增强交易流动性并强化两个实体间的长期一致性[2] - 特别股息代表V Gallant 10%的股权权益,将在确定登记日期后分配给所有股东,分配将通过公司的过户代理处理,股东无需采取任何行动[4] - 公司预计在获得顾问和过户代理最终批准后的7至14天内确认官方登记日期[4] 战略目标:价值释放与分拆上市 - 此次分配是VCI Global价值释放战略的第一步,V Gallant正朝着计划中的纳斯达克分拆IPO迈进[2] - 管理层根据内部预测、审计准备和行业可比公司评估,预计V Gallant的估值可能达到九位数范围[2] - 分拆战略旨在为VCIG股东实现价值具体化,同时强化公司在网络安全和人工智能领域的领导地位[3] - V Gallant是公司增长最快的技术部门之一[3] - 战略分拆旨在展现内在价值、提高透明度并加速两个实体的增长[6] V Gallant业务进展与定位 - 作为分拆路线图的一部分,公司正在推进关键准备里程碑,包括完成V Gallant的审计和估值审查、任命IPO顾问和承销商以及组建专门的上市实体[5] - 公司已开始与机构和战略投资者进行早期接洽[5] - V Gallant是一家领先的网络安全和人工智能公司,为企业及政府组织提供安全、可扩展的创新技术解决方案[7] - 公司业务组合包括人工智能计算与咨询、安全数据分析即服务、ISO审计与咨询以及网络安全咨询[8] - 随着全球对网络安全、AI基础设施和数据治理需求的增长,V Gallant在迈向公开上市的过程中有望受益于强劲的市场顺风[6] 母公司VCI Global概况 - VCI Global Limited是一个跨行业平台构建者,专注于技术和金融架构前沿[9] - 公司战略核心是构建可扩展的平台,在多个高增长领域提供韧性、效率和长期价值[9]
CFOs must build AI data ‘audit discipline’
Yahoo Finance· 2025-10-27 23:24
人工智能在财务领域的应用与挑战 - 人工智能正日益渗透到日常业务流程和使用场景中 对首席财务官进行情景规划、预测和制定长期战略至关重要 [1] - 首席财务官们对人工智能改善预测和缩短财务结算时间等多种潜在益处感到兴奋 [3] 数据作为核心资产的重要性 - 在人工智能时代 首席财务官应要求数据审计遵循与财务审计相同的纪律 [2] - 数据应被视为一种金融资产 而隐私和数据信任是保护并提升该资产价值的治理机制 [2] - 数据是首席财务官当前关注的关键领域 许多财务负责人的优先事项直接与该技术相关 [3] 数据成熟度与信任的挑战 - 首席财务官面临的主要障碍之一是热情超过了数据成熟度 [4] - 首席财务官必须信任财务报表 但对输入人工智能工具的数据却无法给予同等信任 这造成了信心上的脱节 [4] 不可靠数据的运营风险与数据质量要求 - 不可靠或不清晰的数据会导致一系列运营问题 例如夸大或扭曲预测 或使公司面临实质性和声誉风险 最终影响利润 [5] - 首席财务官高度重视确保数据清洁 其战略围绕准确性、可预测性和风险缓解构建 这三者都取决于数据是否经过同意、完整且可辩护 [5]
Reddit Sues Perplexity Over Alleged Data Scraping
PYMNTS.com· 2025-10-23 05:27
诉讼核心内容 - Reddit在美国纽约南区地方法院对Perplexity AI及三家数据爬取公司Oxylabs UAB、AWMProxy和SerpApi提起诉讼 [1][3] - 诉讼指控上述公司通过自动化工具未经授权收集并转售Reddit论坛的数据 [1][3] - 据诉状称Perplexity AI至少从一家爬取公司购买了Reddit数据 [3] 行业背景与公司立场 - Reddit首席法律官表示AI模型日益依赖高质量的人类生成文本此诉讼代表了行业面临的更广泛挑战 [4] - AI公司对优质人类内容的争夺催生了工业规模的数据清洗经济 [4] - Reddit的公开对话库已成为训练生成式AI模型的关键资源公司已与OpenAI和谷歌签署付费数据许可协议 [5] - Reddit声称未经授权利用其数据的行为破坏了公平竞争和创作者权利 [5] 相关法律案例与影响 - 此案案号为Reddit Inc v SerpApi LLC 25-cv-08736可能有助于界定美国法院对用于AI模型训练的网络爬取内容合法性的解释 [7] - 今年早些时候Reddit对Anthropic提起了类似诉讼指控该AI初创公司非法使用Reddit数据训练其大语言模型 [6] - 法律专家指出Reddit的诉讼是日益增多的争议的一部分这些争议正在塑造数据治理和合规格局例如纽约时报诉OpenAI案迫使公司重新评估内容所有权、同意和数据来源的管理方式 [7]
NetApp (NasdaqGS:NTAP) 2025 Conference Transcript
2025-10-15 01:02
涉及的行业或公司 * 纪要涉及的公司是 NetApp (NasdaqGS:NTAP) [1] * 涉及的行业包括企业级数据存储、混合云基础设施、人工智能和数据管理 [8][9][10][11] 核心观点和论据 **AI 趋势与企业应用** * 当前所有企业都已成为技术或数字业务,核心趋势是利用数据和AI来赋能业务、提升效率和改善市场策略 [9][10][11] * AI的兴起得益于硬件能力的指数级增长,例如NVIDIA的进步,使得在该领域的创新能力大幅提升 [13][14] * 公司认为AI有实质内容而非纯炒作,其基础技术如机器学习、神经网络等已发展多年 [12][13] **虚拟化与本地部署的复苏** * 在VMware被Broadcom收购后,出现工作负载从云向本地数据中心"回流"的趋势 [17][18] * 此趋势由多种因素驱动:硬件核心数和密度的指数增长使得本地能处理更多任务;数据主权和法规要求;以及AI应用中企业对数据控制和边界安全的需求 [19][20][21] * 虚拟化正进入新阶段,包括VM容器化以及将AI等服务捆绑到传统虚拟化平台中 [22][23] **块存储的复苏** * 块存储(Block Storage)重新受到重视,特别是在一级工作负载和虚拟化环境中 [40] * 驱动因素包括协议(如NVMe over Fabrics, NVMe over TCP)、网络连接、速度和工具的重大改进,提供了更低的延迟和更强的保证 [41][42] * 与NAS协议相比,块存储在监管合规、网络弹性和工具集方面目前更具优势 [43] **数据爆炸与消费级技术驱动企业级需求** * 数据正经历巨大爆炸式增长,从消费级设备(如2TB iPhone)到企业级设备都在推动这一趋势 [46][47][48] * 消费级技术的增长(如设备存储、云备份、订阅服务)正在驱动企业级基础设施的需求增长 [48] * AI的加入进一步推动了对更多数据和元数据的收集与分析需求 [48] **NetApp的产品与战略愿景** * NetApp推出全新类别的数据基础设施系统NetApp AFX,采用可组合分解架构,将数据存储/检索与数据转换/处理/丰富功能统一于一个逻辑系统中,专为AI时代设计,具备EB级规模 [145][177][178] * 推出元数据引擎,与ONTAP OS集成,构建数据动态目录,支持主动元数据 [146][147] * 推出AI数据引擎,旨在简化AI数据管道,实现数据就地准备和服务,无需ETL,具备语义搜索、矢量化、安全护栏等功能 [184][185][186] * 愿景是构建统一数据平台,通过分布式数据处理和联合主动元数据结构,将原始数据高效、安全、简单地转换为AI就绪数据,避免复杂、低效且不安全的传统数据管道 [140][141][149] * 强调网络弹性,推出新的勒索软件恢复能力服务,具备数据泄露发现和隔离恢复环境等功能 [200][201][202][203] * 公司与行业领导者(如AWS、NVIDIA、Google Cloud、Microsoft)深度合作,共同创新 [125][154][191][218] 其他重要内容 **行业竞争与替代方案** * 在VMware被收购后,一些替代方案(如Proxmox)获得了关注,特别是在欧盟地区的中小企业和重新开始构建基础设施的客户中 [24][26] * 竞争被视为驱动创新的积极因素 [26] **平台整合与简化** * 行业趋势是使用正确的工具处理正确的工作负载(VM、容器、无服务器),并将它们统一打包,提供简化的用户体验 [27][29][30] * NetApp将其所有许可整合到ONTAP One中,包含备份、数据保护、网络弹性等功能,无需单独购买 [32] **网络弹性能力** * NetApp强调其基于AI的主动勒索软件检测能力,可在恶意软件攻击发生时触发快照,该功能在业界被认为是独特且具有前瞻性的 [34][35][36] **未来技术展望** * 预测未来五年内,每个操作系统(包括ONTAP、Windows、Linux、iOS)都将内置LLM,用户可通过类似ChatGPT的聊天机器人交互方式管理系统 [52][53][54][55] * 展望AI代理(Agentic AI)的未来,类似于钢铁侠的Jarvis,能够集成到应用中并学习用户习惯 [58][59][61]
Cloudera 通过统一平台加速 AI 与分析项目进程,实现安全、可控且高效的数据管理
Globenewswire· 2025-09-26 19:51
核心观点 - Cloudera平台通过集成Iceberg REST Catalog和Lakehouse Optimizer实现零拷贝数据共享与自动化优化 强化开放式数据湖仓能力 提升跨平台互操作性并显著降低成本 [1][2][4] 技术功能升级 - Iceberg REST Catalog支持第三方引擎(Snowflake/Databricks/AWS Athena等)直接访问Cloudera管理数据 无需复制或移动数据即可实现ACID合规与统一策略执行 [2][3] - Lakehouse Optimizer提供自动化Iceberg表维护与智能优化功能 包括重写清单文件和位置删除文件 支持跨公有云部署并可通过专属UI定义策略 [4] - 两项功能均整合至Cloudera统一治理框架SDX 扩展精细化访问控制、数据血统追溯及审计能力至第三方工具 [2][3] 性能与成本效益 - 客户反馈显示数据存储成本最高削减79% 同时提升跨业务线可视性 全球卫星巨头客户已实现成本节约与AI管道强化 [3] - 内部基准测试表明Lakehouse Optimizer可提升查询性能高达13倍 并降低36%存储成本 [4] - 开放元数据访问机制加速AI开发与商业智能进程 摆脱专有目录束缚 [3] 行业定位与差异化 - Cloudera是唯一在全生命周期数据平台集成Iceberg REST Catalog的供应商 支持任意云环境及数据中心的统一安全治理 [2] - 平台依托成熟开源技术 融合公有云、数据中心与边缘环境 为大型企业提供实时预测性见解 [7]
How M&T Bank ensures data quality as it implements gen AI
American Banker· 2025-09-19 02:03
生成式AI在银行业的应用与价值 - 银行日益重视为生成式AI模型提供准确、相关且来源可信的数据[1] - 生成式AI与数据紧密耦合,其成功部署依赖于可信的数据[2] - M&T银行有22,000名员工,其中16,000名使用Microsoft Copilot生成AI模型来撰写邮件和报告的初稿,并总结呼叫中心对话[7] - 生成式AI能够提升人类效率,使工作更好、更快、更强,例如总结通话内容可为每次通话节省约6分钟[9] - 在大多数用例中,生成式AI可完成60%的工作,再由人工审查并完成剩余的40%[8] - 员工对该工具依赖度高,在试点项目暂停时收到强烈反对,认为其具有变革性[9] 数据溯源的重要性与风险 - 数据溯源是指维护数据生命周期的详细记录,展示其从源头到最终目的地的完整旅程[1] - 缺乏适当的数据溯源和治理会导致生成式AI出错,例如加拿大航空聊天机器人提供错误折扣信息的事件[3][4] - 对于银行而言,数据溯源失败或疏忽会带来合规、运营和声誉风险,最坏情况可能导致诉讼、品牌声誉受损以及对公司财务的负面影响[4][5] - 数据溯源是银行的一项核心能力,旨在确保了解数据的来源、用途以及如何使其达到可被分析的水平[12] M&T银行的AI与数据战略实施 - M&T银行的首席数据官职责包括定义和执行银行的AI战略与数据战略[2] - 银行最初因安全考虑阻止员工使用大型语言模型,后选择Microsoft Copilot作为稳定、强大的合作伙伴[6][7] - 银行建立了名为Edison的存储库,包含所有银行政策的权威文件和数据[13] - 银行部署了来自Solidatus和Monte Carlo的数据溯源软件,以加速数据溯源生产并创建单一数据存储库[14] - 该银行通过检索增强生成技术将生成式AI模型的训练数据限制在内部受治理的数据范围内[18] - 银行希望数据溯源软件能与Microsoft集成,使从业务部门开始的数据溯源能持续通过Copilot体现[18] 数据治理与技术整合 - 数据溯源软件Solidatus可与数据库、应用程序以及Microsoft Power BI和Tableau等商业智能工具集成[14][15] - 该软件最具挑战性的整合对象是大型机应用程序,需要通过集成来解读COBOL等语言以捕获真实的数据流[16] - 数据治理是数据溯源的关键,明确数据的所有权、管理责任以及来源和消耗的问责制至关重要[21] - 加强数据溯源的技术方法包括自动化元数据捕获以及追踪进出生成式AI模型的数据的可追溯性[21] - 清晰的政策和强化这些政策的培训非常重要[21]
EXL Recognized as a Leader by Everest Group in its Healthcare Data, Analytics and AI Services PEAK Matrix® Assessment 2025
Globenewswire· 2025-09-17 22:01
行业认可与排名 - 公司被Everest Group评为2025年医疗保健数据、分析和人工智能服务PEAK Matrix评估的领导者[1] - 报告分析了32家领先的医疗保健数据和分析服务提供商[2] 核心优势与解决方案 - 公司拥有全面的医疗保健分析解决方案和平台解决方案组合[1] - 公司的关键优势在于其对数据和分析的专注、深厚的领域专业知识以及强大的合作伙伴生态系统[1] - 公司的模块化医疗平台整合了不同的数据集,可在人口健康、护理协调、质量和财务分析方面提供可操作的见解[2] - 公司对专注于医疗保健的知识产权工具的投资以及生成式人工智能的集成,突显了其对高影响力自动化的承诺[2] - 公司拥有行业特定的大型语言模型以及与NVIDIA和Databricks的战略合作伙伴关系[2] 行业背景与需求 - 在医疗保健行业,最大化数据价值对于改善患者治疗效果和运营效率至关重要[2] - 数据碎片化、孤岛化和缺乏标准化等问题阻碍了行业进步,推动组织专注于数据统一、治理和隐私以构建安全、集成的系统[2] - 从临床记录到诊断图像和保险索赔,医疗系统产生了数量惊人的数据,需要数据与人工智能解决方案将这些信息转化为可操作的见解[3] 公司业务概览 - 公司是一家全球数据和人工智能公司,提供服务和解决方案,旨在重塑客户业务模式、推动更好的结果并快速释放增长[4] - 公司利用数据、人工智能和深厚的行业知识来改造企业,其客户包括保险、医疗保健、银行和资本市场、零售、通信和媒体以及能源和基础设施等行业的全球领先公司[4] - 公司成立于1999年,总部位于纽约,在全球六大洲拥有约61,000名员工[4]
AvePoint (NasdaqGS:AVPT) FY Conference Transcript
2025-09-12 01:32
涉及的行业或公司 * 公司为AvePoint (NasdaqGS:AVPT) 一家专注于企业数据管理、治理和安全领域的软件公司[1] * 行业涉及企业级云服务、数据安全、网络安全、数据治理以及人工智能(AI)部署[3][5][9] 核心观点和论据 **网络安全与数据韧性需求持续强劲** * 网络攻击者与防御者之间的猫鼠游戏因AI而变得更加复杂和高级 需求不会消失[5] * 全球存在约150个勒索软件团伙 攻击者最觊觎的资产是邮件和文档 因为它们从业务和财务角度阐述了公司的运作[6] * 从数学上无法证明任何数字系统是完全安全的 这是数字系统的本质 与对手和犯罪集团共存是新常态[5] **AI部署的成功高度依赖数据质量与管理** * AI的好坏完全取决于所喂养的数据质量 没有魔法[10] * 一份MIT报告指出95%的AI项目获得零投资回报(ROI) 原因之一是AI若反复犯同样错误会让人感到沮丧 而普通的AI部署不会自主学习[10] * 必须持续、有意地训练AI 并喂养相关、非冗余、非过时的数据 AI的成功输出会反馈回输入 这是一个持续的过程[11] * 受监管行业因一直将数据卫生纳入其治理和合规实践 所以在部署AI方面有更高的成功率 而现在所有行业都开始关心此事[11] **公司的平台化战略与竞争优势** * 公司提供AvePoint Confidence Platform 以整体视角看待数字资产的产生与消亡 提供从备份恢复、勒索软件检测恢复、数据归档、分层存储管理到记录管理、治理、生命周期管理和访问控制的端到端服务[7] * 公司与只解决单一问题的碎片化竞争对手不同 其差异化在于跨生产力服务(如Microsoft 365, Google Workspace)提供互操作性 能跨数据被消耗的所有阶段交付策略机制[16][17] * 平台包含控制端(管理环境访问、数据获取、身份识别)和韧性端(数据保护、数据清理)产品 并能通过平台进行修复 使客户保持主动姿态[18][19] * 公司拥有25,000家全球客户 能根据客户所在行业(如医疗保健需HIPAA 金融服务业有其他要求)及同行情况 主动推荐应部署的治理框架[13] **市场机遇与增长驱动因素** * 公司目标到2029年达成10亿美元年度经常性收入(ARR) 并保持25%的复合年增长率(CAGR)[29][44] * 在受监管行业 公司估计已覆盖至少20%的Microsoft生产力云市场 仍有80%的增长空间 非受监管行业则是全新的绿地市场[24] * 公司业务过去90%与Microsoft生态系统绑定 如今正扩展到多云支持 包括Google、AWS、Salesforce 目前来自其他云的业务占比不到10%[33][34][37] * 得益于SaaS部署模式和云安全 公司正变得更易于中小型企业(SMB)使用 过去四年内 来自员工数少于500的小型企业的经常性收入从几乎为零增长至近20% 该部分贡献了Microsoft相关收入的40%[24][25] * 地域扩张:欧洲、中东和非洲地区(EMEA)是SaaS增长最快的区域之一 日本专注于企业市场 亚太地区(APAC)在印度、印尼、马来西亚、菲律宾呈曲棍球棒式增长[27][29] **法规遵从成为关键业务推动力** * DORA法规和欧盟法案(EU Act)等法规要求组织证明其操作的合规性 公司平台提供审计追踪和数据谱系以证明合规[20] * 公司为受监管行业提供丰富的、符合监管要求(如HIPAA, FINRA)的策略目录[20] * 公司解决方案曾帮助联合技术公司(United Technology)在遵守ITAR(武器贸易管制)法规方面节省了数千万美元的罚款[22][23] **新产品与早期反馈** * 公司于第二季度(Q2)推出了风险态势与指挥中心(Risk Posture and Command Center) 早期反馈良好[39][41] * 该指挥中心在部署AI代理前 能评估其是否会暴露未正确分类、标记的数据或向无权用户暴露信息 并提供风险评分和政策建议[41] * 下一步将利用AI能力进行大量修复工作 AI模型将根据信号、策略和业务监管要求 提前告知何时应更改策略[42] **增长战略与投入** * 增长将通过地域(EMEA, APAC, Americas)、渠道、多云和SMB市场的有机增长实现[44] * 自上市以来已完成6次小型补强收购 公司资产负债表强劲(拥有4.3亿美元现金 无负债) 未来可能进行更大收购以加速进入市场和增长[33][44] * 渠道是增长战略的重要组成部分 能提高销售和营销效率 公司发布了新的渠道合作伙伴计划 反响良好 将继续招募更多合作伙伴并通过渠道驱动更多业务[47][48] * 加大市场投入 包括利用数字触达在社交平台展示 开展基于账户的营销体验 并更全面地讲述品牌故事以提高品牌知名度[47] 其他重要内容 **财务与资本状况** * 公司于2021年以20亿美元市值上市[33] * 目前公司资产负债表上有4.3亿美元现金 无负债 并以两位数增长和两位数盈利能力运行[33] **竞争格局** * 公司没有单一的竞争对手 在不同领域遇到不同玩家[8][9] * 大型企业领域(员工数5,000以上)会遇到Cohesity和Rubrik等[8] * 中小型企业(SMB)领域会遇到Veeam(其80%收入来自员工数少于100的公司)[8] * 治理端(数据访问控制、生命周期管理)会遇到Varonis等玩家[8] * 数据集成、分析、迁移领域会遇到Quest Software或Informatica等传统企业级玩家[9] **AI带来的新风险与公司角色** * 生成式AI(GenAI)被用作替代搜索工具 AI会主动向用户推荐它认为其应该访问的内容 但企业权限管理和数据资产治理历来非常混乱 这带来了新的风险[12] * 公司通过其终端用户委托治理框架 可以基于策略关闭访问权限 关闭数据内容并让其退役 防止AI工具(如Microsoft的Teams Copilot)向用户推荐其不应访问的内容[12]