Workflow
Database
icon
搜索文档
AI大厦需要新的地基!
机器之心· 2025-05-19 12:03
数据与AI融合趋势 - 高质量数据短缺成为AI发展瓶颈,前OpenAI首席科学家Ilya Sutskever警告"预训练时代即将终结"[1] - 全球数据量将从2024年147ZB增长至2028年393.9ZB,年增速达28%[4] - 大数据IT投资规模将从2024年3540亿美元增长至2028年6440亿美元[5] - 数据库发展范式转向"Data×AI",即数据与模型一体化融合发展[1][6] OceanBase战略转型 - 提出构建"一体化数据底座"战略,支持SQL、AP和AI混合负载[2][9] - 15年技术积累支撑支付宝核心系统,连续十年稳定支持双11流量洪峰[13] - 全球唯一同时打破TPC-C和TPC-H测试纪录的数据库[13] - 已服务金融、政务等2000多家客户的关键业务系统升级[13] 技术能力突破 - 向量数据库性能领先,在VectorDBBench测试中超越3款开源产品[13] - 引入BQ量化算法使向量数据内存需求降低95%,2亿条1536维数据从1.2TB降至58.6GB[16] - 支持多模态数据包括标量、JSON、全文索引和向量混合检索[17] - 发布PowerRAG服务,封装文档处理全流程,准确率和召回率优于开发者自建方案[17] 产品发展方向 - 四大战略方向:知识底座、打破数据次元壁、AI靠谱参谋、流量冲浪高手[14] - 增强向量能力与融合检索,实现企业知识库动态更新[14] - 深度整合推理引擎与存储引擎,解决AI查询数据不一致问题[14] - 利用云虚拟化+分布式能力弹性应对流量波动[14] 行业生态布局 - 适配主流智能体平台包括Dify、FastGPT、DB-GPT和LangChain[20] - 开源社区用户突破百万,集群部署量超5万且年增长400%[21] - 连续两年位居墨天轮中国开源数据库排行榜第一[21][22] - 成立AI平台与应用部,CTO亲自担任AI战略一号位[21] 行业趋势判断 - 数据库正成为AI时代关键变量,模型能力取决于数据基础[23][24] - AI应用爆发产生两大需求:更海量数据和混合负载能力[24] - 未来所有数据公司都可能成为AI公司,Data×AI是核心竞争力[22][24] - 行业正从模型竞争转向底层数据基础设施建设[25][26]
不止上新,OceanBase在AI时代的数据“寻宝”
北京商报· 2025-05-18 22:18
公司战略转型 - 公司宣布全面进入AI时代,打造"Data×AI"核心能力,从一体化数据库转向一体化数据底座[1] - 蚂蚁集团CTO表示将支持公司在金融、医疗、生活等核心场景的AI突破[1] - 公司始于2010年服务天猫"双11",2020年独立后面对AI规模化阶段的新红利与价格战等挑战[1] 新产品发布 - PowerRAG提供开箱即用的RAG应用开发能力,打通数据层、平台层、接口层与应用层全流程,支持文档知识库、智能对话等场景[3] - 共享存储产品实现对象存储与事务型数据库深度集成,TP负载存储成本最高降低500%[3] - 共享存储解决无共享架构在弹性和成本方面的瓶颈,适用于TP、历史库、时序类业务等场景[4] 市场需求与产品定位 - 企业分为两类需求:通用AI助力企业需结合内部数据做后训练,SaaS企业需将AI能力拆分融入[5] - 公司未来布局从数据产生到训练、应用全链条,当前重点在构建数据底座[6] - IDC预测2028年全球新生成数据量达393 9ZB,企业数据存储规模迈向EB级带来存储与管理挑战[6] 行业挑战与竞争 - 大模型幻觉问题源于数据质量或缺失,Data×AI融合是当前难点[7] - 数据库行业价格竞争激烈,国产厂商基于开源技术重叠导致低价争夺市场,云厂商通过订阅模式降低成本[7] - 公司强调技术创新带来的成本下降,认为性价比意味着更高质量而非单纯低价[7] 技术背景与趋势 - 对象存储因高可靠、低成本特性广泛应用于AP等场景,但TP生产环境依赖本地磁盘导致对象存储难以应用[4] - 海量互联网数据成就大模型,但数据获取成本增加、行业数据稀缺、多模态处理难等挑战仍存[6]
蚂蚁集团CTO何征宇揭秘AI四大挑战:未来所有数据公司都将成为AI公司
新浪科技· 2025-05-18 07:48
公司动态 - OceanBase发布面向AI的应用产品PowerRAG,提供开箱即用的RAG应用开发能力,是公司面向AI时代的探索之一 [1] - CEO杨冰宣布公司全面进入AI时代,致力于构建Data×AI能力,推动一体化数据库向一体化数据底座的战略演进 [1] - 蚂蚁集团CTO何征宇表示将支持OceanBase在金融、医疗、生活等AI核心场景的突破,实践Data×AI理念和架构创新 [2][10] - 蚂蚁集团将继续支持OceanBase开源开放,逐步将Data×AI能力开放给行业 [2][10] 行业趋势 - AGI时代意味着单个模型或解决方案能够完成多个细分AI任务,预计将涌现指数级增长的长尾应用需求 [5] - 海量数据成就了大模型,但大模型幻觉问题的源头也是数据问题,数据决定大模型能力上限 [1][6] - AI发展遵循"长尾理论",海量长尾需求聚合时总和将超越任何单一主流市场规模 [4] - 未来所有数据公司都将成为AI公司 [9] 技术挑战 - 数据获取成本显著增加,互联网公开数据资源已接近枯竭,未来企业成功标准是能否高效率产生高质量数据 [7] - 行业数据流通困难,高严谨性行业存在数字化滞后、数据质量要求严苛等问题,导致高质量数据结构性缺失 [8] - 多模态数据处理难度大,未来数据规模将呈指数级增长,包含文本、视觉、触觉等多种形式 [8] - 大模型质量评估困难,需要大量具备人类思维或知识的数据进行评估 [9] 战略布局 - OceanBase过去在蚂蚁集团内部应用自研海量交易数据技术创新,构建全分布式数据库架构及相关技术体系 [9] - 未来OceanBase将实现从算力、基础设施到平台层、应用层、交付形态的全方位布局 [1] - AI竞争已进入深水区,不仅是模型竞争,更是基础设施竞争,基础设施效果将直接决定模型效果 [10]
Irenic snaps up a stake in Couchbase. Here are two tracks the firm can take to create value
CNBC· 2025-05-17 20:50
公司业务 - Couchbase提供面向现代应用的云数据库平台 其数据库专为高性能和大规模应用设计 服务于企业关键业务应用 [1] - 主要产品包括Couchbase Capella(全托管数据库服务)、Couchbase Server(多功能NoSQL数据库)和Couchbase Mobile(移动端嵌入式数据库) [1] - Couchbase Server支持SQL++查询语言 可部署在本地或任何云环境 Couchbase Mobile为移动设备提供高可用性数据服务 [1] 行业格局 - 文档数据库领域仅有MongoDB和Couchbase两家上市公司 公司业务稳固 产品应用于从移动应用到航空系统的各类场景 [4] - 公司自2021年2月上市以来股价下跌超过20% 未能获得公开市场青睐 [4] 财务表现 - 上市后年均收入增长19.39% 毛利率保持在87%-89%的高水平 [5] - 2024年销售及行政费用占收入比例达91.94% 远高于同行MongoDB的54.34% [5] - 销售团队目标达成率仅40%-50% 显著低于行业70%-80%的平均水平 [5] 激进投资者介入 - Irenic Capital已建仓Couchbase 并将其列为前五大持仓之一 [6] - Irenic由前Elliott投资组合经理Adam Katz创立 擅长战略维权 曾推动企业分拆和出售业务 [2] 潜在战略选择 - 运营重组路径:优化销售团队规模 改善资本配置 提高运营利润率 但可能导致短期增长放缓 [6] - 出售公司路径:私有化后调整成本结构 实现更有机的增长 避免公开市场压力 [7] - 私有股权收购可能性较大 现有大股东Haveli Investments持股9.8% 可能参与收购 [8] 潜在收购方 - 战略收购方可能包括亚马逊、微软Azure、谷歌等科技巨头 近期数据领域并购活跃 [8] - 估值参考:2021年Cloudera被以5.2倍营收收购 若按6倍估值计算 Couchbase可能获得更高溢价 [8]
全面拥抱AI后,OceanBase推出开箱即用RAG服务
南方都市报· 2025-05-17 17:32
公司战略升级 - 公司升级AI战略,从一体化数据库向一体化数据底座演进,通过一套引擎支持TP/AP/AI混合负载、向量数据库及SQL与AI混合检索 [1][2][4] - CEO通过全员信宣布公司全面进入AI时代,CTO提出构建Data×AI能力,推动战略演进 [1][4] - 蚂蚁集团支持公司在金融、医疗、生活等核心场景实践Data×AI理念,并继续推动开源开放 [4] 新产品发布 - 发布PowerRAG,提供开箱即用的RAG服务,打通数据层、平台层、接口层与应用层全流程,支持文档和对话API接口 [1][5][7] - PowerRAG旨在解决传统RAG开发周期长、维护成本高、调试困难等问题,支持文档知识库、智能对话、图像比对等场景快速开发 [5][7] - 发布业内首个"共享存储"产品,实现对象存储与TP数据库深度集成,TP负载存储成本最高降低50% [9][10] - "共享存储"采用多级缓存架构、自研LSM-Tree引擎等技术,支持毫秒级响应,覆盖TP、时序类、OLAP等业务场景 [10] 技术能力突破 - 向量性能达业内领先水平,基准测试显示优于三款开源向量数据库 [7][8] - 混合检索能力增强,通过自研向量算法库、内核级多模查询实现更快更准的检索 [9] - OB Cloud上线百度云,已支持阿里云、华为云、腾讯云、AWS、Google Cloud等六大公有云平台,覆盖超100个可用区 [10] 行业应用与客户案例 - 公司数据库连续十余年支撑"双11",服务金融、政务、运营商等2000多家客户 [7] - 客户案例包括联通软研院基于OceanBase开发AI助手,银泰商业打造零售业智能问数平台 [7] - 行业共识认为AI时代数据存在四大挑战:获取成本高、行业数据稀缺、多模态处理难、质量评估难 [1]
2025 OceanBase开发者大会:Data×AI战略引领未来
经济观察报· 2025-05-17 14:41
Data×AI战略 - OceanBase提出Data×AI战略 致力于构建一体化数据底座 推动数据库向数据底座的战略演进 [3] - 蚂蚁集团CTO指出当前数据领域存在四大挑战 包括获取成本高 行业数据稀缺 多模态处理能力不足 数据质量评估难 [3] - OceanBase已具备分布式存储计算 多模融合 TP/AP一体化等能力 未来将实现SQL与AI混合检索及向量数据库支持 [3][4] PowerRAG产品发布 - OceanBase发布PowerRAG产品 提供开箱即用的RAG服务 解决传统RAG开发周期长 维护成本高等痛点 [5] - 产品打通数据层 平台层 接口层与应用层 提供Document和Chat两大API接口 支持文档知识库 智能对话等场景快速开发 [5] - PowerRAG是公司在AI应用层面的首次探索 未来将在平台和应用层面持续突破 [6] 技术突破 - OceanBase向量性能达开源数据库领先水平 在VectorDBBench测试中表现优异 [7] - 引入BQ量化算法使向量场景内存需求降低95% JSON压缩比达MongoDB的3倍 [7] - 混合检索能力通过自研算法库 内核级多模查询等实现性能提升 支持更快更准的检索 [8] 生态合作 - 蚂蚁集团承诺开放金融 医疗 生活等核心AI场景 支持OceanBase实践Data×AI创新 [9] - 双方将深化合作 OceanBase将开源Data×AI能力 蚂蚁集团继续提供场景打磨技术 [9] - 已有联通软研院AI助手 银泰商业智能问数平台等落地案例 验证实际应用价值 [9]
OceanBase发布面向AI的应用产品PowerRAG
快讯· 2025-05-17 11:45
OceanBase AI战略升级 - 公司于5月17日举办第三届开发者大会 这是升级AI战略后首次开发者大会 [1] - 会上发布面向AI的应用产品PowerRAG 提供开箱即用的RAG应用开发能力 [1] - 该产品是公司面向AI时代的探索之一 [1] 战略方向调整 - CTO杨传辉表示公司正构建Data×AI能力 [1] - 推动一体化数据库向一体化数据底座的战略演进 [1] - 战略调整面向AI时代需求 [1]
OceanBase创始人阳振坤荣誉退休,曾从0到1发起自研国产分布式数据库
新浪科技· 2025-05-13 09:49
据介绍,阳振坤在2010年从0到1发起并100%自研原生分布式数据库OceanBase。15年来,阳振坤带领 OceanBase攻克了分布式数据库的核心技术壁垒,开创了中国分布式数据库自主创新的先河,也培养了 一代数据库人。 在创办OceanBase之前,阳振坤还有长期的学术经历。他是北京大学数学学士、数学硕士、计算机博 士,博士期间师从王选院士,参与汉字激光照排系统开发。毕业后阳振坤留校任教, 1999年年仅34岁 受聘为北京大学特聘教授。 新浪科技讯 5月13日上午消息,新浪科技从数据库厂商OceanBase的公号获悉,OceanBase创始人、首席 科学家阳振坤荣誉退休,5月11日也恰是他入职的十五周年纪念日。这位1965年出生的分布式系统与数 据库资深专家,见证并推动了中国数据库的技术革新。 由于在计算机相关领域取得了显著学术成就,对社会产生重要贡献,阳振坤获得多项荣誉表彰,包括国 家科学技术进步一等奖(排名第四)、北京市科学技术进步一等奖等。2022年11月,CCF 奖励委员会 授予阳振坤"CCF 王选奖"。 当前,OceanBase市占率位居国内分布式数据库的独立厂商第一。OceanBase技术攻 ...
Aerospike Automates Database 8 Deployment on Amazon EKS
GlobeNewswire News Room· 2025-05-12 17:00
Aerospike新产品发布 - 公司推出新的Terraform蓝图,可在30分钟内在Amazon EKS上快速部署Database 8 [1] - 该蓝图通过Aerospike Kubernetes Operator (AKO)自动化部署和管理云端及本地Aerospike数据库,无需用户具备深厚专业知识即可快速启动和扩展 [2] - 新产品基于AWS的Data on EKS (DoEKS)开源项目,加速在Amazon EKS上构建、部署和扩展数据工作负载 [3] 产品技术优势 - 提供完整的Aerospike部署方案,包括EKS集群配置、VPC等基础设施设置以及AKO和Aerospike服务器的默认推荐配置 [3] - 支持多模型数据库,包括文档、图、键值和向量搜索,所有功能集成在一个可大规模扩展的实时数据库中 [5] - 相比传统解决方案,开发者可减少80%的基础设施使用量,同时构建高性能应用 [5] 公司背景与客户 - 公司专注于实时数据库,提供无限扩展、高速和成本节约的解决方案,客户包括Adobe、PayPal、Snap等领先企业 [6] - 公司总部位于加州山景城,并在伦敦、班加罗尔和特拉维夫设有办公室 [6] - 公司曾三次获得Data Breakthrough Awards,简化了部署、集群管理和监控流程 [5]
独家对话杨传辉:AI时代来临,数据库龙头OceanBase如何自我变革?|钛媒体AGI
钛媒体APP· 2025-05-12 10:05
行业数据与趋势 - 2024年全球大数据IT总投资规模达3540亿美元,预计2028年增至6440亿美元,五年复合增长率16.8% [2] - 中国2028年大数据IT支出规模预计621.7亿美元,全球占比10%,复合增长率24.9%居全球首位 [2] - 中国当前数据产量占全球总产量的23%,AI时代下多模态无结构化数据(图片、文本、视频)规模加速增长 [2][6] 公司战略与定位 - OceanBase提出"DATA×AI"战略,从数据库延伸至"AI时代一体化数据底座",融合结构化、半结构化及无结构化数据处理能力 [4][6][7] - 公司任命CTO杨传辉为AI战略一号位,成立AI平台与应用部、AI引擎组等新部门,蚂蚁集团将向OceanBase开放全部AI场景 [3] - 目标成为全球数据处理领域最佳选择,通过分布式架构和一体化能力解决数据扩展性、碎片化等挑战 [4][13] 技术能力与产品进展 - OceanBase 4.3/4.4版本强化一体化方向,提升无结构化数据处理和向量能力,支持AI时代需求 [9] - 2025开发者大会将发布AI相关数据库产品、RAG服务及大模型应用成果,性能与性价比达业界一流水平 [10][11] - 原生分布式数据库经历双11海量数据场景考验,具备金融级稳定性及多数据类型支持能力 [6][7] 市场竞争与生态建设 - 对比Oracle、Snowflake等国际数据库厂商,OceanBase强调在AI趋势下抓住TP/AP负载、向量等技术边界模糊的机遇 [7] - 开源社区为国内最强数据库社区,但全球生态建设仍需突破,需通过开放策略提升全球影响力 [13] - 技术挑战包括降低AI幻觉、数据与模型融合的世界级难题,需持续投入工程能力与研发敏捷性 [12][13] 市场需求与客户应用 - 已服务金融、政务、运营商等2000多家客户,关键业务系统升级需求驱动AI战略落地 [3] - AI应用爆发导致数据量级增长,OceanBase通过一体化底座满足企业对数据种类、结构及规模的多样化需求 [11] - RAG服务帮助企业结合自有数据与公开模型,提升业务价值,应对数据孤岛和碎片化挑战 [10]