Workflow
PowerRAG
icon
搜索文档
OceanBase启用中文名“海扬数据库”,目标成为全球知名的中国数据库品牌
证券时报网· 2025-06-26 13:32
品牌升级与战略定位 - 公司正式启用中文品牌名"海扬数据库",品牌战略全面升级,体现深耕本土市场与引领全球分布式数据库技术创新的双重目标 [1] - "海扬"寓意承载海量数据(如支付宝每秒42万笔交易峰值处理)和开源开放生态,同时象征技术突破与全球化布局 [1] - 品牌名呼应"100%根自研"技术内核,强调15年自主研发历程 [1] 技术发展与商业化成果 - 公司诞生于2010年支付核心场景,通过"双十一"等万亿级交易考验,构建原生分布式架构,突破传统单机数据库性能瓶颈 [2] - 2020年商业化后,公有云和专有云双线发展,客户数连续四年增长超100%,覆盖金融、政务、通信等行业并实现全球化 [2] - 开源400万行代码,合作超1200家伙伴,开源集群部署数突破60000,下载量超百万 [2] AI时代战略布局 - 推出"Data×AI"战略,发布一体化数据底库4.4.0版本和首个应用产品PowerRAG,聚焦AI数据底座能力 [2] - AI解决方案已在零售、金融、物流等行业头部企业落地,推动AI从概念到实际应用 [2] - 公司目标成为全球数据库市场知名品牌,强化中国技术在全球舞台的地位 [3]
OceanBase全面拥抱AI新进展:OB Cloud支持十亿级多类型向量数据,数十家企业实现AI应用落地
量子位· 2025-06-26 11:43
大模型与AI落地现状 - 大模型热潮席卷全球,但企业面临AI融入核心业务、解决实际问题的关键鸿沟[1] - 模型易得但落地难行成为企业智能化转型的普遍困境[2] - ChatGPT等AI应用取得显著成绩:17个月用户突破8亿、年搜索量是谷歌的5.5倍[7] - AI正成为移动互联网之后的新一代基础设施[9] - AI普及速度超越历史任何技术创新,从工具升级为平台级基础设施[10] 企业AI落地的挑战 - 企业AI建设分为三个阶段:工具体验、业务融合、流程创新[11] - 技术与场景适配难题:非结构化数据处理复杂,需兼顾实时与分析场景[14] - 成本与性能平衡:海量数据推高存储成本,实时查询需求增加权衡难度[15] - 数据底座成为企业AI落地的核心瓶颈[16] - 企业优势与挑战均在于数据,需跨业务跨模态打通数据[17] OB Cloud的AI落地实践 - OceanBase推出OB Cloud,实现AI能力开发部署及生态集成[3] - 已服务电商零售、互联网服务、物流运输等数十家头部企业[4] - 支持搜索推荐、智能问答、企业级Agent等场景,将AI转化为现实生产力[5] - 典型案例:伯俊科技基于OB Cloud构建AI知识库,实现秒级查询响应[19] - in银泰商业利用OB Cloud向量检索能力打造智能问数平台[19] - 携程、三维家等实现"以图搜图"搜索及个性化推荐场景[19] OB Cloud的核心优势 - 多云原生:覆盖全球50+区域、170+地区,支持跨云容灾与分钟级故障切换[20][22] - 一体化架构:支持事务处理、实时分析与AI工作负载,无需额外技术栈[25][27] - 性能表现:VectorDBBench测试中达到开源向量数据库最优水平[28] - 多模向量一体化:原生支持文本、结构化数据、JSON和向量数据的统一管理[30][31] - PowerRAG工具:开箱即用的一站式平台,优化文档解析精度与召回率[33][34] 云数据库与AI融合趋势 - 云数据库与AI融合是企业智能化转型的必然路径[36] - 云数据库从"存储工具"升级为"智能引擎",释放数据价值[38] - 一体化架构是未来趋势,可闭环解决多模态数据处理与智能计算需求[41][42] - OB Cloud代表云数据库未来形态,成为企业AI落地的理想选择[45][46]
数据洪流下,如何重构 AI 时代的数据基础设施?
声动活泼· 2025-05-26 18:36
AI时代数据变革与挑战 - 2025年全球数据总量预计突破175ZB 数据类型从结构化向无结构/多模态/碎片化转变 传统数据库面临重构需求 [1] - AI时代数据需求三大变化:数据类型扩展至半/非结构化 数据规模几何级增长 查询方式从纯SQL转向混合查询 [3] - 数据处理能力成为AI核心要素 高质量数据提升模型精度 AI技术反哺非结构化数据处理自动化 [6] 数据赛道商业价值 - 数据赛道确定性极强 PaaS层作为连接IaaS与应用层的桥梁 将形成寡头格局而应用层分散 [4] - 企业"数据债"转化路径:分布式系统提升处理能力 大语言模型降低数据使用门槛 自然语言交互替代传统BI流程 [5] - 数据公司与AI公司边界模糊化 顶级企业需兼具双重能力 数据迁移成本构成竞争壁垒 [10] OceanBase技术战略 - 核心优势:原生分布式架构+一体化引擎 支持交易/分析/半结构化数据混合处理 代表AI时代基础设施趋势 [11][12] - 技术重构案例:单条SQL完成从人群筛选到AI邮件生成 简化开发者工作流但大幅提升底层复杂度 [14][15] - 开源战略定位世界级开源数据库 瞄准MySQL生态空白 计划持续投入15年以上 [16] 全球化竞争格局 - 海外市场三大优势:一体化工作负载处理 全规模数据高效处理 显著性价比优势 [17] - 出海挑战:东南亚生态不完善 迁移人才短缺 需复制新能源汽车产业抱团模式 [17] - AI出海机遇:中国技术全球领先 南美/东南亚基建空白 预计5年内华人主导当地企业运营 [19][20] 产品与行业趋势 - 新品发布三大方向:数据库分析能力增强 向量数据库与混合检索优化 PowerRAG服务简化开发 [22] - 开发者机遇:Data×AI时代初期 应用爆发增长 建议保持开放学习心态 [23] - SaaS行业转折点:AI工具将定制服务产品化 结合出海或引发产业爆发 [21]
长跑继续,AI时代OceanBase不“追风”
财经网· 2025-05-20 21:24
产品发布与战略升级 - OceanBase发布首款面向AI的产品PowerRAG,提供开箱即用的RAG应用开发能力,旨在解决AI应用的准确率问题[1] - 公司宣布升级一体化架构,推出业内首款深度集成对象存储与TP数据库的"共享存储"产品,在TP负载下存储成本最高降低50%,AP负载下可降至1/10[1][8][9] - 公司提出DATA×AI战略,致力于建设AI时代的数据底座,通过一体化引擎处理OLTP、OLAP及AI混合负载[3][4][6] 技术突破与性能表现 - 引入BQ量化算法使向量场景内存需求降低95%,JSON压缩比达MongoDB的3倍[7] - 基于VectorDBBench测试显示OceanBase向量性能已达开源向量数据库领先水平[7] - PowerRAG产品提供Document和Chat两个核心API接口,支持文档知识库、智能对话等多种AI应用场景快速开发[8] 商业化进展与市场地位 - 公司社区用户下载量突破百万量级,集群部署数量超5万,年环比增长超400%[10] - IDC报告显示OceanBase位列中国分布式关系型数据库"领导者"类别,产品能力第一[10] - 拥有超过1200家生态伙伴,其中100家核心经销商贡献60%外部业绩,10家专有云伙伴营收破千万[10] 行业趋势与数据洞察 - IDC预计2028年全球新生成数据量达393.9ZB,企业数据存储规模正从PB级迈向EB级[3] - 云数据库市场规模预计从2024年200多亿增长至2028年500多亿,届时将占关系型数据库七成份额[11] - 公有云市场TOP5行业营收占比近80%,集中在互联网、智能制造等数据量大的领域[11] 发展历程与未来规划 - 公司从2010年阿里内部技术探索起步,2020年开始独立商业化运营,2023年成立董事会独立运作[2][10] - 未来计划更加开放开源,目标是成为AI时代的MySQL[5] - 公司专注DATA与AI融合,不做"百模大战"参与者,而是聚焦数据处理能力提升[11]
OceanBase全面拥抱AI!首发PowerRAG产品,CTO杨传辉详解AI战略
量子位· 2025-05-19 12:37
公司战略升级 - OceanBase宣布全面进入AI时代,并启动人才和组织体系升级,任命CTO杨传辉担任AI战略一号位,成立AI平台与应用部、AI引擎组等新部门[4] - 公司致力于构建Data×AI能力,推动一体化数据库向一体化数据底座的战略演进[3][13] - 战略升级的首个产品PowerRAG发布,主打RAG开发能力开箱即用,覆盖数据层、平台层、接口层与应用层全流程[2][14] 行业背景与挑战 - AI技术驱动新生成数据量达3939ZB,其中企业非结构化数据占比超80%[5] - 传统数据基础设施面临存储容量告急、架构扩展不足、管理效率低下等挑战[5] - 企业大模型落地存在成本高、准确性不足、数据安全三大痛点,数据孤岛导致跨系统整合成本激增[10] 技术能力与产品创新 - OceanBase具备分布式存储计算、多模融合、TP/AP一体化能力,支持海量数据处理[15][16] - 向量性能达开源领先水平,引入BQ量化算法降低内存需求,JSON压缩技术减少半结构化数据存储成本[17][19] - 推出混合检索能力,支持结构化、半结构化、非结构化数据统一处理[26] 市场定位与生态价值 - 已服务金融、政务等2000多家客户,支撑支付宝核心系统及双11流量洪峰[10][11] - 目标打造世界级AI数据底座,覆盖从存储(行存、列存、向量等)到计算(OLTP、OLAP、推理等)全链路[13] - 推动"数据-模型-应用"生态循环,降低AI应用开发门槛,促进多模态、低成本技术演进[27] 行业趋势洞察 - AI推动数据基础设施从"被动存储"转向"主动赋能",需集成推理、向量等原生功能[23] - 未来数据底座需具备多模态融合、混合负载处理、成本性能平衡等特征[25][26][27] - 数据与AI关系从Data+AI升级为Data×AI,一体化融合成为核心竞争力[21][22]
AI大厦需要新的地基!
机器之心· 2025-05-19 12:03
数据与AI融合趋势 - 高质量数据短缺成为AI发展瓶颈,前OpenAI首席科学家Ilya Sutskever警告"预训练时代即将终结"[1] - 全球数据量将从2024年147ZB增长至2028年393.9ZB,年增速达28%[4] - 大数据IT投资规模将从2024年3540亿美元增长至2028年6440亿美元[5] - 数据库发展范式转向"Data×AI",即数据与模型一体化融合发展[1][6] OceanBase战略转型 - 提出构建"一体化数据底座"战略,支持SQL、AP和AI混合负载[2][9] - 15年技术积累支撑支付宝核心系统,连续十年稳定支持双11流量洪峰[13] - 全球唯一同时打破TPC-C和TPC-H测试纪录的数据库[13] - 已服务金融、政务等2000多家客户的关键业务系统升级[13] 技术能力突破 - 向量数据库性能领先,在VectorDBBench测试中超越3款开源产品[13] - 引入BQ量化算法使向量数据内存需求降低95%,2亿条1536维数据从1.2TB降至58.6GB[16] - 支持多模态数据包括标量、JSON、全文索引和向量混合检索[17] - 发布PowerRAG服务,封装文档处理全流程,准确率和召回率优于开发者自建方案[17] 产品发展方向 - 四大战略方向:知识底座、打破数据次元壁、AI靠谱参谋、流量冲浪高手[14] - 增强向量能力与融合检索,实现企业知识库动态更新[14] - 深度整合推理引擎与存储引擎,解决AI查询数据不一致问题[14] - 利用云虚拟化+分布式能力弹性应对流量波动[14] 行业生态布局 - 适配主流智能体平台包括Dify、FastGPT、DB-GPT和LangChain[20] - 开源社区用户突破百万,集群部署量超5万且年增长400%[21] - 连续两年位居墨天轮中国开源数据库排行榜第一[21][22] - 成立AI平台与应用部,CTO亲自担任AI战略一号位[21] 行业趋势判断 - 数据库正成为AI时代关键变量,模型能力取决于数据基础[23][24] - AI应用爆发产生两大需求:更海量数据和混合负载能力[24] - 未来所有数据公司都可能成为AI公司,Data×AI是核心竞争力[22][24] - 行业正从模型竞争转向底层数据基础设施建设[25][26]
不止上新,OceanBase在AI时代的数据“寻宝”
北京商报· 2025-05-18 22:18
公司战略转型 - 公司宣布全面进入AI时代,打造"Data×AI"核心能力,从一体化数据库转向一体化数据底座[1] - 蚂蚁集团CTO表示将支持公司在金融、医疗、生活等核心场景的AI突破[1] - 公司始于2010年服务天猫"双11",2020年独立后面对AI规模化阶段的新红利与价格战等挑战[1] 新产品发布 - PowerRAG提供开箱即用的RAG应用开发能力,打通数据层、平台层、接口层与应用层全流程,支持文档知识库、智能对话等场景[3] - 共享存储产品实现对象存储与事务型数据库深度集成,TP负载存储成本最高降低500%[3] - 共享存储解决无共享架构在弹性和成本方面的瓶颈,适用于TP、历史库、时序类业务等场景[4] 市场需求与产品定位 - 企业分为两类需求:通用AI助力企业需结合内部数据做后训练,SaaS企业需将AI能力拆分融入[5] - 公司未来布局从数据产生到训练、应用全链条,当前重点在构建数据底座[6] - IDC预测2028年全球新生成数据量达393 9ZB,企业数据存储规模迈向EB级带来存储与管理挑战[6] 行业挑战与竞争 - 大模型幻觉问题源于数据质量或缺失,Data×AI融合是当前难点[7] - 数据库行业价格竞争激烈,国产厂商基于开源技术重叠导致低价争夺市场,云厂商通过订阅模式降低成本[7] - 公司强调技术创新带来的成本下降,认为性价比意味着更高质量而非单纯低价[7] 技术背景与趋势 - 对象存储因高可靠、低成本特性广泛应用于AP等场景,但TP生产环境依赖本地磁盘导致对象存储难以应用[4] - 海量互联网数据成就大模型,但数据获取成本增加、行业数据稀缺、多模态处理难等挑战仍存[6]
蚂蚁集团CTO何征宇揭秘AI四大挑战:未来所有数据公司都将成为AI公司
新浪科技· 2025-05-18 07:48
公司动态 - OceanBase发布面向AI的应用产品PowerRAG,提供开箱即用的RAG应用开发能力,是公司面向AI时代的探索之一 [1] - CEO杨冰宣布公司全面进入AI时代,致力于构建Data×AI能力,推动一体化数据库向一体化数据底座的战略演进 [1] - 蚂蚁集团CTO何征宇表示将支持OceanBase在金融、医疗、生活等AI核心场景的突破,实践Data×AI理念和架构创新 [2][10] - 蚂蚁集团将继续支持OceanBase开源开放,逐步将Data×AI能力开放给行业 [2][10] 行业趋势 - AGI时代意味着单个模型或解决方案能够完成多个细分AI任务,预计将涌现指数级增长的长尾应用需求 [5] - 海量数据成就了大模型,但大模型幻觉问题的源头也是数据问题,数据决定大模型能力上限 [1][6] - AI发展遵循"长尾理论",海量长尾需求聚合时总和将超越任何单一主流市场规模 [4] - 未来所有数据公司都将成为AI公司 [9] 技术挑战 - 数据获取成本显著增加,互联网公开数据资源已接近枯竭,未来企业成功标准是能否高效率产生高质量数据 [7] - 行业数据流通困难,高严谨性行业存在数字化滞后、数据质量要求严苛等问题,导致高质量数据结构性缺失 [8] - 多模态数据处理难度大,未来数据规模将呈指数级增长,包含文本、视觉、触觉等多种形式 [8] - 大模型质量评估困难,需要大量具备人类思维或知识的数据进行评估 [9] 战略布局 - OceanBase过去在蚂蚁集团内部应用自研海量交易数据技术创新,构建全分布式数据库架构及相关技术体系 [9] - 未来OceanBase将实现从算力、基础设施到平台层、应用层、交付形态的全方位布局 [1] - AI竞争已进入深水区,不仅是模型竞争,更是基础设施竞争,基础设施效果将直接决定模型效果 [10]
全面拥抱AI后,OceanBase推出开箱即用RAG服务
南方都市报· 2025-05-17 17:32
公司战略升级 - 公司升级AI战略,从一体化数据库向一体化数据底座演进,通过一套引擎支持TP/AP/AI混合负载、向量数据库及SQL与AI混合检索 [1][2][4] - CEO通过全员信宣布公司全面进入AI时代,CTO提出构建Data×AI能力,推动战略演进 [1][4] - 蚂蚁集团支持公司在金融、医疗、生活等核心场景实践Data×AI理念,并继续推动开源开放 [4] 新产品发布 - 发布PowerRAG,提供开箱即用的RAG服务,打通数据层、平台层、接口层与应用层全流程,支持文档和对话API接口 [1][5][7] - PowerRAG旨在解决传统RAG开发周期长、维护成本高、调试困难等问题,支持文档知识库、智能对话、图像比对等场景快速开发 [5][7] - 发布业内首个"共享存储"产品,实现对象存储与TP数据库深度集成,TP负载存储成本最高降低50% [9][10] - "共享存储"采用多级缓存架构、自研LSM-Tree引擎等技术,支持毫秒级响应,覆盖TP、时序类、OLAP等业务场景 [10] 技术能力突破 - 向量性能达业内领先水平,基准测试显示优于三款开源向量数据库 [7][8] - 混合检索能力增强,通过自研向量算法库、内核级多模查询实现更快更准的检索 [9] - OB Cloud上线百度云,已支持阿里云、华为云、腾讯云、AWS、Google Cloud等六大公有云平台,覆盖超100个可用区 [10] 行业应用与客户案例 - 公司数据库连续十余年支撑"双11",服务金融、政务、运营商等2000多家客户 [7] - 客户案例包括联通软研院基于OceanBase开发AI助手,银泰商业打造零售业智能问数平台 [7] - 行业共识认为AI时代数据存在四大挑战:获取成本高、行业数据稀缺、多模态处理难、质量评估难 [1]
2025 OceanBase开发者大会:Data×AI战略引领未来
经济观察报· 2025-05-17 14:41
Data×AI战略 - OceanBase提出Data×AI战略 致力于构建一体化数据底座 推动数据库向数据底座的战略演进 [3] - 蚂蚁集团CTO指出当前数据领域存在四大挑战 包括获取成本高 行业数据稀缺 多模态处理能力不足 数据质量评估难 [3] - OceanBase已具备分布式存储计算 多模融合 TP/AP一体化等能力 未来将实现SQL与AI混合检索及向量数据库支持 [3][4] PowerRAG产品发布 - OceanBase发布PowerRAG产品 提供开箱即用的RAG服务 解决传统RAG开发周期长 维护成本高等痛点 [5] - 产品打通数据层 平台层 接口层与应用层 提供Document和Chat两大API接口 支持文档知识库 智能对话等场景快速开发 [5] - PowerRAG是公司在AI应用层面的首次探索 未来将在平台和应用层面持续突破 [6] 技术突破 - OceanBase向量性能达开源数据库领先水平 在VectorDBBench测试中表现优异 [7] - 引入BQ量化算法使向量场景内存需求降低95% JSON压缩比达MongoDB的3倍 [7] - 混合检索能力通过自研算法库 内核级多模查询等实现性能提升 支持更快更准的检索 [8] 生态合作 - 蚂蚁集团承诺开放金融 医疗 生活等核心AI场景 支持OceanBase实践Data×AI创新 [9] - 双方将深化合作 OceanBase将开源Data×AI能力 蚂蚁集团继续提供场景打磨技术 [9] - 已有联通软研院AI助手 银泰商业智能问数平台等落地案例 验证实际应用价值 [9]