Workflow
Elastic Inference Service (EIS)
icon
搜索文档
Elastic Introduces Best-in-Class Embedding Models for High Performance Semantic Search
Businesswire· 2026-02-24 01:00
核心观点 - Elastic 公司发布了 jina-embeddings-v5-text 系列小型多语言嵌入模型,该模型在参数规模较小(0.2B和0.6B)的情况下,在关键搜索和语义任务上实现了最先进的性能,并超越了参数大得多的模型,为在基础设施成本、查询速度和受限环境部署方面提供了显著优势 [1][2] 产品性能与特点 - 模型家族包括两个模型:jina-embeddings-v5-text-small(2.39亿参数)和 jina-embeddings-v5-text-nano(6.77亿参数)[4] - 尽管模型紧凑,但其性能显著超越了参数规模达70亿至140亿的大型模型,并在MMTEB基准测试中取得了同类尺寸和用途模型中的最佳成绩 [2] - 模型的小尺寸使其能够在较低的基础设施成本下实现出色的混合搜索、更快的查询响应,并适用于内存和计算预算紧张的新部署场景,包括边缘设备和资源受限环境 [2] - 模型针对搜索和智能体应用中的四项常见任务进行了优化:检索、文本匹配、分类和聚类 [4][9] 产品发布与获取渠道 - jina-embeddings-v5-text 模型现已通过多种渠道提供:作为开放权重模型在 HuggingFace 上供用户通过 vLLM、llama.cpp 或 MLX 进行自托管部署,以及通过 Elastic 推理服务(EIS)获取 [3] - Elastic 推理服务(EIS)是一种 GPU 加速的推理即服务,使用户无需复杂设置即可运行快速、高质量的推理 [3] - Jina v5 模型现已通过 Elastic Cloud Serverless 和 Elastic Cloud Hosted 上的 Elastic 推理服务(EIS)提供,所有 Elastic Cloud 试用版均包含对 EIS 的访问权限 [5] - 这些模型也可通过在线 API 获取,并可通过 vLLM、llama.cpp 和 MLX 进行本地托管 [5] 战略意义与平台整合 - 通过将 Jina v5 系列引入 EIS,用户获得了一个完整的数据平台,该平台将最先进的多语言嵌入模型、高性能向量数据库等整合到一个跨云和本地的统一企业技术栈中 [3] - 公司表示,向量搜索、RAG和AI智能体依赖于高质量的检索,Jina v5 多语言嵌入的加入使 Elasticsearch 继续成为端到端上下文工程的首选平台 [4] - Elastic 的 Search AI 平台是其搜索、可观测性和安全解决方案的基础,被数千家公司使用,其中包括超过50%的财富500强公司 [7]
Elastic to Announce Third Quarter Fiscal 2026 Earnings Results on Thursday, February 26, 2026
Businesswire· 2026-02-13 05:15
公司财务信息 - Elastic将于2026年2月26日美国股市收盘后发布其2026财年第三季度(截至2026年1月31日)的财务业绩 [1] - 公司计划在当天太平洋时间下午2点/东部时间下午5点举行电话会议,回顾财务业绩和业务展望 [1] - 电话会议的网络直播将在Elastic投资者关系网站上提供,重播将保留两个月 [1] 公司业务定位 - Elastic定位为“搜索AI公司”,将其在搜索技术方面的深厚专业知识与人工智能相结合,旨在帮助用户将数据转化为答案、行动和结果 [1] - 公司的Search AI平台是其搜索、可观测性和安全解决方案的基础,被数千家公司使用,其中包括超过50%的《财富》500强企业 [1] 近期产品动态 - Elastic通过Cloud Connect为自托管Elasticsearch部署提供Elastic推理服务,使组织能够按需访问云端托管的推理能力,而无需管理GPU基础设施,同时核心基础设施和数据可保留在本地 [1] - Elastic在其Elastic推理服务上提供了两个Jina Reranker模型,该服务是一个GPU加速的推理即服务产品,这些重排器为Elastic生态系统带来了低延迟、高精度的多语言重排能力 [1] - Elastic宣布Agent Builder全面上市,这是一套完整的功能,可帮助开发人员快速构建安全、可靠、上下文驱动的AI智能体,该产品基于Elasticsearch构建,擅长在统一的平台上提供相关性,以扩展、搜索和分析企业数据 [1] 行业分类 - 公司业务涉及软件、人工智能、技术、数据管理和安全行业 [1]
Elastic Delivers GPU Infrastructure to Self-Managed Elasticsearch Customers via Cloud Connect
Businesswire· 2026-02-04 01:29
产品发布与核心功能 - Elastic公司宣布通过Cloud Connect为自托管Elasticsearch部署提供Elastic推理服务[1] - 该服务使组织无需管理GPU基础设施即可按需获取云端推理能力 同时将核心基础设施和数据保留在本地[1] - 用户可立即访问由Jina.ai提供的模型 Jina.ai是Elastic旗下公司 在开源多语言多模态嵌入 重排序和小语言模型领域处于领先地位[1] 技术细节与客户价值 - 现代语义搜索依赖向量嵌入以获得高质量结果 EIS on Cloud Connect现已随Elasticsearch 9.3版本提供[2] - 该服务允许自托管客户无缝利用基于GPU的嵌入和重排序模型 包括领先的Jina模型 而无需承担管理基础设施的运营负担[2] - 这使得团队能够快速高效地实施强大的语义搜索功能 自托管集群可保持现有架构和数据不变 同时将嵌入生成和搜索推理安全地卸载至Elastic Cloud托管的GPU集群[2] 市场定位与公司背景 - 公司高管表示 该服务旨在降低自托管客户采用语义搜索的复杂性 通过一次性设置 客户即可访问从自动诊断到快速AI推理的一系列云服务 同时数据保留在本地[3] - Elastic将自己定位为搜索AI公司 将其深厚的搜索技术专长与人工智能相结合 帮助用户将数据转化为答案 行动和成果[4] - Elastic的搜索AI平台是其搜索 可观测性和安全解决方案的基础 被数千家公司使用 其中包括超过50%的财富500强公司[4]
Elastic Shares Surge 8% After Hours On Jina AI Acquisition, New Inference Service Launch, $500 Million Buyback - Elastic (NYSE:ESTC)
Benzinga· 2025-10-10 11:36
股价表现与驱动事件 - 公司股价在盘后交易中大幅上涨8%至88.07美元,而常规交易时段曾下跌1.98% [1] - 股价上涨由三项重大公司公告驱动:完成对Jina AI的收购、推出新的GPU推理服务、批准5亿美元股票回购计划 [1] Jina AI收购完成 - 公司已完成对Jina AI的收购,Jina AI是一家在开源工具领域创新的公司,擅长处理多模态数据和语言 [2] - 此次收购增强了公司在向量搜索、检索增强生成和智能体AI情境工程方面的能力 [3] - 收购为公司带来了用于文本和图像处理的稠密向量模型,增强了其ELSER模型,并增加了先进的视觉和多语言内容重排序器以及用于基础任务的小型语言模型 [3] - 公司CEO强调搜索是生成式AI的基础,Jina AI前CEO已加入公司担任AI副总裁 [4] GPU加速推理服务推出 - 公司推出Elastic Inference Service,该服务使用NVIDIA GPU,数据处理速度比基于CPU的方案快高达10倍 [5] - 首个进入技术预览的模型是ELSER,Jina模型预计将很快跟进 [5] - 该服务提供基于使用量的定价模式,按每百万tokens计费,可在无服务器和Elastic Cloud托管部署中使用 [6] 股票回购计划 - 公司董事会批准了一项上限为5亿美元且无固定到期日的股票回购计划 [7] - 公司CFO表示回购计划反映了董事会和管理团队对公司业务实力的信心 [7] 历史股价与市场数据 - 公司股票在过去一年上涨2.10%,但2025年迄今下跌17.69% [7] - 股价交易区间为70.15美元至118.84美元,公司市值为86.7亿美元,日均交易量约为212万股 [7]
Elastic Introduces Native Inference Service in Elastic Cloud
Businesswire· 2025-10-09 23:02
新产品发布 - 公司宣布推出Elastic Inference Service (EIS),一项用于Elasticsearch语义搜索、向量搜索和生成式AI工作流程的GPU加速推理服务[1] - 该服务作为推理即服务提供,并原生集成于Elastic Cloud中[2] 产品功能与优势 - 服务通过基于API的方式使用NVIDIA GPU,结合公司顶级的Elasticsearch向量数据库,以提供低延迟、高吞吐量的推理[3] - 首个在EIS上提供的文本嵌入模型是Elastic Learned Sparse EncodeR (ELSER),目前处于技术预览阶段[3] - 服务提供简化的开发者体验,无需模型下载、手动配置或资源调配,并直接与semantic_text和Inference API集成[7] - 服务兼容稀疏向量、稠密向量或语义重新排序,改善了端到端语义搜索体验[7] - 服务提供开箱即用的AI功能,用于数据摄取、调查、检测和分析,简化了生成式AI工作流程[7] - GPU加速推理提供一致的延迟,并且与基于CPU的方案相比,数据摄取吞吐量最高可提升10倍[7] 技术整合与兼容性 - 服务旨在满足市场对GPU加速和集成工作流程的需求,以提供速度、可扩展性和成本效益[2] - Open Inference API为用户提供了连接任何第三方服务的完全灵活性,同时现有的Elasticsearch ML Nodes在采用期间继续受支持[7] 定价与可用性 - 服务采用基于消费的定价模式,按每个模型每百万tokens收费[7] - Elastic Inference Service已在Serverless和Elastic Cloud Hosted部署上可用,所有云服务提供商和区域均可访问EIS上的推理端点[5] - 未来将很快提供对多语言嵌入、重新排序以及近期收购的Jina模型等额外模型的支持[3][5]
Elastic Completes Acquisition of Jina AI, a Leader in Frontier Models for Multimodal and Multilingual Search
Businesswire· 2025-10-09 21:02
收购概述 - Elastic已完成对开源多模态嵌入模型公司Jina AI的收购 [1] - 此次收购旨在增强公司在检索、嵌入和上下文工程领域的领导地位,以赋能代理AI [1] 战略意义与能力提升 - 收购深化了Elastic在向量搜索、检索增强生成和上下文工程方面的能力 [2] - 通过整合Jina AI的密集向量、多语言多模态嵌入模型,公司增强了在非结构化数据相关性方面的领导力 [3] - Jina AI的先进重排序器提升了视觉和长上下文多语言文档的检索质量 [3] - 收购还为公司带来了用于基础任务的专业小语言模型 [3] - 此次整合体现了公司对提供开放、易用、生产就绪的规模化搜索AI平台的持续承诺 [2] 技术整合与产品规划 - Jina AI的团队和技术将为Elastic生态系统带来前沿模型 [3] - 企业客户可通过Elastic云上的Elastic推理服务原生运行嵌入和重排序器模型 [4] - 公司将继续遵循Jina AI的实践,在Hugging Face上发布模型并发表学术研究 [4] - 收购扩大了公司的AI研究团队,以加速模型创新 [3] 管理层观点 - Elastic首席执行官强调搜索是生成式AI的基础,此次收购使平台在上下文工程方面更强大 [3] - Jina AI前首席执行官表示加入Elastic使其使命得以在全球范围内扩展,将先进模型直接带入实际应用 [4]