Semantic Search - 财报，业绩电话会，研报，新闻

jina-embeddings-v5-text

jina-embeddings-v5-text

Elastic Delivers GPU Infrastructure to Self-Managed Elasticsearch Customers via Cloud Connect

Businesswire· 2026-02-04 01:29

产品发布与核心功能 - Elastic公司宣布通过Cloud Connect为自托管Elasticsearch部署提供Elastic推理服务[1] - 该服务使组织无需管理GPU基础设施即可按需获取云端推理能力同时将核心基础设施和数据保留在本地[1] - 用户可立即访问由Jina.ai提供的模型 Jina.ai是Elastic旗下公司在开源多语言多模态嵌入重排序和小语言模型领域处于领先地位[1] 技术细节与客户价值 - 现代语义搜索依赖向量嵌入以获得高质量结果 EIS on Cloud Connect现已随Elasticsearch 9.3版本提供[2] - 该服务允许自托管客户无缝利用基于GPU的嵌入和重排序模型包括领先的Jina模型而无需承担管理基础设施的运营负担[2] - 这使得团队能够快速高效地实施强大的语义搜索功能自托管集群可保持现有架构和数据不变同时将嵌入生成和搜索推理安全地卸载至Elastic Cloud托管的GPU集群[2] 市场定位与公司背景 - 公司高管表示该服务旨在降低自托管客户采用语义搜索的复杂性通过一次性设置客户即可访问从自动诊断到快速AI推理的一系列云服务同时数据保留在本地[3] - Elastic将自己定位为搜索AI公司将其深厚的搜索技术专长与人工智能相结合帮助用户将数据转化为答案行动和成果[4] - Elastic的搜索AI平台是其搜索可观测性和安全解决方案的基础被数千家公司使用其中包括超过50%的财富500强公司[4]

Elastic(US:ESTC)

Elastic Stack

Elastic Introduces Native Inference Service in Elastic Cloud

Elastic Stack

Businesswire· 2025-10-09 23:02

新产品发布 - 公司宣布推出Elastic Inference Service (EIS)，一项用于Elasticsearch语义搜索、向量搜索和生成式AI工作流程的GPU加速推理服务[1] - 该服务作为推理即服务提供，并原生集成于Elastic Cloud中[2] 产品功能与优势 - 服务通过基于API的方式使用NVIDIA GPU，结合公司顶级的Elasticsearch向量数据库，以提供低延迟、高吞吐量的推理[3] - 首个在EIS上提供的文本嵌入模型是Elastic Learned Sparse EncodeR (ELSER)，目前处于技术预览阶段[3] - 服务提供简化的开发者体验，无需模型下载、手动配置或资源调配，并直接与semantic_text和Inference API集成[7] - 服务兼容稀疏向量、稠密向量或语义重新排序，改善了端到端语义搜索体验[7] - 服务提供开箱即用的AI功能，用于数据摄取、调查、检测和分析，简化了生成式AI工作流程[7] - GPU加速推理提供一致的延迟，并且与基于CPU的方案相比，数据摄取吞吐量最高可提升10倍[7] 技术整合与兼容性 - 服务旨在满足市场对GPU加速和集成工作流程的需求，以提供速度、可扩展性和成本效益[2] - Open Inference API为用户提供了连接任何第三方服务的完全灵活性，同时现有的Elasticsearch ML Nodes在采用期间继续受支持[7] 定价与可用性 - 服务采用基于消费的定价模式，按每个模型每百万tokens收费[7] - Elastic Inference Service已在Serverless和Elastic Cloud Hosted部署上可用，所有云服务提供商和区域均可访问EIS上的推理端点[5] - 未来将很快提供对多语言嵌入、重新排序以及近期收购的Jina模型等额外模型的支持[3][5]

Elastic(US:ESTC)

Generative AI

Elasticsearch

Generative AI