tencent cloud

Elasticsearch Service

新手指引
动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
Elasticsearch 版本支持说明
产品功能
高级特性(X-Pack)
产品优势
应用场景
能力与限制说明
相关概念
购买指南
计费概述
产品定价
ES Serverless 服务定价
欠费说明
ES 内核增强
内核版本发布记录
定向路由优化
压缩算法优化
FST Off Heap 内存优化
快速入门
集群规格和容量配置评估
创建集群
访问集群
ES Serverless 服务指南
服务概述
基本概念
5分钟快速体验
快速使用
访问控制
数据写入
数据查询
索引管理
告警管理
ES API 参考
相关问题
数据应用指南
数据应用概述
数据管理
ES 集群指南
集群管理
访问控制
集群多可用区部署
集群扩缩容
集群配置
插件配置
监控与告警
日志查询
数据备份
升级
实践教程
数据迁移和同步
应用场景构建
索引设置
SQL 支持
企业微信机器人接收 Watcher 告警
API 文档
History
Introduction
API Category
Instance APIs
Making API Requests
Data Types
Error Codes
常见问题
产品相关问题
ES 集群
词汇表
新版介绍
Elasticsearch Service 2020.07新版
Elasticsearch Service 2020.2新版
Elasticsearch Service 2019.12新版

词汇表

PDF
聚焦模式
字号
最后更新时间: 2019-11-08 17:42:50

分片

分片(Shards)是数据的容器,文档保存在分片内,一个分片是一个底层的工作单元,它仅保存了全部数据中的一部分,分片又被分配到集群内的各个节点里,当您的集群规模扩大或者缩小时,Elasticsearch 会自动的在各节点中迁移分片,使得数据仍然均匀分布在集群里。 一个分片可以是主分片或者副本分片。索引内任意一个文档都归属于一个主分片,所以主分片的数目决定着索引能够保存的最大数据量(技术上来说,一个主分片最大能够存储 Integer.MAX_VALUE - 128 个文档)。 一个副本分片(Replicas)只是一个主分片的拷贝。副本分片作为硬件故障时保护数据不丢失的冗余备份,并为搜索和返回文档等读操作提供服务。在索引建立的时候就已经确定了主分片数,但是副本分片数可以随时修改。

集群和节点

一个运行中的 Elasticsearch 实例称为一个节点(node),同一网络内一个或者多个拥有相同集群名(cluster.name)配置并网络互通的节点组成 Elasticsearch 集群(cluster)。集群内的节点共同承担数据的存储和查询请求,当有节点加入集群中或者从集群中移除时,集群将会重新平均分布所有的数据。每个节点都知道任意文档所处的位置,无论用户将请求发送到哪个节点,都能够将请求直接转发到存储所需文档的节点,并从各个包含所需文档的节点收集回数据,将最终结果返回給客户端。

索引

常用概念

一个索引(名词)类似于传统关系数据库中的一个数据库,是存储关系型文档的地方。 索引的复数词为 indices 或 indexes。 索引(动词)一个文档就是存储一个文档到一个索引(名词)中以便它可以被检索和查询到。除了文档已存在时新文档会替换旧文档情况之外,这非常类似于 SQL 语句中的 INSERT 关键词。

倒排索引

关系型数据库通过增加一个索引,例如一个 B 树(B-tree)索引到指定的列上,来提升数据检索速度。Elasticsearch 和 Lucene 使用了一个倒排索引的结构来达到相同的目的。默认的,一个文档中的每一个属性都是被索引(有一个倒排索引)和可搜索的。一个没有倒排索引的属性是不能被搜索到的。

文档

Elasticsearch 是面向文档(document)的,它存储的是整个对象或文档,并且索引每个文档的内容使之可以被检索。Elasticsearch 使用 JSON 作为文档的序列化格式,简单、简洁、易于阅读。JSON 序列化被大多数编程语言所支持,并且已经成为 NoSQL 领域的标准格式。在 Elasticsearch 中,用户不是对行列数据进行检索,而是对文档进行索引、检索、排序和过滤,这是一种完全不同的思考数据的方式,也是 Elasticsearch 能支持复杂全文检索的原因。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈