tencent cloud

Elasticsearch Service

新手指引
动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
Elasticsearch 版本支持说明
产品功能
高级特性(X-Pack)
产品优势
应用场景
能力与限制说明
相关概念
购买指南
计费概述
产品定价
ES Serverless 服务定价
欠费说明
ES 内核增强
内核版本发布记录
定向路由优化
压缩算法优化
FST Off Heap 内存优化
快速入门
集群规格和容量配置评估
创建集群
访问集群
ES Serverless 服务指南
服务概述
基本概念
5分钟快速体验
快速使用
访问控制
数据写入
数据查询
索引管理
告警管理
ES API 参考
相关问题
数据应用指南
数据应用概述
数据管理
ES 集群指南
集群管理
访问控制
集群多可用区部署
集群扩缩容
集群配置
插件配置
监控与告警
日志查询
数据备份
升级
实践教程
数据迁移和同步
应用场景构建
索引设置
SQL 支持
企业微信机器人接收 Watcher 告警
API 文档
History
Introduction
API Category
Instance APIs
Making API Requests
Data Types
Error Codes
常见问题
产品相关问题
ES 集群
词汇表
新版介绍
Elasticsearch Service 2020.07新版
Elasticsearch Service 2020.2新版
Elasticsearch Service 2019.12新版

IK 分词插件

PDF
聚焦模式
字号
最后更新时间: 2024-12-03 15:31:57
登录 腾讯云 Elasticsearch Service 控制台,选择一个集群,进入集群详情页的插件列表页面,可以看到系统默认插件中已经预装了 IK 中文分词插件。关于 IK 中文分词插件的介绍,详情可查看 IK Analysis for Elasticsearch,您可以利用该插件对存到 ES 集群数据中的中文关键词建立索引,实现搜索功能。

更新词典

单击更新词典,进入更新词典页面。有分词词典和停用词词典两项,单击本地上传,选择您需要更新的词典文件后,单击保存,即可热更新词典(不需要重启集群)。




关于词典文件的要求及说明

词典类型:有两类词,“分词词典”和“停用词词典”。“分词词典”中的词是用户在向 ES 集群存入数据,建立索引的时候,指定 IK 作为分词工具。如果存入的数据中时有这类词,就会建立索引,并能通过关键词查询搜索到。“停用词词典”则会刻意回避不建立索引的词。
限制要求:对于词典文件,也有一些限制和要求,需要一行一个词,utf-8 编码。为了避免混淆,分词词典和停用词词典文件名不能重复。另外,因为词典文件会加载到内存中,所以对文件的大小和个数也做了一定的限制,单个文件最大为10M,上传文件总数最多为10个。
更新过程:列表会展示历史已经更新上传的词典。新上传的词典,如果不符合要求,会直接限制上传。上传完成后,词典文件会显示成“待生效”状态。所有需要更新的词典上传完成后,单击保存,会保存到用户的集群并生效。如果有上传失败的文件,或不是 utf-8 格式的文件,会提示失败,需要删除失败的文件后,才能单击保存生效。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈