简介
拼音分词在日常生活中其实很常见。例如打开百度搜索时输入拼音时可展示出可选的中文搜索词条:

下载打包
1.下载源码
https://github.com/medcl/elasticsearch-analysis-pinyin
如果不需要随时更新最新版本库,可以选择下载zip包
2.编译打包
使用idea打开解压后的源码工程,需要修改一项配置,就是拼音分词器的版本要与elasticsearch一直,我的版本时7.6.2,修改成自己对应的版本号

执行编译打包命令:
mvn clean package
下图中打包后会在target/releases下生成一个zip包

3.部署拼音分词器插件
上传zip包,到自己的Elasticsearch目录下的plugins,我的目录是:/usr/local/elasticsearch-7.6.2/plugins
上传完成后使用命令解压zip包
unzip -d pinyin elasticsearch-analysis-pinyin-7.6.2.zip
解压完成后会在plugins目录下面生成pinyin文件夹
如果是使用root用户操作的,则需要修改pinyin目录的用户归属,我启动elasticsearch的用户是es,所以将pinyin目录及子目录喝文件都改成es用户权限
chown -R es:es pinyin
4.重启elasticsearch使其加载拼音插件
测试拼音分词器
打开kibana,如果没有安装kibana的参考:
Elasticsearch kibana7.6.2 安装

点击左侧工具按钮,进入开发工具界面
输入拼音分词测试命令会在右侧输出结果,可以看到已经将中文按照拼音进行分词,其中”csikfcq“ 是对这个内容的首字母简写分词,至此拼音分词器以安装成功
博客介绍了Elasticsearch拼音分词器的安装与测试。先说明了拼音分词在生活中的常见场景,接着详细阐述下载源码、编译打包、部署插件及重启Elasticsearch的步骤,最后介绍通过Kibana输入测试命令,验证拼音分词器安装成功。
1899

被折叠的 条评论
为什么被折叠?



