ES删除数据

本文介绍了ES删除数据的三种方式,包括通过查询获取ID再逐个删除,使用delete-by-query插件进行批量删除,以及解决该插件依赖问题的具体方法,如替换log4j-slf4j-impl的jar包版本。

es 删除数据的三种方法

1  因为高版本的es并不支持批量删除,所以第一个方法思路,首先查询es 获取主键id,然后根据id逐个删除

def scrollScanDeleteByTopic(client:TransportClient,index:String,topic:String)= {
  var searchResponse = client.prepareSearch(index).setTypes("docs")
    .setQuery(QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("topicName",topic)))
    .setSearchType(SearchType.DEFAULT)
    .addStoredField("id")
    .setSize(1000).setScroll(TimeValue.timeValueMinutes(5))
    .execute().actionGet()

  var num = searchResponse.getHits.getHits.length
  // 循环直到遍历所有数据
  //loop.breakable{
  while (num != 0) {
    println(" num " + num)
    val res = searchResponse.getHits.getHits
    res.foreach { x =>
     val response = client.prepareDelete(index, "docs", x.getId).execute().actionGet()
     // println(response)
    }
    println(s"========================= $index 删除成功 ${res.length}==${topic}  ==========")
    searchResponse = client.prepareSearchScroll(searchResponse.getScrollId)
      .setScroll(TimeValue.timeValueMinutes(5))
      .execute().actionGet()
    num = searchResponse.getHits.getHits.length
  } // }
}
2 发现逐个删除的效率有点低,在此基础上改进,查询之后采用多线程来删除
def scrollScanDeleteByTopic(client:TransportClient,index:String,topic:String)= {
  var searchResponse = client.prepareSearch(index).setTypes("docs")
    .setQuery(QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("topicName",topic)))
    .setSearchType(SearchType.DEFAULT)
    .addStoredField("id")
    .setSize(1000).setScroll(TimeValue.timeValueMinutes(5))
    .execute().actionGet()

  var num = searchResponse.getHits.getHits.length
  // 循环直到遍历所有数据
  //loop.breakable{
  while (num != 0) {
    println(" num " + num)
    val res = searchResponse.getHits.getHits.map(_.getId)
     deleteDocuments(4,res)
    
    println(s"========================= $index 删除成功 ${res.length}==${topic}  ==========")
    searchResponse = client.prepareSearchScroll(searchResponse.getScrollId)
      .setScroll(TimeValue.timeValueMinutes(5))
      .execute().actionGet()
    num = searchResponse.getHits.getHits.length
  } // }
}
def deleteDocuments(num:Int,arr:Array[String])= {
  val step = if (arr.length % num == 0) arr.length / num else arr.length + 1
  for (i <- 0 until num) {
    new Thread(new Runnable {
      override def run(): Unit = {
        val client = Es_test.getDeleteClient()
        val beginNum = i * step
        val endNum = (i + 1) * step - 1
        for (j <- 0 until arr.length if (j >= beginNum && j <= endNum)) {
          client.prepareDelete("ods_wj_scenes_detail", "docs", arr(i)).execute().actionGet()
        }
        Es_test.close(client)
      }
    })
  }


3 网上发现一个插件elete-by-query,可以实现批量删除

"org.elasticsearch.plugin" % "delete-by-query" % "2.4.1" % Test
val queryBuilder =  QueryBuilders.boolQuery()
queryBuilder.must(QueryBuilders.matchAllQuery())
val start = new Date().getTime
val response = DeleteByQueryAction.INSTANCE.newRequestBuilder(client).filter(queryBuilder).source("ods_wj_scenes_detail").get()
val deleted = response.getDeleted
val end = new Date().getTime
println(s"=================$deleted=====${end-start}==============")
结果 方法一的效率比较低 方法二效率有提升 采用4个线程删除数据,76万数据耗时182883毫秒,方法三 74万数据 耗时51410毫秒
可以说效率是逐渐提升的,方法三效率更高,其中也发现了一个问题,逐渐提高方法二的线程数,耗时并不会变少,瓶颈主要在查询上,经测量发现load 1万数据耗时2s左右,如果能提高查询效率,方法二的效率也会得到提升

还有 这个插件目前是测试版,和其他部分的兼容性并不是特别好,应用中遇到一个jar包问题,其依赖的jar包缺少一个关键的类ReflectUtil

log4j-slf4j-impl.2.8 ,解决的方法就是采用这个jar包的最新版本,我下的是2.9,完美解决这个问题






课程简介这是一门使用Java语言,SpringBoot框架,从0开发一个RESTful API应用,接近企业级的项目(我的云音乐),课程包含了基础内容,高级内容,项目封装,项目重构等知识,99%代码为手写;因为这是项目课程;所以不会深入到源码讲解某个知识点,以及原理,但会粗略的讲解下基础原理;主要是讲解如何使用系统功能,流行的第三方框架,第三方服务,完成接近企业级项目,目的是让大家,学到真正的企业级项目开发技术。适用人群刚刚毕业的学生想提高职场竞争力想学从零开发SpringBoot项目想提升SpringBoot项目开发技术想学习SpringBoot项目架构技术想学习企业级项目开发技术就是想学习SpringBoot开发能学到什么从0开发一个类似企业级项目学会能做出市面上90%通用API快速增加1到2年实际开发经验刚毕业学完后能找到满意的工作已经工作学完后最高涨薪30%课程信息全课程目前是82章,155小时,每节视频都经过精心剪辑。在线学习分辨率最高1080P课程知识点1~11章:学习方法,项目架构,编码规范,Postman使用方法,Git和Github版本控制12~16章:搭建开发环境,快速入门SpringBoot框架17~20章:快速入门MySQL数据库21~30章:MyBatis,登录注册,找回密码,发送短信,发送邮件,企业级接口配置31~41章:实现歌单,歌单标签,音乐,列表分页,视频,评论,好友功能42~48章:阿里云OSS,话题,MyBatis-plus,应用监控49~53章:Redis使用,集成Redis,SpringCache,HTTP缓存54~58章:Elasticsearch使用,集成Elasticsearch,使用ES搜索59~61章:商城,集成支付宝SDK,支付宝支付62~64章:常用哈希和加密算法,接口加密和签名65~67章:实时挤掉用户,企业级项目测试环境,企业级接口文档68~69章:SpringBoot全站HTTPS,自签证书,申请免费证书70~73章:云MySQL数据库,云Redis数据库使用,轻量级应用部署环境,域名解析74~80章:Docker使用,生产级Kubernetes集群,域名解析,集群全站HTTPS81~82章:增强和重构项目,课程总结,后续学习计划
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值