首页 / ELEASTATICSEARCH / elasticsearch

elasticsearch

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了elasticsearch，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含9615字，纯文字阅读大概需要14分钟。

内容图文

elasticsearch6版本

elasticsearch介绍

介绍以及应用场景
es是一个基于Lucene构建的开源的高扩展的分布式全文搜索引擎。它可以在很短的时间内存储、搜索和分析大量的数据。
支持简易的横向扩展，可以轻松地对服务进行扩/缩容，能够扩展至数以百计的服务器来存储以及处理PB级的数据。
采用Java语言开发，通过简单的RESTful API来实现Lucene的复杂性操作。

官网: https://www.elastic.co/cn/what-is/elasticsearch
https://www.elastic.co/cn/elasticsearch/features?
存储结构
Elasticsearch是面向文档型数据库，一条数据在这里就是一个文档，用JSON作为文档序列化的格式，比如下面这条数据：
```
{
  "name":"张三",
  "age":28,
  "phone":"13111111111",
  "address":"安徽省合肥市"
}
```
es与数据库对照
elasticsearch 数据库
索引Index 数据库Database
类型Type 表Table
文档Document 数据行Row
字段Field 数据列Column

正向索引和倒排索引

正向索引
正排表是以文档的 ID 为关键字，记录文档中每个词的位置信息，查找时扫描表中每个文档中词的信息，直到找出所有包含查询关键字的文档。

正向索引在建立索引的时候结构简单，方便维护，但是在查询时需对所有的文档进行扫描，且如果文档中对应的关键词过多，就会造成资源浪费，从而使检索时间过长，检索效率变低。
倒排索引
倒排表以字或词为关键字进行索引，表中关键词对应着出现这个词的所有文档，表中记录该文档的ID和字符在该文档中出现的位置情况。
倒排索引由于每个字或词对应的文档数量在动态变化，所以倒排表的建立和维护都较为复杂，但是在查询的时候可以一次得到查询关键词所对应的所有文档，所以效率高于正排表。

es在保存文档时，默认情况下会保存两份内容，一份是_source 中的数据，另一份则是通过分词、排序等一系列过程生成的倒排索引文件，倒排索引中保存了词项和文档之间的对应关系。
搜索时，当 es 接收到用户的搜索请求之后，就会去倒排索引中查询，通过的倒排索引中维护的倒排记录表找到关键词对应的文档集合，然后对文档进行评分、排序、高亮等处理，处理完成后返回文档。

文档映射

文档映射就是给文档中的字段指定类型、分词器等属性。

核心数据类型

类别	数据类型
核心类型	text，keyword，long， integer，short，byte，double，date，boolean等等
复杂类型	Object(单个json对象)，Nested(json对象数组)
地理类型	geo_point(纬度/经度)，geo_shape(多边形等复杂形状)
专用类型	ip，completion，token_count(令牌计算)，join(父子关系文档)，mapper_murmur3等等
......	......

文档: https://www.elastic.co/guide/en/elasticsearch/reference/6.4/mapping-types.html

字符串分为：
text：支持分词，但不能用来排序和聚合。适用于新闻内容、产品描述等等。
keyword：不支持分词，但可以被用来检索过滤、排序和聚合。适用于结构化的字段，例如标签、email、手机号码等等。

Elasticsearch中文分词

因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好，会将中文词语拆分成一个一个中文的汉子。因此引入中文分词器es-ik插件。


### 默认分词
 GET /source/_analyze
{
  "analyzer": "standard",
  "text": "床前明月光"
}
 
### 指定分词1
 GET /source/_analyze
{
  "analyzer": "ik_smart",
  "text": "床前明月光"
}

### 指定分词2
 GET /source/_analyze
{
  "analyzer": "ik_max_word",
  "text": "床前明月光"
}

Elasticsearch数据操作

基本操作

#######1、创建索引
PUT /basic

#######2、查询索引
GET /basic

#######3、添加/编辑文档  方式: /索引/文档/id    编辑同样使用该方法
PUT /basic/user/1
{
  "name":"张三",
  "age":11,
  "phone":"13111111111",
  "address":"安徽省合肥市"
}

#######4、查询文档  方式: /索引/文档/id
GET /basic/user/1

#######5、查看文档类型
GET /basic/user/_mapping

#######6、查看文档对应的分片位置
GET _cat/shards/basic?v

#######7、删除索引
DELETE /basic

#######8、查看全部索引
GET _cat/indices

#######9、添加数据自动返回ID
POST /basic/user/
{
  "name":"李四",
  "age":22,
  "phone":"15222222222",
  "address":"上海市"
}

初始数据

PUT /source
#######设置文档类型
POST /source/_mapping/book
{
  "book":{
    "properties":{
       "author":{
         "type":"keyword"
       },
       "title":{
         "type":"text",
         "analyzer":"ik_max_word",
         "search_analyzer":"ik_max_word"
       },
       "content":{
         "type":"text",
         "analyzer":"ik_max_word",
         "search_analyzer":"ik_max_word"
       },
       "time":{
         "type":"date"
       },
       "price":{
         "type":"long"
       }
    }
  }
}

PUT /source/book/1
{
  "author":"李白",
  "title":"早发白帝城",
  "content":"朝辞白帝彩云间,千里江陵一日还,两岸猿声啼不住,轻舟已过万重山",
  "time":"2015-11-11",
  "price":11
}

PUT /source/book/2
{
  "author":"崔护",
  "title":"题都城南庄",
  "content":"去年今日此门中,人面桃花相映红,人面不知何处去,桃花依旧笑春风",
  "time":"2016-12-12",
  "price":22
}

PUT /source/book/3
{
  "author":"白居易",
  "title":"大林寺桃花",
  "content":"人间四月芳菲尽,山寺桃花始盛开,长恨春归无觅处,不知转入此中来",
  "time":"2016-12-12",
  "price":33
}
PUT /source/book/4
{
  "author":"李白",
  "title":"静夜思",
  "content":"床前明月光,疑是地上霜,举头望明月,低头思故乡",
  "time":"2017-07-07",
  "price":44
}

PUT /source/book/5
{
  "author":"贺知章",
  "title":"咏柳",
  "content":"碧玉妆成一树高，万条垂下绿丝绦。不知细叶谁裁出，二月春风似剪刀",
  "time":"2018-10-10",
  "price":55
}

查询与过滤
ES中的查询请求有两种方式，一种是简易版的URL查询，另一种是基于JSON的结构化查询（DSL）
URL查询


#######1、查询所有数据
GET /source/book/_search

#######2、根据id集合查询
GET /source/book/_mget
{
  "ids":[1,2]  
}

#######3、查询价格为22的文档
GET /source/book/_search?q=price:22

#######4、查询价格在20-50的并排序
GET /source/book/_search?q=count[20 TO 50]&sort=price:desc

#######5、排序并分页查询
GET /source/book/_search?sort=price:desc&from=0&size=2

#######6、只展示name、age字段的属性值
GET /source/book/_search?&_source=title,author

DSL语言

###查询所有并排序
GET /source/book/_search
{
  "query": {
        "match_all": {}
  },
  "sort":{
    "count":"desc"
  }
}
###根据内容搜索  默认词与词是 or的关系
GET /source/book/_search
{
  "query": {
    "match": {
      "content": "春风桃花"
    }
  }
}
###根据内容搜索  设置词与词是 and 的关系
GET /source/book/_search
{
  "query": {
    "match": {
      "content": {
        "query": "春风桃花",
        "operator": "and"
      }
    }
  }
}
###指定多个查询字段条件
GET /source/book/_search
{
  "query": {
    "multi_match": {
      "query": "静夜思桃花",
      "fields": ["tite","content"]
    }
  }
}
###根据日期范围查询
GET /source/book/_search
{
  "query":{
    "range":{
      "time":{
        "gte":"2016-11-11",
        "lte":"2017-11-11"
      }
    }
  }
}
###根据id查询并分页
GET /source/book/_search
{
  "_source":["author","title"],
  "query":{
    "ids":{
      "values":[1,2,3]
    }
  },
	"from": 0,
	"size": 2
}


###must: 必须全部匹配  should: 可以匹配任意   must_not必须全部不匹配
###符合条件查询 查询作者是李白的且价格不在43-45之间   
GET /source/book/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "author": {
              "value": "李白"
            }
          }
        }
      ],
      "must_not": [
        {
          "range": {
            "price": {
              "gte": 43,
              "lte": 45
            }
          }
        }
      ],
      "should": [
        {
          "match": {
            "content": "春眠不觉晓"
          }
        }
      ]
    }
  }
}

###搜索结果高亮
POST /source/book/_search
{
    "query": {
        "match": {
            "content": "桃花春风"
        }
    },
    "highlight": {
        "pre_tags": [
            "<span>"
        ],
        "post_tags": [
            "</span>"
        ],
        "fields": {
            "content": {}
        }
    }
}

###分组查询  根据author统计文档数量 获取2条
 POST /source/book/_search
{
  "aggs":{
    "group_by_author_count":{
        "terms": {
          "field": "author",
          "size": 2
        }
    }
  }
}
###查询价格的最大值
GET /source/book/_search
{
  "aggs": {
    "max_price": {
      "max": {
        "field": "price"
      }
    }
  }
}
###查询价格的信息
POST /source/book/_search
{
  "aggs":{
    "book_count_info":{
        "stats": {
          "field": "price"
        }
    }
  }
}
###统计价格在20-50之间的所有数据count的平均值
POST /source/book/_search
{
  "aggs": {
    "NAME": {
      "filter": {
        "range": {
					"price": {
						"gt": 20,
						"lte": 50
					}
				}

      },
      "aggs": {
        "avg_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }
}
 
###filter查询
GET /source/book/_search
{
	"query": {
		"bool": {
			"must": [{
				"match_all": {}
			}],
			"filter": {
				"range": {
					"price": {
						"gt": 21,
						"lte": 51
					}
				}
			}
		}
	},
	"from": 0,
	"size": 10,
	"_source": ["author", "title", "price"]
}

##match查询相当于模糊匹配,先分词在查询
##term是代表完全匹配，即不进行分词器分析，文档中必须包含整个搜索的词汇
?? https://www.elastic.co/guide/en/elasticsearch/reference/6.4/query-dsl.html? ? https://www.elastic.co/guide/cn/elasticsearch/guide/current/search-in-depth.html

springboot整合elasticsearch

文档:
https://docs.spring.io/spring-data/elasticsearch/docs/2.1.3.RELEASE/reference/html/
https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/_bucket_aggregations.html

ES集群和高可用

elasticsearch节点类型
一个 Elasticsearch 实例是一个节点，一组节点组成了集群。Elasticsearch 集群中的节点可以配置为 3 种不同的角色(不限3种)：

主节点：负责管理集群的状态并广播到其他节点，并接收其他节点的响应。通过elasticsearch.yml中的node.master: true成为主节点。
数据节点：存储索引数据，并对文档进行操作。通过elasticsearch.yml中的node.data: true成为数据节点。
客户端节点：扮演一个负载均衡的角色，将到来的请求路由到集群中的对应分片上。
...................
如果使用ES默认配置，一个节点启动后会承担上述所有的节点类型角色，建议每个节点只配置一种节点类型角色。
https://www.elastic.co/guide/en/elasticsearch/reference/6.4/modules-node.html
elasticsearch的分片机制
主分片: elasticsearch会将一个索引数据分别存放在多个分片上(默认5个)，每个分片都会部署在多个不同的节点上，该分片称为主分片 (primary shard) 。
复制分片: 每一个主分片为了实现高可用，提高系统的容错性，防止某个节点或分片出现故障导致数据丢失，所以每个主分片对应1个或多个副本(replica shards)。
```
###创建索引并指定索引的分片数量
PUT back
{
    "settings": {
        "number_of_shards": 3,
        "number_of_replicas": 1
    }
}
###查看索引信息
GET /back/_settings
```
"number_of_shards":"3" 表示: 主分片为3个
"number_of_replicas":"1" 表示: 每个主分片都会对应1个副分片
查询默认分片信息 http://121.4.227.23:9200/source/_settings
elasticsearch的路由策略
elasticsearch在写入数据时，是通过路由来确定具体写入哪一个分片中，大致路由过程如下：
```
shard = hash(routing) % number_of_primary_shards
```
routing默认时文档的_id，支持自定义。routing通过hash得到的数字，再根据number_of_primary_shards(主分片的数量) 求余，就是该文档对应的分片位置。
elasticsearch集群
https://www.elastic.co/guide/cn/elasticsearch/guide/2.x/cluster-health.html
https://www.elastic.co/guide/en/elasticsearch/reference/6.4/modules-discovery-zen.html?

elasticsearch7.x新特性

自带JDK
默认分片数量为1 ，不再是5
移除type
kibana支持暗黑模式，以及集群的协调功能
查询速度优化，使用Term查询性能提升3700%
对内存管理更加健壮，降低OOM(内存溢出)发生
时间戳支持纳秒级别
....................

内容总结

以上是互联网集市为您收集整理的elasticsearch全部内容，希望文章能够帮你解决elasticsearch所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1040379.html

来源：【匿名】

【上一篇】开始使用ElasticSearch(十一)之数据多表导出【下一篇】Elasticsearchik插件如果能精准查中文？

更多 ►

【elasticsearch】教程文章相关的互联网学习教程文章

logstash使用template提前设置好maping同步mysql数据到Elasticsearch5.5.2【代码】【图】

上篇blog说到采用logstash-input-jdbc将mysql数据同步到ES（http://www.cnblogs.com/jstarseven/p/7704893.html）,但是这里有一个问题，即假如我不需要logstash自动对mysql数据提供的mapping模板怎么办，毕竟我的数据需要ik分词，同义词解析等。。。这时候就需要用到logstash的template功能了，如果现在还不到logstash和logstash-input-jdbc的安装使用方式的建议先看上一篇文章。好的，首先看一下之前简单使用logstash-input-jdbc...

curl operate elasticsearch

export elasticsearchwebaddress=localhost:9200# 1. Add documentcurl -X PUT "$elasticsearchwebaddress/megacorp/employee/1" -d ‘{ "first_name" : "John", "last_name" : "Smith", "age" : 25, "about" : "I love to go rock climbing", "interests": [ "sports", "music" ]}‘curl -X DELETE "$elasticsearchwebaddress/megacorp/employee/1" -d ‘{ "first_name" : "John", "last_name"...

Elasticsearch Query DSL备忘（1）（Constant score query和Bool Query）【代码】

Query DSL (Domain Specific Language)，基于json的查询方式1、Constant score query，常量分值查询，目的就是返回指定的score，一般都结合filter使用，因为filter context忽略score。GET /customer/_search {"query": {"constant_score": {"filter": {"match": {"addr": "天津，北京"}},"boost": 5.2}} }result:返回结果中score都是被指定的5.2 {"took" : 8,"timed_out" : false,"_shards" : {"total" : 1,"successful" : 1,"skip...

elasticsearch 配置说明【图】

elasticsearch的config文件夹里面有两个配置文件：elasticsearch.yml和logging.yml，第一个是es的基本配置文件，第二个是日志配置文件，es也是使用log4j来记录日志的，所以logging.yml里的设置按普通log4j配置文件来设置就行了。下面主要讲解下elasticsearch.yml这个文件中可配置的东西。配置es的集群名称，默认是elasticsearch，es会自动发现在同一网段下的es，如果在同一网段下有多个集群，就可以用这个属性来区分不同的集群。...

Elasticsearch批处理操作——bulk API【代码】

Elasticsearch提供的批量处理功能，是通过使用_bulk API实现的。这个功能之所以重要，在于它提供了非常高效的机制来尽可能快的完成多个操作，与此同时使用尽可能少的网络往返。1、批量索引，即批量添加文档　　以下调用在一次bulk操作中索引了两个文档（ID 1 - John Doe and ID 2 - Jane Doe）: curl -XPOST ‘localhost:9200/customer/external/_bulk?pretty‘ -d ‘{"index":{"_id":"1"}}{"name": "John Doe" }{"index":{"_id":"...

重磅 | Elasticsearch7.X学习路线图【图】

1、为什么要梳理学习路线图？在关注Elastic 中文社区、QQ群、星球群的过程中，多多少少都会有一些基础问题冒出。而这些问题不复杂，多半都在官方文档中都有提及，稍稍复杂的在官方英文社区、中文社区都有过类似问题的讨论。基本上通过Google、bing都能直接或间接搜索到答案。那么问题是：为什么好多初学的朋友，找不到答案呢。观察和思考了很久。我认为最主要的问题在于，没有建立基础知识全貌的认知。正所谓“站的更高、才能看的...

Elasticsearch搜索【代码】

搜索概念映射（Mapping）　　　　　　　　　　　　　　　　　　数据在每个字段中国的解释说明分析（Analysis）　　　　　　　　　　　　　　　　　　全文是如何处理可以被搜索的领域的特定查询语言（Query DSL）　　　　　　　　　　Elasticsearch，强大的查询语言返回参数hits　　　　　　　　　　包含匹配到的文档的总数_score 　　　　　　　　相关性得分，衡量了文档与查询的匹配程度took　　　　　　　　　　整个请求花费了多...

elasticsearch 单机部署

elasticsearch搜索引擎简介：ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，是基于java语言编写。部署环境：JDK 1.8elasticsearch 6.2.2下载链接：wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.2.tar.gzwget https://github.com/medcl/elasticsearch-analysis-ik （需要与elasticsearch的版本相对应）单机部署：（必须在非ro...

四十六 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中【代码】【图】

前面我们讲到的elasticsearch(搜索引擎)操作，如：增、删、改、查等操作都是用的elasticsearch的语言命令，就像sql命令一样，当然elasticsearch官方也提供了一个python操作elasticsearch(搜索引擎)的接口包，就像sqlalchemy操作数据库一样的ORM框，这样我们操作elasticsearch就不用写命令了，用elasticsearch-dsl-py这个模块来操作，也就是用python的方式操作一个类即可 elasticsearch-dsl-py下载下载地址：https://github.com/ela...

CentOS6.5安装Elasticsearch5.4.1+Kibana5.4.1

CentOS6.5安装Elasticsearch5.4.1+Kibana5.4.1第一次接触ELK，坑很多，留下记录，让后人少走点坑本人环境VMware虚拟机，CentOS6.5 X86_64 1G内存下载二进制包wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.4.1.tar.gzwget https://artifacts.elastic.co/downloads/kibana/kibana-5.4.1-linux-x86_64.tar.gz安装JAVA 1.8版本（必需1.8及以上版本）wget http://javadl.oracle.com/webapps/download/Au...

docker环境下elasticsearch安装ik和拼音分词【图】

elasticsearch拼音分词地址：https://github.com/medcl/elasticsearch-analysis-pinyin/releases在elasticsearch下面Dockerfile里面进行docker-compose build:RUN ./bin/elasticsearch-plugin install https://zjoy.oss-cn-hangzhou.aliyuncs.com/docker/elasticsearch-analysis-pinyin-6.4.2.zip // echo y| 因为一直安装的时候让同意yes导致安装失败，后来自己折腾半天需要输出echo y| 才可以避免安装被中断 RUN echo y|./bin/el...

elasticsearch 通过HTTP RESTful API 操作数据【代码】【图】

1、索引样例数据　　　　下载样例数据集链接下载后解压到ES的bin目录，然后加载到elasticsearch集群　　　　curl -XPOST 127.0.0.1:9200/bank/account/_bulk?pretty --data-binary @accounts.json　　　　如果accounts.json文件和bin目录并列：curl -XPOST 127.0.0.1:9200/bank/account/_bulk?pretty --data-binary @..\accounts.json　　　　查看索引：curl localhost:9200/_cat/indices?v　　　　上面结果，说明我们成功bulk 1...

从 0 使用 SpringBoot MyBatis MySQL Redis Elasticsearch打造企业级 RESTful API 项目实战【代码】【图】

大家好！这是一门付费视频课程。新课优惠价 699 元，折合每小时 9 元左右，需要朋友的联系爱学啊客服 QQ：3469271680；我们每课程是明码标价的，因为如果售价为现在的 2 倍，然后打 5 折，其实就是没打折，我们不玩这些套路，为什么人与人之间不能多一点真诚呢？1.课程简介这是一门使用Java语言，SpringBoot框架，MyBatis数据库框架，MySQL数据库，Redis数据库，Elasticsearch搜索引擎等技术，从0开发一个RESTful API应用，接近企业...

在windows中的安装并测试elasticsearch5.0.2【代码】

一、安装elasticsearch 下载压缩包并解压到指定目录https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.0.2.zip启动elasticsearch注：默认至少2G的内存，如果电脑内存不够，编辑config/jvm.options中的-Xms2g -Xmx2g 为 -Xms1g -Xmx1g启动/bin/elasticsearch.bat打开浏览器，访问进行初始化安装http://localhost:9200/ 二、安装kibana 下载压缩包并解压简介：kibana是elasticsearch5.0.2的状态监控、平台管理...

Elasticsearch 错误小结【代码】

报错： [2019-01-15T12:36:59,779][ERROR][o.e.b.Bootstrap ] Exception java.lang.IllegalStateException: failed to obtain node locks, tried [[/mnt/elasticsearch/data/my-application]] with lock id [0]; maybe these locations are not writable or multiple nodes were started without increasing [node.max_local_storage_nodes] (was [1])?解决方法：elasticsearch.yml 配置文件最后添加 node.max_local_st...

elasticsearch	数据库
索引Index	数据库Database
类型Type	表Table
文档Document	数据行Row
字段Field	数据列Column

首页 / ELEASTATICSEARCH / elasticsearch

elasticsearch

内容导读

内容图文

elasticsearch6版本

内容总结

内容备注

内容手机端

【elasticsearch】教程文章相关的互联网学习教程文章

SEARCH - 相关标签

ELEASTATICSEARCH - 最新教程

ELEASTATICSEARCH - 最热教程