首页 / ELEASTATICSEARCH / elasticsearch

elasticsearch

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了elasticsearch，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含8970字，纯文字阅读大概需要13分钟。

内容图文

一、elasticsearch基本介绍

1. ES中各字段概念

index：索引库，类似于MySQL中的数据库
type：类型，在索引库下创建类型，类似于MySQL中数据库表
document：文档，es中一条数据就是一个document
filed：字段，一条document有多个字段组成
mapping：映射关系，映射filed字段的类型，字段分词，索引，存储特性
settings：设置，设置es索引库中数据的分片数及副本数
cluster：集群，es每个节点叫node，所有node组织起来为集群
node:一个节点即为node，相当于一个子服务器

2. ES中分词，分页，分片的概念

分词

即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作。
若我们定义一个字段name类型为text，则表明该字段在被搜索时会将值进行分词，如name：“张韶涵”
则进行分词后结果有“张”、“韶”、“涵”、“张韶”、“韶涵”，则当我搜索分词时也能将该条数据搜索出来。
如不想将词语“张韶涵”分开，则可使用分词器插件，指定分词。
安装elasticsearch-analysis-ik（ik中文分词器插件）
在ik-config中配置文件IKAnalyzer.cfg.xml中指定分词或指定分词文档目录，在分词文档中加入分词
elasticsearch - 文章图片

分页

分页分为浅分页和深分页
from-size"浅"分页：如要获取第5页数据，则需要将前5页数据全部查出再过滤掉前4页数据
弊端：当数据较多时执行效率低
elasticsearch - 文章图片
scroll“深”分页：使用scroll可以模拟一个传统数据的游标，记录当前读取的文档信息位置，这个分页的用法，不是为了实时查询数据，而是为了一次性查询大量的数据，查询结果生成一个快照。快照生成后，如指定scroll=1m，则缓存1分钟，当超过1分钟后释放内存。
elasticsearch - 文章图片
返回信息中包含scroll_id，下次查询则通过scroll_id取值

分片

每个索引都由多个分片组成，分片又分为主分片和副分片，副分片即为主分片的副本
elasticsearch - 文章图片
客户端创建一个索引过程：

客户端选择一个node发送请求过去，这个node就是coordinating node（协调节点）
coordinating node对document进行路由，将请求转发给对应的node（有primary shard）
实际的node上的primary shard处理请求，然后将数据同步到replica node
coordinating node，如果发现primary node和所有replica node都搞定之后，就返回响应结果给客户端
客户端读取一个索引过程：
1.客户端发送请求到一个coordinate node
2.协调节点将搜索请求转发到所有的shard对应的primary shard或replica shard也可以
3.query phase：每个shard将自己的搜索结果（其实就是一些doc id），返回给协调节点，由协调节点进行数据的合并、排序、分页等操作，产出最终结果
4.fetch phase：接着由协调节点，根据doc id去各个节点上拉取实际的document数据，最终返回给客户端
客户端搜索一个索引过程：
1.客户端发送请求到任意一个node，成为coordinate node
2.coordinate node对document进行路由，将请求转发到对应的node，此时会使用round-robin随机轮询算法，在primary shard以及其所有replica中随机选择一个，让读请求负载均衡
3.接收请求的node返回document给coordinate node
4.coordinate node返回document给客户端

二、mapping定义字段类型

字段类型

mapping类似于数据库中的表结构定义，es 7.11为例有以下类型。
字符型：
text：默认会进行分词，支持模糊查询（5.x之后版本string类型已废弃）
keyword：不进行分词；keyword类型默认开启doc_values来加速聚合排序操作，占用了大量磁盘io 如非必须可以禁用doc_values
日期类型：
date：支持毫秒、根据指定的format解析对应的日期格式，内部以long类型存储。
数字类型：
long：-2^63 到 2^63
integer：-2^31 到 -2^31
short：?32768 到 32767
byte：?128 到 127
double：IEEE 754标准双精度浮点类型，8字节
float：IEEE 754标准单精度浮点类型，4字节
half_float：IEEE 754标准半精度浮点类型，2字节
scaled_float：缩放类型浮点类型
布尔类型：
boolean：默认store属性为false，并且不可以被搜索
范围类型：
integer_range:可以表示最大的范围为 [-2^31,231]
float_range:可以表达IEEE754单精度浮点数范围
long_range:可以表示最大的范围为 [-2^63,263]
double_range:可以表达IEEE754双精度浮点数范围
date_range:可以表达64位时间戳（单位毫秒）范围
经纬度类型：
geo_point：存储经纬度数据对
IP类型：
ip：将ip数据存储在这种数据类型中，方便后期对ip字段的模糊与范围查询
数组类型：
array：es不需要显示定义数组类型，只需要在插入数据时用’[]‘表示即可，’[]'中的元素类型需保持一致
嵌套类型：
nested：一种特殊的object类型，存储object数组，可检索内部子项
object：嵌套类型，不支持数组

实际操作

#创建索引
PUT /test_user
#定义索引映射
POST /test_user/test_game/_mapping?include_type_name=true
{
“test_game”:{
“properties”: {
“name”: {“type”: “keyword”},
“game_name”: {“type”: “text”},
“amount”: {“type”: “float”}
}
}
}
#查看索引映射关系
GET test_user/_mapping
#向索引中加字段
PUT /test_user/user/_mapping?include_type_name=true
{
“test_type”:{
“properties”:{
“creat_time”:{“type”:“date”}
}
}
}
遇到的问题：
es 7.11中创建索引及类型时，由于默认mapping不指定type，需加上参数include_type_name=true

三、es语法

增删改

#创建一个叫blog01的索引(1为系统id，pretty表示将数据进行格式化，展示更好看)
put /blog01/1?pretty
#插入文档及数据(1表示在article这个类型中插入ID=1的数据?pretty表示以固定格式传数据)
put /blog01/article/1?pretty {"id":"1","title":"What is lucene"}
#更新ID=1的文档
put /blog01/article/1?pretty {"id":"2","title":"What is es"}
#查询ID=1的文档
get /blog01/article/1?pretty
#搜索(搜索title为es的数据)
get /blog01/article/_search?q=title:es
（返回信息中，took为返回时间，单位毫秒）
#根据ID删除文档
delete /blog01/article/2
#使用bulk批量添加数据（在school索引库创建student索引，并新增以下数据）
POST /school/student/_bulk
{ "index": { "_id": 1 }}
{ "name" : "liubei", "age" : 20 , "sex": "boy", "birth": "1996-01-02" ,"about": "i like diaocan he girl" }
{ "index": { "_id": 2 }}
{ "name" : "guanyu", "age" : 21 , "sex": "boy", "birth": "1995-01-02" ,"about": "i like diaocan" }
{ "index": { "_id": 3 }}
{ "name" : "zhangfei", "age" : 18 , "sex": "boy", "birth":"1998-01-02" , "about": "i like travel" }
{ "index": { "_id": 4 }}
{ "name" : "diaocan", "age" : 20 , "sex": "girl", "birth":"1996-01-02" , "about": "i like travel and sport" }
{ "index": { "_id": 5 }}
{ "name" : "panjinlian", "age" : 25 , "sex": "girl", "birth":"1991-01-02" , "about": "i like travel and wusong" }
{ "index": { "_id": 6 }}
{ "name" : "caocao", "age" : 30 , "sex": "boy", "birth": "1988-01-02" ,"about": "i like xiaoqiao" }
{ "index": { "_id": 7 }}
{ "name" : "zhaoyun", "age" : 31 , "sex": "boy", "birth":"1997-01-02" , "about": "i like travel and music" }
{ "index": { "_id": 8 }}
{ "name" : "xiaoqiao", "age" : 18 , "sex": "girl", "birth":"1998-01-02" , "about": "i like caocao" }
{ "index": { "_id": 9 }}
{ "name" : "daqiao", "age" : 20 , "sex": "girl", "birth":"1996-01-02" , "about": "i like travel and history" }

查

#查询单条件match
get /school/student/_search?pretty
{
    "query":{
	    "match":{
		    "about":"travel"
		}
	}
}
#查询多条件bool（查询喜欢旅游的女孩）
GET /school/student/_search?pretty
{
  "query":{
    "bool": {
      "must": 
        {
          "match": {"about": "travel"}
          
        },
      "must_not": 
        {
          "match":{"sex":"boy"}
          
        }
    }
  }
}
#查询某个字段中包含两个关键字，关键字为或的关系（使用bool和must）
GET /school/student/_search?pretty
{
  "query":{
    "bool": {
      "must": {"terms":{"about":["travel","history"]}
        }
    }
  }
}
#查询一个范围，range(gt:大于,lte:小于等于)
GET /school/student/_search?pretty
{
  "query":{
    "range": {
      "age": {
        "gt": 20,
        "lte": 25
      }
    }
  }
}
#查询喜欢旅游并且年龄大于20小于30的同学
GET /school/student/_search?pretty
{
  "query":{
    "bool": {
      "must":[
        {"term":{"about":"travel"}},
        {"range": {
          "age": {
            "gt": 20,
            "lt": 30
          }
        }
    }]
  }
}
}
#查询带中文的字段(若该字段类型为text)
#es查询时，查询条件为中文时返回一直为空（原因：当中文类型为text，默认进行分词），若查询中文则需将每个中文使用多个term连接查询
POST /test_index/test_type/_search?pretty
{
  "query":{
    "bool": {
      "must":[
        {"term":{"game_name":"斗"}},
        {"term":{"game_name":"地"}},
        {"term":{"game_name":"主"}}
      ]
    }
  }
}

DSL结构化查询
term:精确过滤，match：模糊匹配，满足包含即可,range：查询一个范围(gte:>=,ite:<=)
bool联合查询：联合查询会使用到must,should,must_not（must：相当于and，should：相当于or）
返回值说明
Hits：一个hits数组包含前10个文档
took：执行整个搜索耗时多少毫秒
shard：在查询中参与分片的总数，以及分片成功和失败的个数
timeout：查询是否超时指定10毫秒（get /_search?timeout=10ms）

更改mapping字段类型

#创建新索引
PUT /test_oder
#定义新索引映射
POST /test_oder/test_game/_mapping?include_type_name=true
{
  "test_game":{
    "properties": {
        "name": {"type": "keyword"},
        "api_type": {"type": "keyword"},
        "game_type": {"type": "keyword"},
        "game_name": {"type": "text"},
        "net_amount": {"type": "float"}
        "valid_bet_amount": {"type": "float"},
        "bet_detail": {"type": "text"},
        "status": {"type": "text"}
        "game_time": {"type": "date"}
        "game_no": {"type": "keyword"}
    }
  }
}
#将索引旧test_index数据复制到test_oder
POST _reindex
{
  "source":{
    "index":"test_index"
  },
  "dest":{
    "index":"test_oder"
  }
}
#删掉旧索引
DELETE test_index
#重命名新索引
POST _aliases
{
  "actions": [
    {
      "add": {
        "index": "test_oder",
        "alias": "test_index"
      }
    }
  ]
}

四、数据迁移

elasticdump

数据迁移共有4中方式，这里只举elasticdump为例说明
1.在安装目录下创建elasticdump文件夹并使用cmd进入该目录
2.若未安装npm则执行npm install
3.执行elasticdump安装命令npm install elasticdump -g
4.在elasticdump下执行数据迁移命令（input为新环境服务器，output为被拷贝服务器）

'#拷贝analyzer如分词
elasticdump
–input=http://production.es.com:9200/my_index
–output=http://staging.es.com:9200/my_index
–type=analyzer
'#拷贝映射
elasticdump
–input=http://production.es.com:9200/my_index
–output=http://staging.es.com:9200/my_index
–type=mapping
'#拷贝数据
elasticdump
–input=http://production.es.com:9200/my_index
–output=http://staging.es.com:9200/my_index
–type=data

内容总结

以上是互联网集市为您收集整理的elasticsearch全部内容，希望文章能够帮你解决elasticsearch所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1036219.html

来源：【匿名】

【上一篇】elasticsearch7.10.2测试【下一篇】Elasticsearchik插件如果能精准查中文？

更多 ►

【elasticsearch】教程文章相关的互联网学习教程文章

用【NEST】在C#中操作ElasticSearch【代码】【图】

准备工作： VSCode开发环境，在终端控制台（Ctrl+~）输入命令 dotnet add package Nest 安装NEST包，安装好后打开项目的.csproj文件如下图。一、索引数据： 1using Nest;2using System;3 4namespace NetCoreFirst5{6publicclass ImportES7 {8publicstaticstring ElasticsearchMethod()9 { 10//1.通过es服务器 localhost:9200 来定义es client11var node = new Uri("http://localhost:9200"); 12var indexName = "esbot";...

elasticsearch + logstash + kibana 搭建实时日志收集系统【原创】【代码】【图】

实时日志统一收集的好处： 1、快速定位集群中问题机器 2、无需下载整个日志文件（往往比较大，下载耗时多） 3、可以对日志进行统计 a、发现出现次数最多的异常，进行调优处理 b、统计爬虫ip c、统计用户行为，做聚类分析等基于上面的需求，我采用了 ELK（elasticsearch + logstash + kibana）的方案，安装方法请到他们的官网：https://www.elastic.co/ 上面查询，这里我主要讲讲我遇到的问题。...

elasticsearch,http://ip:9200访问不到的解决办法【图】

现在解压elasticsearch之后，启动，通过http://localhost:9200可以访问的到，但是http://ip:9200访问不到，怎么办呢？带你解决，带你飞修改elasticsearch-2.3.3\config\elasticsearch.yml文件重启一下，你就可以好好的玩耍了，good luck ！！！原文：http://www.cnblogs.com/dragkiss/p/5613602.html

【ElasticSearch】中文分词器-IK分词器（六）【代码】【图】

分词介绍什么是分词　　分词就是指将一个文本转化成一系列单词的过程，也叫文本分析，在Elasticsearch中称之为Analysis。　　举例:我是中国人 --> 我/是/中国人分词api　　指定分词器进行分词　　示例：1POST /_analyse 23{ 4 "analyzer": "standard", 5 "text": "hello world" 6 }　　效果如下：　　　　在结果中不仅可以看出分词的结果，还返回了该词在文本中的位置。　　指定索引分词　　示例1POST /person/_analyse 23{...

ElasticSearch-倒排索引

一、正向索引当用户在主页上搜索关键词“手机”时，假设只存在正向索引（forward index），那么就需要扫描索引库中的所有文档，找出所有包含关键词“手机”的文档，再根据打分模型进行打分，排出名次后呈现给用户。因为互联网上收录在搜索引擎中的文档的数目是个天文数字，这样的索引结构根本无法满足实时返回排名结果的要求。文档 --> 单词二、倒排索引把文档ID对应到关键词的映射转换为关键词到文档ID的映射，每个关键词都对应...

Elasticsearch7.6 环境部署【图】

一、安装 Elasticsearch只允许普通用户操作，不允许root用户注意：因为elasticsearch有远程执行脚本的功能所以容易中木马病毒，所以不允许用root用户启动，root用户是起不来的，赋权限，用一般的用户启动要配置network.host才能别的机器或者网卡访问，否则只能是127.0.0.1或者localhost访问，这里配置成自己的局域网ip注意配置yml结尾的配置文件都需要冒号后面加空格才行1、下载elasticsearch7.6版本，上传到/opt路径下。下载地址...

elasticsearch搜索类型简介【代码】

简单搜索GET请求非常简单——你能轻松获取你想要的文档。让我们来进一步尝试一些东西，比如简单的搜索！我们尝试一个最简单的搜索全部员工的请求：GET /megacorp/employee/_search接下来，让我们搜索姓氏中包含“jake”的员工。要做到这一点，我们将在命令行中使用轻量级的搜索方法。这种方法常被称作查询字符串(query string)搜索，因为我们像传递URL参数一样去传递查询语句：GET /megacorp/employee/_search?q=last_name:jake 我...

Elasticsearch的javaAPI之get,delete,bulk【代码】

Elsasticsearch的javaAPI之getget API同意依据其id获得指定index中的基于json document。以下的样例得到一个JSON document（index为twitter,type为tweet,id为价值1） GetResponse response = client.prepareGet("twitter","tweet","1") .execute() .actionGet();在get操作的很多其它信息,能够查看REST get docs 线程操作Get API同意你设置线程来运行操作。这样实际将运行API上运行的是同样的节点(API上运行一个分配在...

ElasticSearch之动态映射和模板

1 类型确定机制mappingsnumeric_detectiondynamic :是否支持动态添加字段2 动态映射希望根据不同情形，如JSON格式中的字段名称和字段类型，来确定不同类型。3 索引模板本文出自 “实践高并发架构” 博客，请务必保留此出处http://feifan0416.blog.51cto.com/1319656/1757371原文：http://feifan0416.blog.51cto.com/1319656/1757371

elasticsearch API列表

获取当前的所有配置curl -XPUT ‘http://localhost:9200/_all/_settings‘{"debitlist":{"settings":{"index":{"creation_date":"1485160809262","number_of_shards":"1","number_of_replicas":"0","version":{"created":"1060299"},"uuid":"f5_trQOERqWoHTDqdbMTxw"}}}会返回所有的索引，创建日期、主分片数量、从分片数量等信息获取文档数量curl -XPUT ‘http://localhost:9200/_count?pretty‘_count?pretty 可以简写为_count65...

Elasticsearch安装说明【代码】

ElasticSearch是一个基于Lucene构建的开源，分布式，RESTful搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便1、下载jdk-7u71-linux-x64.gz2、 Tar zxvf jdk-7u71-linux-x64.gz3、 mv jdk1.7.0_71/ /home/work/local/java/4、 vim /etc/profileexport JAVA_HOME=/home/work/local/javaexportJRE_HOME=/home/work/local/java/jreexportCLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATHexpo...

ElasticSearch 索引、文档的使用【代码】

ES中的几个概念索引 index相当于关系数据库中的数据库类型 type相当于关系数据库中的表ES 5.x中?个index可以新建多个typeES 6.x中?个index中只能新建?个typeES 7.x中只能使用内置的_doc，不能自己新建type 映射 mapping定义每个字段的类型等信息，相当于关系数据库中的表结构字段 field相当于关系数据库表的字段 ?档 document相当于关系数据库中的?条记录分? shard集群之后，每个节点存储index的一部分，这一部分叫做一个分片。...

ELK---- Elasticsearch 使用ik中文分词器【代码】【图】

0、默认分词器。默认分词器，查询的时候会把中文一个汉字当作一个关键字拆分，这样是不符合我们的需求的，所以需要安装分词器。1、下载分词器。当前有多种分词器可下载，据说比较好用的是IK分词器。注意，下载分词器的时候，版本必须要与Elasticsearch安装的版本一致，否则会出现不可描述的错误。下载地址: https://github.com/medcl/elasticsearch-analysis-ik/releases注意: es-ik分词插件版本一定要和es安装的版本对应之前自带的...

Elasticsearch 7 : 文档 _id 的长度限制【代码】【图】

PUT student {"mappings" : {"properties" : {"name" : {"type" : "keyword"}}},"settings" : {"index" : {"number_of_shards" : 1}} }插入简单数据测试POST student/_doc/1 {"name": "1111" }成功插入。POST student/_doc/0123456789 {"name": "2222" }成功插入。插入 _id 长度为 230 字节的数据POST student/_doc/0123456789_0123456789_0123456789_0123456789_0123456789_0123456789_0123456789_0123456789_0123456789_01234567...

ElasticSearch 搜索【代码】

ES有2种搜索方式term系列match系列 term系列搜索termPOST 192.168.1.9:9200/mall/_search { "query":{"term":{"goods_name":"苹果"}} }匹配机制是equals，指定字段的值要相等才算匹配，返回所有匹配的document。如果是float这种数值型，10.0、10是equals的，也算匹配的。 termsPOST 192.168.1.9:9200/mall/_search { "query":{"terms":{"goods_name":["桃子","梨子"]}} }数组，只要该字段的值是数组中的任意一个元素，就认为该文...

首页 / ELEASTATICSEARCH / elasticsearch

elasticsearch

内容导读

内容图文

一、elasticsearch基本介绍

1. ES中各字段概念

2. ES中分词，分页，分片的概念

分词

分页

分片

二、mapping定义字段类型

字段类型

实际操作

三、es语法

增删改

查

更改mapping字段类型

四、数据迁移

elasticdump

内容总结

内容备注

内容手机端

【elasticsearch】教程文章相关的互联网学习教程文章

SEARCH - 相关标签

ELEASTATICSEARCH - 最新教程

ELEASTATICSEARCH - 最热教程