首页 / MONGODB / mongodb-shard-分片-原理

mongodb-shard-分片-原理

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了mongodb-shard-分片-原理，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3721字，纯文字阅读大概需要6分钟。

内容图文

文章目录

0 mongo查询简图（mongos–>config servers --> shard）

实现分片集群时，MongoDB 引入 Config Server 来存储集群的元数据，引入 mongos 作为应用访问的入口，mongos 从 Config Server 读取路由信息，并将请求路由到后端对应的 Shard 上

mongodb-shard-分片-原理 - 文章图片

角色说明

A.数据分片（Shards）
- 用来保存数据，保证数据的高可用性和一致性。可以是一个单独的mongod实例，也可以是一个副本集。在生产环境下Shard一般是一个Replica Set，以防止该数据片的单点故障。所有Shard中有一个PrimaryShard，里面包含未进行划分的数据集合：
B.配置服务器（Config servers）
- 保存集群的元数据（metadata），包含各个Shard的路由规则。
  - 元数据名词解释：元数据是关于数据的组织、数据域及其关系的信息，简言之，元数据就是关于数据的数据
C.查询路由（Query Routers）
- Mongos是Sharded cluster的访问入口，其本身并不持久化数据(Sharded cluster所有的元数据都会存储到Config Server,而用户的数据则会分散存储到各个shard)
- Mongos启动后，会从config server加载元数据，开始提供服务，将用户的请求正确路由到对应的Shard Sharding集群可以有一个mongos，也可以有多mongos以减轻客户端请求的压力。

1 分片是什么？为什么要用分片？

分片就是把mongo单个表的数据，分到多个chunk上，从而横向提升mongo的读写能力
为什么分到多个chunk上就可以提升读写能力？
- 多个chunk分布在多个机器上，可以充分利用多台机器的CPU和磁盘IO
- 分到多个chunk上的时候由于分片键的存在，如果按照分片键进行查询，则直接定位到某个chunk，只需要在这一个chunk上进行查询。很明显速度就会快了很多
  - 这样的查询可以理解为MySQL的人工分表（mongo更加自动化），比如一个日志表，你用日期做分表，当你查询时，会先拼接表名，定位到某个表，这样就避免了扫所有表的数据。

2 分片分为几类？

hash 分片键
- 数据分配的原理：不停地往一个chunk中添加数据，达到上限后则开始进行分割
- 优势和劣势
  - 优势：由于hash键可以分布多个chunk，所以会极大提升写入性能
  - 劣势：不方便范围查询
range 分片键
- 数据分配的原理：对分片键的值进行hash，然后得到的值按照range进行分布到各个chunk
- 优势和劣势
  - 优势： 1,方便范围查询 2,如果分片键不是单调递增，也可以提升写入性能
  - 劣势：如果分片键是单调递增，则无法提升写入性能

3 分片键的限制和选择逻辑

分片键的限制
1. 分片键是不可变。
2. 分片键必须有索引。
3. 分片键大小限制512bytes。
4. 分片键用于路由查询。
5. MongoDB不接受已进行collection级分片的collection上插入无分片键的文档（也不支持空值插入）
分片键的选择逻辑
- 所有的分片读写都均匀。
- 数据访问均匀，而不是随机性的访问；由于新数据都是先在内存中创建，尽量避免需要从磁盘访问新数据。
- 尽量避免由于数据块的数据移动导致数据从磁盘加载到内存中从而导致热数据被清理出内存。
- 组合字段分片可能会是理想的分片方案。
分片公式（范围热度）：
- 分片键公式：{coarseLocality:1,search:1}
- coarseLocality：应该是一个大粒度的局部字段。比如MONTH月份升序字段。
- search:是一个经常用来查找的字段。

4 分片后会对查询，写入等造成什么样的影响

所有的请求都由mongos来路由、分发、合并，这些动作对客户端driver透明，用户连接mongos就像连接mongod一样使用。
Mongos会根据请求类型及shard key将请求路由到对应的Shard，因此不同的操作请求存在不同限制。

查询请求
查询请求不包含shard key，则必须将查询分发到所有的shard，然后合并查询结果返回给客户端
查询请求包含shard key，则直接根据shard key计算出需要查询的chunk，向对应的shard发送查询请求
插入请求
写操作必须包含shard key，mongos根据shard key算出文档应该存储到哪个chunk，然后将写请求发送到chunk所在的shard。
更新/删除请求
更新、删除请求的查询条件必须包含shard key或者_id，如果是包含shard key，则直接路由到指定的chunk，如果只包含_id，则需将请求发送至所有的shard。
其他命令请求
除增删改查外的其他命令请求处理方式都不尽相同，有各自的处理逻辑，比如listDatabases命令，会向每个Shard及Config Server转发listDatabases请求，然后将结果进行合并

参考链接：

https://www.cnblogs.com/littleatp/p/8562931.html
https://www.cnblogs.com/zping/p/11203545.html
https://www.cnblogs.com/clsn/p/8214345.html#auto-id-29

内容总结

以上是互联网集市为您收集整理的mongodb-shard-分片-原理全部内容，希望文章能够帮你解决mongodb-shard-分片-原理所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/858210.html

来源：【匿名】

【上一篇】MongoDB数据库/集合/文档基本操作【下一篇】在MongoDB上如何进行数据的导入与导出

更多 ►

【mongodb-shard-分片-原理】教程文章相关的互联网学习教程文章

MongoDB副本集的常用操作及原理

下面的操作主要分为两个部分：修改节点状态主要包括：将Primary节点降级为Secondary节点冻结Secondary节点强制Secondary节点进入维护模式2.?修改副本集的配置添加节点删除节点将Secondary节点设置为延迟备份节点将Secondary节点设置为隐藏节点替换当前的副本集成员设置副本集节点的优先级阻止Secondary节点升级为Primary节点如何设置没有投票权的Secondary节点禁用chainingAllowed为Secondary节点显式指定复制源禁止Secondary节点...

mongodb-shard-分片-原理【图】

文章目录 0 mongo查询简图（mongos-->config servers --> shard）1 分片是什么？为什么要用分片？2 分片分为几类？3 分片键的限制和选择逻辑4 分片后会对查询，写入等造成什么样的影响参考链接：0 mongo查询简图（mongos–>config servers --> shard）实现分片集群时，MongoDB 引入 Config Server 来存储集群的元数据，引入 mongos 作为应用访问的入口，mongos 从 Config Server 读取路由信息，并将请求路由到后端对应的 Shard ...

为什么pymongo的两种连接mongoDB的方法效率相差这么多，求原理科普

10.000314950942993MongoClient10.000757217407227Connection100.00154709815979MongoClient100.00501179695129Connection1000006.14999890327MongoClient10000027.3278138638Connection100000059.0989689827MongoClient1000000273.486183882结果分析从上表的结果可以看出，基本上MongoClient的连接方式插入数据的时间是Connection连接方式插入数据的4倍左右，当然数据量小的时候可能建立连接还有一些非相关的操作可能占的比重比较...

MongoDB 分片的原理、搭建、应用（转）【代码】【图】

一、概念：分片（sharding）是指将数据库拆分，将其分散在不同的机器上的过程。将数据分散到不同的机器上，不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块，这些块分散到若干片里，每个片只负责总数据的一部分，最后通过一个均衡器来对各个分片进行均衡（数据迁移）。通过一个名为mongos的路由进程进行操作，mongos知道数据和片的对应关系（通过配置服务器）。大部分使用场景都是...

MongoDB副本集配置系列十：MongoDB local库详解和数据同步原理【代码】

1：local库是MongoDB的系统库，记录着时间戳和索引和复制集等信息gechongrepl:PRIMARY> use local switched to db local gechongrepl:PRIMARY> show tables me oplog.rs replset.minvalid slaves startup_log system.indexes system.replset temp2：local库下的每个集合分别记录的内容local库下面的me集合保存了服务器名称 local库下面的replset.minvalid集合保存了数据库最新操作的时间戳 local库下面的startup_log集合记录这mong...

MongoDB副本集配置系列十一：MongoDB 数据同步原理和自动故障转移的原理【代码】

1：数据同步的原理：当Primary节点完成数据操作后，Secondary会做出一系列的动作保证数据的同步： 1：检查自己local库的oplog.rs集合找出最近的时间戳。 2：检查Primary节点local库oplog.rs集合，找出大于此时间戳的记录。 3：将找到的记录插入到自己的oplog.rs集合中，并执行这些操作。2：查看副本集的信息gechongrepl:PRIMARY> rs.status() {"set" : "gechongrepl","date" : ISODate("2015-07-02T02:38:15Z"),"myState" : 1,"mem...

mongodb性能问题及原理分析【代码】【图】

的文章中都提及了NUMA，让我一下子记起之前在日志中看到的警告信息，于是乎按照信息里介绍的，重新启动了一下MongoDB： shell> numactl --interleave=all /path/to/mongod一切都正常了。为了解决这个问题，浪费了很多精神，实在没有力气再解释NUMA到底是什么东西了，有想了解的网友可以参考老外的文章，里面的介绍很翔实。原文链接：huoding.com对于罪魁祸首，作者留给大家去学习，NoSQLFan在这里可以给大家做一个简单的描述，先解...

mongodb分片原理【图】

query routers, and at least 2 shards. The shards are replica sets.集群拥有以下组件: 分片, 分发路由,:term:配置服务器 <config server>.Shards store the data. To provide high availability and data consistency, in a production sharded cluster, each shard is a replica set [1]. For more information on replica sets, see Replica Sets.Query Routers, or mongos instances, interface with client applications an...

mongoDB 介绍（特点、优点、原理）

介绍：MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。特点：高性能、易部署、易使用，存储数据非常方便。主要功能特性有： ? 面向集合存储，易存储对象类型的数据 ? 模式自由 ? 支持动态查询 ? 支持完全索引，包含内部对象 ? 支持查询 ? 支持复制和故障恢复 ? 使用高效的二进制数据存储，包括大型对象（如视频等） ? 自动处理碎片，以支持云计算层次的扩展性 ? 支...

MongoDB Wiredtiger存储引擎实现原理——Copy on write的方式管理修改操作，Btree cache【代码】【图】

Mongodb-3.2已经WiredTiger设置为了默认的存储引擎，最近通过阅读wiredtiger源代码（在不了解其内部实现的情况下，读代码难度相当大，代码量太大，强烈建议官方多出些介绍文章），理清了wiredtiger的大致原理，并简单总结，不保证内容都是正确的，如有问题请指出，欢迎讨论交流。按照Mongodb默认的配置，?WiredTiger的写操作会先写入Cache，并持久化到WAL(Write ahead log)，每60s或log文件达到2GB时会做一次Checkpoint，将当前的...

mongodb安装错误以及原理

以管理员身份启动cmd安装服务：mongod --config "D:\AppData\MongoDB\Server\3.2\mongod.cfg" --install启动服务：net start MongoDB接着输入mongo命令，就会自动连接到test了配置可视化管理，我用的是Robomongo这个是有解压版的，解压（或安装）之后直接打开，新建连接即可mongodb安装错误以及原理标签：修改 lan 启动日志文件日志路径 href nat 结构本文系统来源：http://www.cnblogs.com/qqfontofweb/p/...

Mongodb Geo2d索引原理【代码】

来查询一个索引，其中spherical：true|false 表示应该如何理解创建的2d索引，false表示将索引理解为平面2d索引，true表示将索引理解为球面经纬度索引。这一点比较有意思，一个2d索引可以表达两种含义，而不同的含义是在查询时被理解的，而不是在索引创建时。 2d索引的理论 Mongodb 使用一种叫做Geohash的技术来构建2d索引，但是Mongodb的Geohash并没有使用国际通用的每一层级32个grid的Geohash描述方式（见wiki geohash)。而是使用...

MongoDB 分片的原理、搭建、应用【代码】

分片（sharding）是指将数据库拆分，将其分散在不同的机器上的过程。将数据分散到不同的机器上，不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块，这些块分散到若干片里，每个片只负责总数据的一部分，最后通过一个均衡器来对各个分片进行均衡（数据迁移）。通过一个名为mongos的路由进程进行操作，mongos知道数据和片的对应关系（通过配置服务器）。大部分使用场景都是解决磁盘空间的问...

MongoDB 分片的原理、搭建、应用【代码】【图】

因为要放到后台用用配置文件启动，需要修改配置文件： /etc/mongod_20000.conf #数据目录 dbpath=/usr/local/config/ #日志文件 logpath=/var/log/mongodb/mongodb_config.log #日志追加 logappend=true #端口 port = 20000 #最大连接数 maxConns = 50 pidfilepath = /var/run/mongo_20000.pid #日志,redo log journal = true #刷写提交机制 journalCommitInterval = 200 #守护进程模式 fork = true #刷写数据到日志的频率 syncde...

MongoDB · 引擎特性 · MongoDB索引原理

MongoDB支持多种类型的索引，包括单字段索引、复合索引、多key索引、文本索引等，每种类型的索引有不同的使用场合。单字段索引（Single Field Index） db.person.createIndex( {age: 1} ) 上述语句针对age创建了单字段索引，其能加速对age字段的各种查询请求，是最常见的索引形式，MongoDB默认创建的id索引也是这种类型。 {age: 1} 代表升序索引，也可以通过{age: -1}来指定降序索引，对于单字段索引，升序/降序效果是一样的。...

MONGODB - 技术教程分类

MongoDB 教程 MongoDB 简介 MongoDB 概念解析 MongoDB 连接 MongoDB 创建数据库 MongoDB 删除数据库 MongoDB 创建集合 MongoDB 删除集合 MongoDB 插入文档 MongoDB 更新文档 MongoDB 删除文档 MongoDB 查询文档 MongoDB 条件操作符 MongoDB $type 操作符 MongoDB Limit与Skip方法 MongoDB 排序 MongoDB 索引 MongoDB 聚合 MongoDB 复制(副本集) MongoDB 分片 MongoDB 备份与恢复 MongoDB 监控 MongoDB PHP 扩展 Node.js MongoDB MongoDB 关系 MongoDB 数据库引用 MongoDB 覆盖索引查询 MongoDB 查询分析 MongoDB 原子操作 MongoDB 高级索引 MongoDB 索引限制 MongoDB ObjectId MongoDB Map Reduce MongoDB 全文检索 MongoDB 管理工具 MongoDB GridFS MongoDB 固定集合 MongoDB 自动增长 mongodb 全部

MONGODB - 最热教程

TP5(thinkPHP5)框架mongodb扩展安装及特...MongoDB数据库设置初始化脚本【MongoDB】在windows平台下mongodb的分...MongoDB查询超时异常SocketTimeoutExce...mongodb关于启动权限的问题 mongodb chunk 大小设置 MongoDB分片集群配置 mongodb web管理工具rockmongo MongoDB中insert方法、update方法、sav...mongodb如何对子文档进行分页

首页 / MONGODB / mongodb-shard-分片-原理

mongodb-shard-分片-原理

内容导读

内容图文

文章目录

0 mongo查询简图（mongos–>config servers --> shard）

1 分片是什么？为什么要用分片？

2 分片分为几类？

3 分片键的限制和选择逻辑

4 分片后会对查询，写入等造成什么样的影响

参考链接：

内容总结

内容备注

内容手机端

【mongodb-shard-分片-原理】教程文章相关的互联网学习教程文章

MongoDB副本集的常用操作及原理

mongodb-shard-分片-原理【图】

为什么pymongo的两种连接mongoDB的方法效率相差这么多，求原理科普

MongoDB 分片的原理、搭建、应用（转）【代码】【图】

MongoDB副本集配置系列十：MongoDB local库详解和数据同步原理【代码】

MongoDB副本集配置系列十一：MongoDB 数据同步原理和自动故障转移的原理【代码】

mongodb性能问题及原理分析【代码】【图】

mongodb分片原理【图】

mongoDB 介绍（特点、优点、原理）

MongoDB Wiredtiger存储引擎实现原理——Copy on write的方式管理修改操作，Btree cache【代码】【图】

mongodb安装错误以及原理

Mongodb Geo2d索引原理【代码】

MongoDB 分片的原理、搭建、应用【代码】

MongoDB 分片的原理、搭建、应用【代码】【图】

MongoDB · 引擎特性 · MongoDB索引原理

MONGODB - 相关标签

MONGODB - 技术教程分类

MONGODB - 最新教程

MONGODB - 最热教程

首页 / MONGODB / mongodb-shard-分片-原理

mongodb-shard-分片-原理

内容导读

内容图文

文章目录

0 mongo查询简图（mongos–>config servers --> shard）

1 分片是什么？为什么要用分片？

2 分片分为几类？

3 分片键的限制 和 选择逻辑

4 分片后会对查询，写入等造成什么样的影响

参考链接：

内容总结

内容备注

内容手机端

【mongodb-shard-分片-原理】教程文章相关的互联网学习教程文章

MONGODB - 相关标签

MONGODB - 技术教程分类

MONGODB - 最新教程

MONGODB - 最热教程

3 分片键的限制和选择逻辑