首页 / LINUX / Linux系统监控神器--Collectl

Linux系统监控神器--Collectl

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Linux系统监控神器--Collectl，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含8922字，纯文字阅读大概需要13分钟。

内容图文

为使系统良好运转,Linux系统管理员经常需要监测cpu,内存,磁盘,网络等系统信息。Linux上已有iotop,top,free,htop,sar等丰富的常规工具来实现监测功能。今天让我们走进Collectl来了解这个集测试/监控/分析系统性能为一体的Linux工具。

Collectl作为一个轻量级的监控工具,在同类工具中是功能最全的。用户可监测不同的复杂系统矩阵值,并可保留数据以做之后的分析。不同于其他只用来监测特定系统参数的工具,Collectl可以同时监测不同的变量,并以合适的方式记录它们。

摘自Collectl官网 ...

不同于或聚焦于一小组统计数据、采用唯一输出方式,或采用迭代、作为守护进程运行的大部分监测工具,collectl可以同时全部实现。用户可选择各种子系统中的任一系统来监测包括内存,CPU,磁盘,索引节点,无线带宽,lustre,内存,网络,网络文件系统,进程,二次型,slabs,套接口及TCP等信息。

深入学习前让我们先看以下命令。

$ collectl
waiting for 1 second sample ...
#<--------CPU--------><----------Disks-----------><----------Network---------->
#cpu sys inter ctxsw KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut
0 0 864 1772 0 0 0 0 0 1 0 0
5 2 1338 2734 0 0 8 2 0 0 0 1
1 0 1222 2647 0 0 92 3 0 2 0 1
1 0 763 1722 0 0 80 3 0 1 0 2

CPU使用率,磁盘输入输出和网络活动以每秒为单位来加载。对可以理解这些数据的人来说这些信息很容易读懂。这项列表在给定的时间间隔里会持续增加，并可直接形成一项文件跟踪日志。collectl工具提供了各种命令来对这些数据进行记录,查找及做其他处理。

安装collectl工具

对Ubuntu/Debian用户来说Collectl是默认资源,所以使用apt命令便可获取。

$ sudo apt - get install collectl

Fedora/CentOS用户使用yum命令便可获取。

$ yum install collectl

使用

必要的了解 - Collectl子系统

子系统是可检测到的不同系统资源类型。像CPU,内存,带宽等等都可构成一个子系统。只运行collectl命令将以批处理模式输出CPU,磁盘和网络子系统信息,我们在上文已看到相关内容。

从操作说明可以看到,Collectl可以识别以下子系统。

总计子系统
b - buddy info (内存片段)
c - CPU
d - Disk
f - NFS V3 Data
i - Inode and File System
j - Interrupts
l - Lustre
m - Memory
n - Networks
s - Sockets
t - TCP
x - Interconnect
y - Slabs ( system object caches )
细节子系统
这是一系列的详细信息,大部分情况下都会由相应的总计数据衍生出来。目前“环境变量”和“进程” 2 类没有相应的总计数据。如果有 3 个磁盘,选择- sd ,将只会看到 3 个磁盘组合出的单一信息。如果选择- sD ,将会分别显示各磁盘信息。
C - CPU
D - Disk
E - Environmental data ( fan , power , temp ), via ipmitool
F - NFS Data
J - Interrupts
L - Lustre OST detail OR client Filesystem detail
M - Memory node data , which is also known as numa data
N - Networks
T - 65 TCP counters only available in plot format
X - Interconnect
Y - Slabs ( system object caches )
Z - Processes

使用“-s”来监测特定的子系统并向其添加子系统的识别项。现在让我们举几个例子。

1. 监测cpu使用率

用“-sc”实现CPU总使用率的监测

$ collectl - sc
waiting for 1 second sample ...
#<--------CPU-------->
#cpu sys inter ctxsw
3 0 1800 3729
3 0 1767 3599

使用“-C”观察各个单独的CPU使用情况。结果将会输出多行,分别对应一个CPU。

$ collectl - sC
waiting for 1 second sample ...
# SINGLE CPU STATISTICS
# Cpu User Nice Sys Wait IRQ Soft Steal Idle
0 3 0 0 0 0 0 0 96
1 3 0 0 0 0 0 0 96
2 2 0 0 0 0 0 0 97
3 1 0 0 0 0 0 0 98
0 2 0 0 0 0 0 0 97
1 2 0 2 0 0 0 0 95
2 1 0 0 0 0 0 0 98
3 4 0 1 0 0 0 0 95

如果需要,可以同时使用C和c来获取单项CPU监测数据和汇总数据。

2. 内存监测

使用m子系统查看内存。

$ collectl - sm
waiting for 1 second sample ...
#<-----------Memory----------->
#Free Buff Cach Inac Slab Map
2G 220M 1G 1G 210M 3G
2G 220M 1G 1G 210M 3G
2G 220M 1G 1G 210M 3G

不难解释。 M用来查看更多内存的详细信息。

$ collectl - sM
waiting for 1 second sample ...
# MEMORY STATISTICS
# Node Total Used Free Slab Mapped Anon Locked Inact Hit%
0 7975M 5939M 2036M 215720K 372184K 0 6652K 1434M 0
0 7975M 5939M 2036M 215720K 372072K 0 6652K 1433M 0

这类似于免费报告吗？

3. 查看磁盘使用情况

d和D可以查看磁盘使用的概况和详细情况。

$ collectl - sd
waiting for 1 second sample ...
#<----------Disks----------->
#KBRead Reads KBWrit Writes
4 1 136 24
0 0 80 13
$ collectl - sD
waiting for 1 second sample ...
# DISK STATISTICS (/sec)
# <---------reads---------><---------writes---------><--------averages--------> Pct
#Name KBytes Merged IOs Size KBytes Merged IOs Size RWSize QLen Wait SvcTim Util
sda 0 0 0 0 0 0 0 0 0 0 0 0 0
sda 0 0 0 0 0 0 0 0 0 0 0 0 0
sda 1 0 2 1 17 1 5 3 2 2 6 2 1
sda 0 0 0 0 92 11 5 18 18 1 12 12 5

“--verbose”命令可以用来查看附加信息。和D命令不同,它将概况扩展,包含了更多信息。

$ collectl - sd -- verbose

4. 同时报告多系统情况

如果想要同时得到CPU,内存和磁盘报告,那么同时使用子命令组合来实现。

$ collectl - scmd
waiting for 1 second sample ...
#<--------CPU--------><-----------Memory-----------><----------Disks----------->
#cpu sys inter ctxsw Free Buff Cach Inac Slab Map KBRead Reads KBWrit Writes
4 0 2187 4334 1G 221M 1G 1G 210M 3G 0 0 0 0
3 0 1896 4065 1G 221M 1G 1G 210M 3G 0 0 20 5

5. 显示统计时间

若要将每行的监测信息和时间一同显示,使用T选项。通过在“-o”参数来指定。

$ collectl - scmd - oT
waiting for 1 second sample ...
# <--------CPU--------><-----------Memory-----------><----------Disks----------->
#Time cpu sys inter ctxsw Free Buff Cach Inac Slab Map KBRead Reads KBWrit Writes
12 : 03 : 05 3 0 1961 4013 1G 225M 1G 1G 212M 3G 0 0 0 0
12 : 03 : 06 3 0 1884 3810 1G 225M 1G 1G 212M 3G 0 0 0 0
12 : 03 : 07 3 0 2011 4060 1G 225M 1G 1G 212M 3G 0 0 0 0

使用“-oTm”可将时间换成毫秒显示。

6. 改变样本计数

collectl报告的每行都是一份快照或样本,它通常设定定期间隔如1秒来取样。i可用来设置时间间隔,c用来设置样本计数。

$ collectl -c1 -sm
waiting for1 second sample...
#<-----------Memory----------->
#Free Buff Cach Inac Slab Map
1G261M1G1G228M3G

使用i命令可改变更新时间间隔。

$ collectl -sm -i2
waiting for2 second sample...
#<-----------Memory----------->
#Free Buff Cach Inac Slab Map
1G261M1G1G229M3G

上面的命令设定每2秒收集一次内存信息。

7. 像iotop一样使用collectl

top命令将collectl像iostat/top工具一样进行智能统计。列表会持续更新,且可以使用不同字段实现排序。

$ collectl --top iokb

输出如下

# TOP PROCESSES sorted by iokb (counters are /sec) 09:44:57
# PID User PR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKB MajF MinF Command
3104 enlighte 2026833 S 938M33M00.000.00000:09.160400/usr/bin/ktorrent
1 root 2000 S 26M3M20.000.00000:01.300000/sbin/init
2 root 2000 S 0030.000.00000:00.000000 kthreadd
3 root 2020 S 0000.000.00000:00.020000 ksoftirqd/0
4 root 2020 S 0000.000.00000:00.000000 kworker/0:0
5 root 020 S 0000.000.00000:00.000000 kworker/0:0H
7 root RT 20 S 0000.000.00000:00.080000 migration/0
8 root 2020 S 0020.000.00000:00.000000 rcu_bh
9 root 2020 S 0000.000.00000:00.000000 rcuob/0

上面的输出很像top命令,并且它以磁盘数量降序排列进程。

若只想显示上面的5项进程,可用以下命令实现

$ collectl --top iokb,5

若想学习上面的列表里哪些字段可以排序,使用如下命令

$ collectl --showtopopts
下面是应用于进程或数据的最高排序类型列表。某些情况下你可能会使用某一字段进行排序,但它并非显示的一部分。
TOP PROCESS SORT FIELDS
进程排序字段
Memory
vsz virtual memory
rss resident (physical) memory
Time
syst system time
usrt user time
time total time
accum accumulated time
I/O
rkb KB read
wkb KB written
iokb total I/O KB
rkbc KB read from pagecache
wkbc KB written to pagecache
iokbc total pagecacge I/O
ioall total I/O KB (iokb+iokbc)
rsys read system calls
wsys write system calls
iosys total system calls
iocncl Cancelled write bytes
PageFaults
majf major page faults
minf minor page faults
flt total page faults
ContextSwitches
vctx volunary context switches
nctx non-voluntary context switches
Miscellaneous(best when used with--procfilt)
cpu cpu number
pid process pid
thread total process threads (not counting main)
TOP SLAB SORT FIELDS
numobj total number of slab objects
actobj active slab objects
objsize sizes of slab objects
numslab number of slabs
objslab number of objects in a slab
totsize total memory sizes taken by slabs
totchg change in memory sizes
totpct percent change in memory sizes
name slab names

8. 像top一样使用collectl

为使collectl像top,我们只需以CPU使用率排序输出进程。

$ collectl --top

输出如下

# TOP PROCESSES sorted by time (counters are /sec) 14:08:46
# PID User PR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKB MajF MinF Command
9471 enlighte 2091020 R 63M22M30.030.101300:00.810003/usr/bin/perl
3076 enlighte 2026832 S 521M40M20.000.03300:55.140002/usr/bin/yakuake
3877 enlighte 20335641 S 1G218M10.000.03310:10.500000/opt/google/chrome/chrome
4625 enlighte 20289536 S 1G241M20.000.02208:24.3900012/usr/lib/firefox/firefox
5638 enlighte 2033563 S 1G265M10.000.02209:55.040002/opt/google/chrome/chrome
1186 root 2011524 S 502M76M00.000.01103:02.960000/usr/bin/X
1334 www-data 2013290 S 87M1M20.000.01100:00.850000 nginx:

上面的命令也可用于显示子系统信息。

$ collectl --top -scm

9. 像ps一样列出进程

为像ps命令一样列出所有进程且没有后续更新,用“c”命令让其计数至1. $ collectl -c1 -sZ -i:1

上面的命令将会列出类似“ps -e”命令的所有进程。“procfilt”用于从所有进程中过滤出特定的进程信息。“procopts”用于指定另一组微调进程列表显示的命令。

10. 像vmstat一样使用collectl

Collectl有内置命令来完成像vmstat一样的功能。

$ collectl --vmstat
waiting for1 second sample...
#procs ---------------memory (KB)--------------- --swaps-- -----io---- --system-- ----cpu-----
# r b swpd free buff cache inact active si so bi bo in cs us sy id wa
1001733M242M1922M1137M710M0001081982391820951
1001733M242M1922M1137M710M00001906388610980
1001733M242M1922M1137M710M00001739348030960

11. 子系统的详细信息

下面的命令以一秒为间隔，统计5次CPU信息并和时间一起显示出详细信息（冗长）。

$ collectl -sc -c5 -i1 --verbose -oT
waiting for1 second sample...
# CPU SUMMARY (INTR, CTXSW & PROC /sec)
#Time User Nice Sys Wait IRQ Soft Steal Idle CPUs Intr Ctxsw Proc RunQ Run Avg1 Avg5 Avg15 RunT BlkT
14:22:101100000087413122691086610.780.860.7810
14:22:111500000084412832496086610.780.860.7810
14:22:121700000082413422658086600.780.860.7800
14:22:131500000084412412429086610.780.860.7810
14:22:141100000088412702488086600.800.870.7800

改变"-s"变量查看不同的子系统。

总结

本文的介绍不过是对collectl这个强大工具的一些浅见。本文本希望展示它有多灵活,其实通过以上的讨论让我们了解了包括记录及回寻捕获的数据,以多种文件格式导出数据并将数据转换为可被广泛的工具分析的格式等等功能的实现。

collectl提供的另一大功能便是像服务一样运行,对远程Linux机器或完整的服务器集群提供远程监控,其表现堪称完美。

Collectl同另一批可用于处理分析收集数据的名为Collectl实用工具 (colmux, colgui, colplot)的功能相契合。如果有机会,我们在之后的文章中会介绍它们。

为更详细的了解Collectl工具,请登录它的主页来学习更多的功能。笔者建议查看FAQs来快速了解collectl,读取collectl文档获取深层次的例子。等价命令表也可定位至更多的像sar,iostat,netstat,top等和collectl功能部分等价的常用工具。

原文：http://my.oschina.net/floristgao/blog/523425

内容总结

以上是互联网集市为您收集整理的Linux系统监控神器--Collectl全部内容，希望文章能够帮你解决Linux系统监控神器--Collectl所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1169504.html

来源：【匿名】

【上一篇】linux进程延迟【下一篇】Linux下安装GD

更多 ►

【Linux系统监控神器--Collectl】教程文章相关的互联网学习教程文章

Linux系统监控命令之iotop【代码】

iotop命令iotop命令是一个用来监视磁盘I/O使用状况的top类工具。iotop具有与top相似的UI，其中包括PID、用户、I/O、进程等相关信息。Linux下的IO统计工具如iostat，nmon等大多数是只能统计到per设备的读写情况，如果你想知道每个进程是如何使用IO的就比较麻烦，使用iotop命令可以很方便的查看。iotop使用Python语言编写而成，要求Python2.5（及以上版本）和Linux kernel2.6.20（及以上版本）。iotop提供有源代码及rpm包，可从其官方...

linux 系统监控、诊断工具之 top 详解【代码】【图】

接触 linux 的人对于 top 命令可能不会陌生（不同系统名字可能不一样，如 IBM 的 aix 中叫 topas ），它的作用主要用来监控系统实时负载率、进程的资源占用率及其它各项系统状态属性是否正常。下面我们先来看张 top 截图：（1）系统、任务统计信息：前 8 行是系统整体的统计信息。第 1 行是任务队列信息，同 uptime 命令的执行结果。其内容如下：01:06:48当前时间up 1:22系统运行时间，格式为时:分1 user当前登录用户数load averag...

查找Linux系统中的占用磁盘空间

目录的来查看空间占用情况du -sh /* 先看看根目录下面让文件夹下的文件让文件按大小排序方法一：# ls -lhSl 长格式显示，h human readable模式，大小单位为M,G等易读格式，S size按大小排序。方法二：# du -h * | sort -ndu : 计算出单个文件或者文件夹的磁盘空间占用.sort : 对文件行或者标准输出行记录排序后输出.head : 输出文件内容的前面部分.# du -a /var | sort -n -r | head -n 10也可以结合管道查看文件夹内最大的几个文件...

实验二 Linux系统简单文件操作命令【图】

实验二 Linux系统简单文件操作命令1 实验目的学习在Linux系统终端下进行命令行操作掌握常用命令行操作并能通过命令行操作解决简单问题2 实验内容首先要打开终端大家在自己的系统中找到一个自己习惯的方式打开就可以了，但是也要了解常用打开终端的方式，因为你有可能在别人的机器上进行操作。(1）查看当前目录 pwd #显示用户当前工作目录问：提示符$与#的区别？（2）在用户主目录（家目录）下面创建一个以自己学号命名的目录并查看...

Linux系统中如何查看日志信息

日志文件是用于记录Linux系统中各种运行消息的文件，不同的日志文件记载了不同类型的信息，对于诊断和解决系统中的问题很有帮助分析日志文件日志数据主要包括三种类型：内核及系统日志、用户日志、程序日志 #对于大多数的文本格式的日志文件，使用tail、more、less、cat 等命令就可查看日志内容 #对于一些二进制格式的日志文件（如用户日志文件），使用who、w、users、last、lastb等内核及系统日志的配置文件为 /etc/rsyslog...

用安卓手机juicessh连接linux系统【图】

Ubuntu默认不安装openssh服务器，所以若要使用ssh远程登录Ubuntu主机，首先需要安装ssh服务器。首先，判断Ubuntu是否安装了ssh服务：1、输入：#ps -e | grep ssh 如果服务已经启动，则可以看到“sshd”，否则表示没有安装服务，或没有开机启动2、安装ssh服务，输入命令：#sudo apt-get install openssh-server 3、启动服务:#/etc/init.d/ssh start 4、本机测试是否能够成功登录：#ssh -l 用户名本机ip 然后就是下载juicessh应用，...

树莓派linux系统连接windows7系统中的共享文件夹的正确姿势【代码】【图】

一、要想使用树莓派linux成功访问win7的共享文件夹而不报错，最重要的事情是要正确设置win7中共享文件的设置。1、需要共享文件点击右键→属性 2、共享选项卡→网络和共享中心 3、点开公用下拉菜单 4、关系密码→保存修改 5、再回到文件夹，点击右键“属性”-“共享”-“高级共享”。 6、 7 8、再回到文件夹，点击右键“属性”-“安全”选项卡。注意：仔细查看组或用户名中是否有“Everyone” 9、如果组或用户名中没有“Everyone”，...

单元测试和Linux系统【代码】

unitTest单元测试 :是用来对一个模块/一个函数/一个类来进行正确性检验的测试工作单元测试的四个核心：test case（测试用例）：一个py文件就是一个测试用例test suite（测试套件）：测试用例的集合test runner（测试运行器）：执行测试套件test fixture（测试环境数据准备和数据清理或者测试脚手架）test case（测试用例）：一条用例就是一个完整的测试流程1.步骤1）导入 unittest 模块，被测文件或者其中的类2）创建一个测试类，被...

【企业邮件服务器】基于linux系统搭建企业邮件服务器（sendmail+dovecot+foxmail）【代码】【图】

目录邮件服务简介配置邮件服务前提要求Sendmail安装配置Dovecot服务配置测试邮件收发Sendmail别名配置简介：　　邮件系统包括：服务端（SMTP）和客户端（POP3，IMAP）SMTP简单邮件传输协议（port：25）：应用层协议，由TCP提供可靠数据传输服务把邮件消息从发信人邮件服务器传送到收件人邮件服务器POP3邮局协议（port：110）：具有存储转发功能。允许客户端下载服务器上的邮件，但在客户端的操作（如移动邮件，标记已读等），不会...

在linux系统下把多个终端合并在一个窗口【图】

用正常的方式打开一个终端。2.使用组合键 ctrl+shift+t , 这时就在同一个窗口中打开了另一个终端，当然再按一次ctrl+shift+t，会再生成一个，需要多少了大家可以自行决定。效果截图如下：3.按组合键Alt+1，就会切换到第一个终端，按Alt+2，就会切换到第2个终端，Alt+n,对应的就会切换到第n个终端。原文：https://www.cnblogs.com/ittop/p/9313182.html

Django项目：CMDB(服务器硬件资产自动采集系统)--08--06CMDB测试Linux系统采集硬件数据的命令03【图】

https://www.virtualbox.org/wiki/Downloads https://mirrors.aliyun.com/centos/7/isos/x86_64/ http://www.xitongzhijia.net/soft/24315.html http://www.downxia.com/downinfo/4574.html 原文：https://www.cnblogs.com/ujq3/p/9245356.html

cobbler 自动安装linux系统【代码】【图】

1.安装个组件 yum install epel-rpm-macros.noarch -y #安装epel源yum install -y cobbler cobbler-web dhcp tftp-server pykickstart httpd rsync xinetd cobbler \ ##安装cobbler\cobbler-web \ ##提供web管理dhcp \ ##地址分配服务 tftp-server \ ##放压缩和引导文件pykickstart \ ##Python开发的kickstarthttpd \ ##提供webrsync \ ##远程同步管理xin...

10月技术指标，批量安装linux系统【图】

以下操作在centos6.8图形安装界面下进行首先关闭防火墙以及永久关闭selinux：在/etc/selinux/config文件中将SELINUX=enforcing修改成SELINUX=disabled，接着使用yum命令安装相关的服务：yum -y install syslinux dhcp httpd tftp-server system-config-kickstart接着设置一个静态的ip：重启网卡使其生效，下一步是创建一个http的安装源：mkdir /var/www/html/CentOSmount /dev/sr0 /var/www/html/CentOS接着重启http服务：servic...

Linux系统 Cetos 7 中重置root密码【代码】【图】

几个月前在自己电脑上面安装了一个Linux 的虚拟机环境，当时是为了测试某一个小功能，用完就扔那里了，长时间没有使用，发现Root密码忘记了，登陆不了，怎么办呢？（ps：如果实际情况中忘记密码的这个服务器没有在身边，那就没办法了）我的这个系统是Cetos 7 64位，内核是3.10 ；一：重启系统；　　二：出现GRUB界面之后，按【e】键；　　三：进入之后，用键盘的下键（键盘说你才下键呢，哈哈……），往下翻，找到Li...

Linux系统备份与还原【代码】

在使用Ubuntu之前，相信很多人都有过使用Windows系统的经历。如果你备份过Windows系统，那么你一定记忆犹新：首先需要找到一个备份工具(通常都是私有软件)，然后重启电脑进入备份工具提供的软件环境，在这里备份或者恢复Windows系统。Norton Ghost是备份Windows系统时经常使用的备份工具。在备份Windows系统的时候你可能想过，我能不能把整个C盘都放到一个ZIP文件里去呢。这在Windows下是不可能的，因为在Windows中有很多文件在它...

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / Linux系统监控神器--Collectl

Linux系统监控神器--Collectl

内容导读

内容图文

安装collectl工具

使用

必要的了解 - Collectl子系统

1. 监测cpu使用率

2. 内存监测

3. 查看磁盘使用情况

4. 同时报告多系统情况

5. 显示统计时间

6. 改变样本计数

7. 像iotop一样使用collectl

8. 像top一样使用collectl

9. 像ps一样列出进程

10. 像vmstat一样使用collectl

11. 子系统的详细信息

总结

内容总结

内容备注

内容手机端

【Linux系统监控神器--Collectl】教程文章相关的互联网学习教程文章

LINUX - 最新教程

LINUX - 最热教程