脚本分享:根据访问日志统计网站每日PV、总带宽、IP统计、url统计等
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了脚本分享:根据访问日志统计网站每日PV、总带宽、IP统计、url统计等,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2197字,纯文字阅读大概需要4分钟。
内容图文
在平时的运维工作中,我们运维人员需要清楚自己网站每天的总访问量、总带宽、ip统计和url统计等。
虽然网站已经在服务商那里做了CDN加速,所以网站流量压力都在前方CDN层了
像每日PV,带宽,ip统计等数据也都可以在他们后台里查看到的。
------------------------------------------------------------------------------
在这里,还是分享一个很早前用到过的shell统计脚本,可以结合crontab计划任务,每天给你的邮箱发送一个统计报告~
脚本统计了:
1、总访问量
2、总带宽
3、独立访客量
4、访问IP统计
5、访问url统计
6、来源统计
7、404统计
8、搜索引擎访问统计(谷歌,百度)
9、搜索引擎来源统计(谷歌,百度)
[root@115r ~]# cat tongji.sh
#!/bin/bash
log_path=/Data/logs/nginx/www.huanqiu.com/access.log
domain="huanqiu.com"
email="wangshibo@huanqiuc.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk ‘{print $1}‘`
total_bandwidth=`awk -v total=0 ‘{total+=$10}END{print total/1024/1024}‘ ${log_path}`
total_unique=`awk ‘{ip[$1]++}END{print asort(ip)}‘ ${log_path}`
ip_pv=`awk ‘{ip[$1]++}END{for (k in ip){print ip[k],k}}‘ ${log_path} | sort -rn | head -20`
url_num=`awk ‘{url[$7]++}END{for (k in url){print url[k],k}}‘ ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain ‘$11 !~ /http:\/\/[^/]*‘"$domain"‘/{url[$11]++}END{for (k in url){print url[k],k}}‘ ${log_path} | sort -rn | head -20`
notfound=`awk ‘$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}‘ ${log_path} | sort -rn | head -20`
spider=`awk -F‘"‘ ‘$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++}END{for (k in spider){print k,spider[k]}}‘ ${log_path}`
search=`awk -F‘"‘ ‘$4 ~ /http:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /http:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}‘ ${log_path}`
echo -e "概况\n报告生成时间:${maketime}\n总访问量:${total_visit}\n总带宽:${total_bandwidth}M\n独立访客:${total_unique}\n\n访问IP统计\n${ip_pv}\n\n访问url统计\n${url_num}\n\n来源页面统计\n${referer}\n\n404统计\n${notfound}\n\n蜘蛛统计\n${spider}\n\n搜索引擎来源统计\n${search}" | mail -s "$domain $logdate log statistics" ${email}
上述脚本可适用于其他网站的统计
只需要修改上面脚本中的三个变量即可:
log_path
domain
email
把此脚本添加到计划任务,就可以每天接收到统计的数据了。
执行上面的脚本,去wangshibo@huanqiu.com邮箱里查看统计报告:
[root@115r ~]# sh tongji.sh
[root@115r ~]#
[root@115r ~]#crontab -e
#每天凌晨按时统计一次
59 11 * * * /bin/bash -x /root/tongji.sh >/dev/null 2>&1
原文:http://www.cnblogs.com/kevingrace/p/5886130.html
内容总结
以上是互联网集市为您收集整理的脚本分享:根据访问日志统计网站每日PV、总带宽、IP统计、url统计等全部内容,希望文章能够帮你解决脚本分享:根据访问日志统计网站每日PV、总带宽、IP统计、url统计等所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。