首页 / PHP / php – 收集大型访问统计信息的方法
php – 收集大型访问统计信息的方法
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了php – 收集大型访问统计信息的方法,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1327字,纯文字阅读大概需要2分钟。
内容图文
![php – 收集大型访问统计信息的方法](/upload/InfoBanner/zyjiaocheng/742/6c2c039f902d41728b08b68e576e4325.jpg)
我有网站,用户可以发布他们的文章,我想提供有关每篇文章访问和推荐人的完整统计数据.这里的实现看起来很简单,只需为每次访问存储数据库记录,然后使用聚合函数绘制图形等等.
问题是,文章在24小时内收到大约30万次观看,而在一个月内,统计表将获得大约900万条记录,这是一个非常大的数字,因为我的服务器功能不是很强大.
这种任务有解决方案吗?是否存在允许存储长期统计数据而不会丢失准确性的算法或缓存机制?
附:这是我原来的统计表:
visitid INT
articleid INT
ip INT
datetime DATETIME
解决方法:
假设有一个自制的使用跟踪解决方案(与其他响应中建议的GA相反),您可能正在寻找两个数据库设置:
>一个“实时”数据库,可以捕获vist事件.
>“离线”数据库,其中定期收集来自“实时”数据库的数据,以便[可选地]聚合和索引.
此设置的目的主要是由操作问题驱动.对于快速插入,“实时”数据库没有编入索引(或最低限度编入索引),并且当流量较轻时,通常每晚都会定期清空,因为“离线”数据库会收集当天收集的事件.
两个数据库可以具有完全相同的模式,或者“离线”数据库可以引入各种形式的聚合.应用于脱机数据库的特定聚合详细信息可能会有很大差异,具体取决于保持数据库大小的检查和依赖于被认为重要的数据(大多数统计/聚合函数引入一些信息丢失,并且需要确定哪些丢失是可以接受的,但不是.
由于使用日志值的“半衰期”特性,即细节的相对价值随时间衰减,一个共同的策略是在多个层中聚合信息,从而在最后一天(例如X天)收集的数据大部分仍然存在未触及的,在X和Y天之间收集的数据被部分聚合,最后,比Y天更早的数据仅保留最显着的信息(例如,命中数).
内容总结
以上是互联网集市为您收集整理的php – 收集大型访问统计信息的方法全部内容,希望文章能够帮你解决php – 收集大型访问统计信息的方法所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。