我想知道 站长之家对网站 ip PV 的一个统计 使用什么样的算法呢。

大概思路 和方向是什么,我觉得 不通过使用sdk的方式统计的数据 相对准确性 不是很高呢,是我理解的额这样么,求大神告知。

回复内容:

我想知道 站长之家对网站 ip PV 的一个统计 使用什么样的算法呢。

大概思路 和方向是什么,我觉得 不通过使用sdk的方式统计的数据 相对准确性 不是很高呢,是我理解的额这样么,求大神告知。

1)简单粗暴型的,这里不用去管浏览器的user-agent,不管cookie等信息,每产生一次PV,就直接计数,优点:简单,缺点:可能不真实,也可能有刷量数据

2)稍微细腻点的统计,会区分新老用户,楼主你可以研究下baidu统计的SDK,里面包含有用户的浏览器信息,操作系统信息、用户的地域信息等,也就是说,你通过浏览器的javascript以及和服务器数据的交互,对于后台服务器来说,是可以获取这些数据的,那么对于站长之家这样的网站,他可能想要统计到真实的用户访问情况,以便有些行为分析,这时会结合用户的IP信息、cookie信息(也就是session)和user-agent来统计分析,注意,这里的IP是映射后的IP地址,对于我们日常的家庭拨号上网,都是拿到的运营商的虚拟出来的内网地址,以便节省IPv4资源,所以说,一个user-agent、IP、cookie基本上能唯一标识一个用户信息。

3) 进一步说,有了这些数据之后,从设计角度来说,阅读量的这个信息在页面展现中不是优先级最高的(优先级最高的应该是业务内容本身),但阅读量的相关信息是有意义的,那么问题来了,对于阅读量这种信息是否在数据库的设计层面上要加写锁去互斥? 这里推荐了解下什么是CAP原理。

4) 所以解决方案,可能是缓存,也可能是有IP的判断、cookie的检测,这个要尝试之后才知道了,不过个人觉得可能性最大的是这个阅读量,汽车之家采用的是一个异步统计的办法,也就是说你产生真实的阅读之后,他是经过后台处理之后才给阅读量计数器+1的。

提供一下实现这种思路:

一个IP最多只增加两次阅读类似的机制,或者还有更深一层次逻辑判断的,比如第二天IP清空,然后这个统计算法变成了每一天每一个IP都有两次阅读次数增加的机会

一段固定时间内(比如30分钟),不管你用同一个浏览器内核访问多少次只增加一次阅读量。

校验user-agent、cookie等信息;每一次浏览插入一条访客记录到A表

微博实现:我是做微博的,我说说微博的做法。阅读量,点赞数,单访问限制。都是用redis实现的。然后每天夜里空闲时段同步数据库(按一定规则,分批等)。

如果用户已经登录,只统计一次;如果是游客,则根据IP、timestamp、cookie等综合判断,相同就只统计一次。

这样可以防止刷浏览量。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

php seo收录统计,SEO 统计算法相关推荐

  1. seo提交工具_呼伦贝尔网站建设_5118站长数据分析平台非常适合SEO站长做数据统计...

    发布时间:2020-12-07 08:12:27 标准站长需要哪些工具?我相信许多站长没有考虑过这个问题.我一直认为,找到一个数据非常大的工具非常适合我们的站长.几天前,朋友们推荐了一个新的站长工具. ...

  2. 【lizhi125】站长工具包,站长必备工具,SEO查询工具,统计工具

    >> 站长推荐工具 ChinaZ站长工具:站长之家推出的工具,国内站长最常用的网站SEO查询工具,功能全面. SEO外链工具:主要用于提高网站外链,可以批量增加外链,利用站长工具的查询功能 ...

  3. hexo教程:搜索SEO+阅读量统计+访问量统计+评论系统

    hexo教程:搜索SEO+阅读量统计+访问量统计+评论系统 更多精彩内容欢迎访问我的个人博客皮皮猪:http://www.zhsh666.xyz或者http://www.zh66.club期待您的光临 ...

  4. 【国内SEO大牛】网站统计显示被违禁词搜索进来原因

    哈喽,我是汉文博客创始人,我叫林汉文.今天我给大家分析一下网站统计显示被违禁词搜索进来原因. 今天我们的主题:网站统计显示被违禁词搜索进来原因 最近,很多网站中站长向林汉文简介反应,他们的网站统计工具 ...

  5. C++Poisso statistics泊松统计的实现算法(附完整源码)

    C++Poisso statistics泊松统计的实现算法 C++Poisso statistics泊松统计的实现算法完整源码(定义,实现,main函数测试) C++Poisso statistics ...

  6. C++计算实时输入数据的统计信息实现算法(附完整源码)

    C++计算实时输入数据的统计信息实现算法 C++计算实时输入数据的统计信息实现算法完整源码(定义,实现,main函数测试) C++计算实时输入数据的统计信息实现算法完整源码(定义,实现,main函数测 ...

  7. 数学狂想曲(三)——统计杂谈, PID算法, 20世纪10大算法, 矩阵向量的积

    http://antkillerfarm.github.io/ 统计杂谈 统计模拟 统计模拟是数理统计中非常有用的工具之一, 它是利用计算机产生某概率模型的随机数,再通过这些随机数来模拟真实模型. 这 ...

  8. seowhy论坛 seo技术 seo搜索引擎排名 seo交流学习 网站快速收录操作方法

    SEO论坛 百度站长平台社区 百度官方论坛,时不时有官方人员回答问题.而且也是目前比较所剩不多的SEO论坛了. 站长世界WebmasterWorld.com 如果你只有时间看一个英文论坛和博客,那就看 ...

  9. 基于matlab频率估计算法对比,包括统计M.Westlund算法,BTDT,CZT,ZOOM-FFT 等的

    1.软件版本 matlab2017b 2.仿真对比分析 1统计同步算法:  统计同步算法的基本思路,主要是通过多次采样测试,然后计算对应的概率分布,来确定其同步时刻.测试信号和频率点为: 最后得到的信 ...

  10. seo关键词选择-SEO关键词选择分析软件

    seo关键词选择,一个网站什么最重要?答案肯定是关键词,只有选择了正确的关键词网站才会有大量的流量,关键词选择错误后会导致努力白费.今天给大家分享2个最准确的关键词选择方法.(详细参考图片一.二.三. ...

最新文章

  1. phpmyadmin登录报错crypt_random_string requires at least one symmetric cipher be loaded 解决方法
  2. python检测网格
  3. Android 消息推送
  4. Win7 Tensorflow 安装
  5. Linux操作系统Ubuntu部署GCC篇
  6. powerdesigner15(pd)+Oracle 11g 开发小问题
  7. IO多路复用及select poll epoll讲解
  8. html ul高度自适应,如何让div中的ul元素自适应
  9. 设计模式原则之三:接口隔离原则
  10. [C++]求模与求余运算
  11. 分数阶微积分学薛定宇电子版_分数阶微积分及应用.pdf
  12. 新体育杂志新体育杂志社新体育杂志社新体育编辑部2022年第8期目录
  13. php微信公众号报修系统,微信公众号报修系统使用流程
  14. VUE实现页面局部刷新
  15. pmp中ram和raci的区别_PMP学习之路
  16. HQL 报 return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask 错误解决方案
  17. 深度思考故事2:出租司机的经济学
  18. 细心的观察,耐心的倾听
  19. 时隔一年多,我胡汉三又归来了,将持续更新的博客
  20. 6. 聚类算法之K-Means

热门文章

  1. android 实例-个人理财工具 之六,Android 个人理财工具五:显示账单明细 上
  2. 基数排序简介及其并行化
  3. 从硅谷到杭州:一个海归的阿里故事
  4. 陕师大计算机网络,陕师大计算机网络WireShark_02.docx
  5. csdn排名上升规则测试
  6. 280行代码:Javascript 写的2048游戏
  7. 使用eric6创建并运行第一个QT程序
  8. 计算机右键有时不好用,Win10鼠标右键失灵怎么办?Win10鼠标右键没反应不能用的解决方法...
  9. jQuery中的$是什么意思及 $. 和 $().的区别
  10. win10强制进入恢复模式(win10强制进入恢复模式不能修复)