下面两种方式统计nginx或者apache等http服务日志,所有URI接口的调用次数并显示出现次数最多的前十的URL,哪个更准确?
方法一:统计URI包括所有参数
cat /tmp/log |awk ‘{print $7}’ | sort | uniq -c | sort -nr |head -10
方法一:统计URI忽略所有参数
cat /tmp/log |awk ‘{split($7,b,”?”);COUNT[b[1]]++;}END{for(a in COUNT) print COUNT[a], a}’|sort -k1 -nr|head -10
其实是不通的统计方式