Shell简单的数据分析

使用shell来统计首页排名率,查排名的工具是用python写的,然后这个脚本只是查首页排名,如果再第一页无排名的话就会显示”首页无排名”,一来这个脚本效率非常快,二来只是想看看整体首页排名的情况如何;先看看python导出的排名数据大概的格式如下:
…………………#########……………………
关键词01 约第1页5位
关键词02 约第1页10位
关键词03 约第1页7位
关键词04 首页无排名
关键词05 约第1页6位
关键词06 约第1页8位
关键词07 首页无排名
关键词08 约第1页10位
…………………#########……………………
所以下面shell的统计代码在cygwin的环境如下:
shell首页排名统计
解析一下首先cat打开文件;这截图应该是漏了一步,要先打印出第二列;iconv -f gbk -t utf-8是解决乱码问题;awk神器就是统计,如果扫描的行等于”首页无排名”就n+=1,最后再用n除以总行数NR,就算出非首页的排名率!1减就是首页排名率,还挺高,呵呵,不过是竞争对手的,艹!

Leave a Comment