百度地址栏参数分析:
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=%E9%83%91%E5%B7%9ESEO
?:搜索
百度搜索结果页使用了重定向,因此我们看到的不是search.php?这样的url格式
ie:查询输入文字的编码
此项设置会影响搜索参数的编码类型
f:搜索行为判断
8为用户自主搜索,3为下拉框搜索,1为相关搜索。该参数主要用户用户搜索行为记录以及关键词统计
rsv_bp:搜索次数
rsv_bp参数有三个值:0,1,2,其中0代表首次搜索,1代表在搜索结果页面的顶部搜索框继续搜索,2代表搜索结果页面的底部搜索框继续搜索。记录用户用顶部搜索还是用底部搜索
tn:搜索来源
该值为网站标记。例如从hao123的百度输入框搜索内容将出现tn=hao123。记录该值被用百度统计搜索来源,该来源数据可能为作为决策数据
wd:当前搜索的关键词
输入的关键词为urlencode字符串,编码格式为gbk或者utf-8,默认编码格式为utf-8,一般中文就会被编码,如果想解码网上搜索 “url_decode”然后就可以解码。它用于作为搜索原料,百度会经过分词、判类等操作,不是直接检索数据库,这个是个复杂的过过程,后续会在相关博 客中介绍,敬请关注。
bs:上一次搜索的关键词
内容格式与当前搜索的关键词一致。用于记录用户的搜索行为,记录该值被用于相关关键词统计、同义词分析等操作
rsv_spt:用户浏览器类型
值为1或者3(暂时只统计到这两个值)。用于标记用户当前使用的浏览器,IE内核浏览器为1,非IE内核为1,不过现在这个参数恒为3,还没有了解到时停用了还是改作他用
rsv_bp:判断是第几次搜索
值为0或者1。当用户第一次搜索时,该参数值为0;当用户在第一次搜索的结果页进行第二次搜索或者更多次数搜索时,该参数值为1。用于记录用户的搜索行为,记录该值被用于校验搜索结果质量以及相关搜索词相关数据分析
inputT:键入时间
从打开百度页面开始到点击搜索按钮的时长。该参数被用于记录用户搜索行为
oq:相关搜索的主词
例如搜索seo是什么,在底部的相关关键词当中有淘宝seo是什么意思,当点击后oq的值就是seo是什么。该参数主要用于相关词统计以及用户搜索行为记录。
rsp=第n+1次相关搜索
统计相关搜索的次数,例如是第4次相关搜索,那么rsp的值为3。该参数主要用于相关词统计以及用户搜索行为记录
pn:页码
值为公差为10的等差数列。用于页码判断,同时也用于校验搜索结果质量
cl:搜索类型
值为3时是网页搜索,其他的值所对应的类型暂时还没有统计到。该值会影响搜索结果排序
lm:指定时间内百度收录情况查询
值为1时是最近24小时;值为7时是最近7天;值为30时是最近1个月;值为360时是最近1年
rn:搜索结果显示条数(Record Number)
取值范围在10~100条之间,缺省值为10
si:在限定的域名中搜索
主要用于检索某个站点的百度索引数据,例如想要只得到百度的搜索结果,那么参数的值为baidu.com。使这个参数有效必须结合ct参数一起使用。
ct:此参数的值一般是一串数字
估计应该是搜索请求的验证码,目的暂时还没有分析出来
必备参数:
wd——查询的关键词(Keyword)
pn——显示结果的页数(Page Number)
rn——搜索结果显示条数(Record Number),取值范围在10–100条之间,缺省设置rn=10
可选参数:
cl——搜索类型(Class),cl=3为网页搜索
ie——查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文
tn——提交搜索请求的来源站点
实践:
https://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=%BC%AF%C3%C0%D5%FB%D0%CE&pn=20&ver=0&cl=3&uim=0&usm=0
s?lm=0 时间限制
&si= 限定域名
&rn=10 每页显示的数量
&ie=gb2312 编码
&ct=0 语言限制
&wd=%BC%AF%C3%C0%D5%FB%D0%CE 搜索关键字
&pn=20 页码
&ver=0
&cl=3 表示网页搜索
&uim=0
&usm=0
谷歌(google)地址栏参数分析
https://www.google.cn/search?q=112&hl=zh-CN&client=aff- 360daohang&hs=yhE&affdom=360.cn&newwindow=1&start=10& amp; amp;sa=N
q–查询的关键词(Query),百度对应的参数为wd
hl–Google搜索的界面语言 (Interface Language)
start–显示结果的页数,百度对应的参数为pn(0是首页,10是第二页,以此类推)
lr– 搜索内容的语言限定(Language Restrict),限定只搜索某种语言的网页。如果lr参数为空,则为搜索所有网页。
ie–查询输入 文字的编码(Input Encoding),Google缺省设置ie=utf-8,即请求Google搜索时参数q的值是一段utf-8编码的文字,如果要直接使用中文,可以 设置ie=gb2312,即为简体中文编码
oe–搜索返回页面的编码(Output Encoding),Google缺省设置oe=utf-8
num–搜索结果显示条数(Number),取值范围在10–100条之间,缺省设 置num=10,百度对应的参数为rn
newwindow–是否开启新窗口以显示查询结果。 缺省设置newwindow=1,在新窗口打开网页
safe–安全搜索选项(SafeSearch),设置该参数可以过滤****内容, 缺省设置safe为空,即不过滤****内容,设置为safe=vss,即过滤****内容。