在编写网络爬虫程序时,您可能需要使用百度搜索中的一些参数。 在此我们整理了这些参数以及如何使用它们,让您更方便地进行网页搜索。
wd
查询您要搜索的关键词。
pn
已显示的结果条数,即当前页从pn条记录开始显示,该值为10的倍数。
cl
搜索类型:
cl=3为网页搜索
cl=2为图片搜索或新闻搜索
cl=0是所有结果
其他值未知。当搜索结果中出现“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”, 点击之后的cl的值为0,而此时显示的结果相对比较多。
rn
搜索结果中每页显示的条数,取值范围在10、20、50、100,缺省设置rn=10。
ie
查询输入文字的编码,缺省设置ie=gb2312,即为简体中文。
tn
提交搜索请求的来源站点。一个有用的tn:tn=baidulocal 表示百度站内搜索,返回的结果是很干净的,没有任何广告。另外,从做百度联盟搜索的网站A 搜索过来的都有这个tn参数,当你点击搜索结果中带“推广”的网站B,做百度“推广”的网站B的户主账户中就会被扣掉一部分费用,其中一部分百度留着,另外一小部分给网站A的户主,因为你从网站A搜索过来的。
lm
限定要搜索的网页的时间,值为0、1、7、30、360,以天为单位,例如搜索最近一个月的网页,lm=30。默认值为0,表示没有时间限制。
ct
语言,0-所有语言,1-简体中文网页,2-繁体中文网页;默认值为0。
bs
上一次搜索的关键词,应该与相关搜索有关。
ft
搜索的文档格式,pdf、doc、xls、ppt、rtf等,默认值为空。
q1
包含以下全部关键词。
q2
包含以下完整关键词。
q3
包含以下任意一个关键词。
q4
不包括以下关键词。
q5
关键词位置,为空表示在网页的任何地方,1表示仅在网页标题中,2表示仅在网页URL网址中。
q6
限定在某个指定的网站,比如q6=http://www.baidu.com/,表示仅在http://www.baidu.com/中搜索。
以上是关于百度搜索中url的参数解析,希望对您有所帮助。
站群SEO » 对百度搜索中URL的参数进行详细解析