对百度搜索中URL的参数进行详细解析

在编写网络爬虫程序时,您可能需要使用百度搜索中的一些参数。 在此我们整理了这些参数以及如何使用它们,让您更方便地进行网页搜索。

对百度搜索中URL的参数进行详细解析-第1张图片

wd

查询您要搜索的关键词。

pn

已显示的结果条数,即当前页从pn条记录开始显示,该值为10的倍数。

cl

搜索类型:

  • cl=3为网页搜索

  • cl=2为图片搜索或新闻搜索

  • cl=0是所有结果

其他值未知。当搜索结果中出现“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”, 点击之后的cl的值为0,而此时显示的结果相对比较多。

rn

搜索结果中每页显示的条数,取值范围在10、20、50、100,缺省设置rn=10。

ie

查询输入文字的编码,缺省设置ie=gb2312,即为简体中文。

tn

提交搜索请求的来源站点。一个有用的tn:tn=baidulocal 表示百度站内搜索,返回的结果是很干净的,没有任何广告。另外,从做百度联盟搜索的网站A 搜索过来的都有这个tn参数,当你点击搜索结果中带“推广”的网站B,做百度“推广”的网站B的户主账户中就会被扣掉一部分费用,其中一部分百度留着,另外一小部分给网站A的户主,因为你从网站A搜索过来的。

lm

限定要搜索的网页的时间,值为0、1、7、30、360,以天为单位,例如搜索最近一个月的网页,lm=30。默认值为0,表示没有时间限制。

ct

语言,0-所有语言,1-简体中文网页,2-繁体中文网页;默认值为0。

bs

上一次搜索的关键词,应该与相关搜索有关。

ft

搜索的文档格式,pdf、doc、xls、ppt、rtf等,默认值为空。

q1

包含以下全部关键词。

q2

包含以下完整关键词。

q3

包含以下任意一个关键词。

q4

不包括以下关键词。

q5

关键词位置,为空表示在网页的任何地方,1表示仅在网页标题中,2表示仅在网页URL网址中。

q6

限定在某个指定的网站,比如q6=http://www.baidu.com/,表示仅在http://www.baidu.com/中搜索。

以上是关于百度搜索中url的参数解析,希望对您有所帮助。

本站所有内容仅限用于学习和研究目的,程序仅供本地断网测试,转载请说明出处!
站群SEO » 对百度搜索中URL的参数进行详细解析

发表评论

欢迎 访客 发表评论

聚合全网站群程序及推送工具!

联系站长 联系客服