经典案例
  • 妙视界
  • 广州市坊森室内装饰有限公司
  • ArtsRouge
  • Management
  • 爱艺术咖啡会所

SEO技术学习:你知道百度蜘蛛IP段所代表的不同含义吗?

发布于:2018-08-23 17:18来源:未知 作者:小凡 点击:

有时候我们在分析百度蜘蛛的时候,会发现很多的ip,这些个ip地址,根据后面的参数可以发现都是百度的。刚学习SEO不久的同学肯定要问:这些ip地址到底代表什么含义,是不是不同的ip地址所代表的含义不一样呢?对权重和抓取是否有影响?哪些是无效的蜘蛛,哪些是站长工具的蜘蛛,那些又是百度自己真正的蜘蛛?

首先,怎么判断这个蜘蛛是不是百度蜘蛛?


百度蜘蛛

在这里,我教大家一个方法。

电脑上,点开始——运行——cmd——nslookup 【ip】看name值。

如判断ip地址123.125.71.95,如下图。

判断百度蜘蛛

很明显看出是百度的蜘蛛。

如判断ip地址61.147.98.146,如下图

判断百度蜘蛛ip

显示不是百度蜘蛛。

这个只要看nslookup出来的name值。没有的话就不是百度蜘蛛,有百度字样的,就是百度蜘蛛。

那么,不同的百度蜘蛛,它的功能和作用是什么呢?以下是搜集于互联网的,大家可以作为一个参考。

百度蜘蛛 功能说明
60.172.229.61 蜘蛛来访,准备抓取网页内容
61.129.45.72 蜘蛛来访,准备抓取网页内容
61.135.162.* 蜘蛛来访,准备抓取网页内容
61.135.165.134 百度竞价蜘蛛
117.34.74.66 百度竞价蜘蛛
118.122.188.194 百度竞价蜘蛛
119.63.196.9 百度竞价蜘蛛
125.39.78.185 百度竞价蜘蛛
61.135.186.* 百度联盟蜘蛛、百度统计蜘蛛
61.147.98.146 站长工具模拟百度蜘蛛
61.188.39.16 站长工具模拟百度蜘蛛
113.98.254.245 站长工具模拟百度蜘蛛
117.21.220.245 站长工具模拟百度蜘蛛
117.28.255.42 站长工具模拟百度蜘蛛
124.248.34.52 站长工具模拟百度蜘蛛
125.90.88.* 站长工具模拟百度蜘蛛
119.147.114.213 站长工具模拟百度蜘蛛
121.10.141.* 站长工具模拟百度蜘蛛
123.15.**.** 百度图片蜘蛛
123.125.71.* 抓取网站内页收录,质量不高,暂时不会放出来
159.226.50.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.87 考察蜘蛛(很大可能是降权蜘蛛)
220.181.158.107 考察蜘蛛(很大可能是降权蜘蛛)
183.91.40.144 新站不正常情况下的蜘蛛
203.208.60.* 新站不正常情况下的蜘蛛
210.72.225.* 打酱油的百度蜘蛛
123.125.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
218.30.118.102 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
220.181.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
123.125.66.* 代表百度蜘蛛IP来过了,准备抓取你网站上的东西!
220.181.7.*
121.14.89.* 百度蜘蛛作为度过新站考察期的一个ip段
220.181.108.95 此ip段爬过的文章或首页正常情况下基本在24小时都会放出来
220.181.108.92 此ip段爬过的文章或首页正常情况下基本在25小时都会放出来
220.181.108.91 此ip段爬过的文章或首页正常情况下基本在26小时都会放出来
220.181.108.75 此ip段爬过的文章或首页正常情况下基本在27小时都会放出来
123.125.71.95 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.97 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.181.108.77 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.106 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
220.181.108.89 专用抓取网站首页的,也属于权重段,
一般返回代码304 0就代表网站未更新
220.181.108.94 专用抓取网站首页的,也属于权重段,
一般返回代码304 1就代表网站未更新
220.181.108.97 专用抓取网站首页的,也属于权重段,
一般返回代码304 2就代表网站未更新
220.181.108.80 专用抓取网站首页的,也属于权重段,
一般返回代码304 3就代表网站未更新
220.181.108.77 专用抓取网站首页的,也属于权重段,
一般返回代码304 4就代表网站未更新
220.181.108.83 专用抓取网站首页的,也属于权重段,
一般返回代码304 5就代表网站未更新
220.181.108.86 专用抓取网站首页的,也属于权重段,
一般返回代码304 6就代表网站未更新
 

1、下面的百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。

60.172.229.61

61.129.45.72

61.135.162.*

2、百度竞价蜘蛛

61.135.165.134

117.34.74.66

118.122.188.194

119.63.196.9

125.39.78.185

3、(百度联盟爬虫),说白了就是百度统计

61.135.186.*

4、站长工具模仿的百度蜘蛛

61.147.98.146

61.188.39.16

113.98.254.245

117.21.220.245

117.28.255.42

5、114站长工具箱(这个是你的网站不稳定时常来的)

119.147.114.213

121.10.141.*

6、百度图片爬虫

123.15.**.**

7、这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权

123.125.68.*

8、抓取内页收录的,权重较低,爬过此段的内页文章暂时被收录但不放出来(意思也就是说待定),因不是原创或采集文章。(百度网页爬虫(百度图片爬虫)

123.125.71.*

9、搜外站长工具蜘蛛

124.248.34.52

10、也属于百度蜘蛛IP 主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合检测造成的,没有多大用

125.90.88.*

11、百度蜘蛛

159.226.50.*

180.76.5.*

180.76.5.87

220.181.158.107

12、伪装百度蜘蛛IP

180.149.130.*

13、这个ip段出现在新站及站点有不正常现象后

183.91.40.144

203.208.60.*

14、这个ip段不间断巡逻各站,就是路过一下

210.72.225.*

15、每天这个IP 段只增不减很有可能进沙盒或K站

218.30.118.102

220.181.68.*

123.125.68.*

220.181.68.*

16、主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照的!一般成功抓取返回代码都是 200 0 0返回304 0 0代表网站没更新,蜘蛛来过,如果是 200 0 64别担心这不是K站,可能是网站是动态的,所以返回就是这个代码

220.181.108.*

17、代表百度蜘蛛IP来访准备抓取你东西

220.181.7.*

123.125.66.*

18、这个ip段作为度过新站考察期

121.14.89.*

19、这个ip段出现在新站或站点有不正常现象后

203.208..60.*

20、这个ip段不间断巡逻各站

210.72.225.*

21、这个是百度抓取首页的专用IP如是220.181.108段的ip来的话基本来说网站会天天隔夜快照,绝对错不了的

220.181.108.95

22、98%抓取首页可能还会抓取其他「不是指内页)属于权重IP段此段爬过的文章或首页基本24小时放出来.

220.181.108.92

23、抓取内页收录的 权重较低 爬过此段的内页文章不会很快放出来,因不是原创或采集文章

123.125.71.106

24、属于综合的。主要抓取首页和内页或者其它页面。属于权重IP段, 抓过的文章或首页基本24小时放出来

220.181.108.91

25、重点抓取更新文章的内页达到90%,8%的抓取首页,2%其他权重ip段,抓过的文章或首页基本24小时放出来

220.181.108.75

26、专用抓取首页ip 权重段,一般返回代码304 0 0代表未更新

220.181.108.86

27、抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创

123.125.71.95

123.125.71.97

28、专用抓取首页ip 权重段,一般返回代码304 0 0代表未更新

220.181.108.89

220.181.108.94

220.181.108.97

220.181.108.80

220.181.108.77

29、抓取内页收录的, 权重较低,爬过此段的内页文章不会很快放出来,因不是原创

123.181.108.77

30、专用抓取首页ip 权重段,一般返回代码304 0 0代表未更新

220.181.108.83

tag标签:
------分隔线----------------------------
------分隔线----------------------------