关于WordPress使用七牛云对象储存后导致百度收录镜像站解决后图片不被收录的问题

博主早在N个月前就使用了七牛云的对象储存功能,但是在使用了这么久也发现了一个问题,早在之前博主就解决了站点被镜像导致收录出现异常的问题,目前又出现了一个新的问题,那就是如何在解决站点不被镜像收录的前提下让百度收录你的图片呢?这篇文章就教大家解决这个问题,如果你喜欢这篇文章可以分享与收藏本文。

解决站点被镜像

如果第一次使用七牛云对象储存的时候就会发现,百度收录了一个和你一模一样的站点,域名是你的对象储存的域名,虽然看起来好像没什么大问题,但其实百度会以为你们其中一个是复制了别人的站点,对SEO优化非常不友好,从而被降低权重。如果你是做着玩,不在乎收录,那么你可以无所畏惧;但是如果你和博主一样在乎收录,那么就一定要解决这个问题,其实解决这个问题非常简单,就是在你的对象储存根目录中上传一个新的robots.txt文件,robots.txt文件中的内容如下:

User-agent: *
Disallow: /

这样可以解决问题吗?答案是当然可以!但是这样做的后果就是,对象储存内的所有数据都会被禁止收录,也就是说,你储存到对象储存中的音乐、压缩包、甚至是图片,都会被禁止收录,这样对于我们这种图文并茂的博客来说是一个非常严重的问题。那么我们下一节就来讲讲如何在禁止收录镜像站的前提下,保证图片、压缩包等资源被收录呢?

禁止收录镜像的前提下允许收录图片、压缩包等

很简单,我们还是只需要在robots.txt文件中做一点小小的修改,就可以了,首先你需要明确你想让那些资源被搜索引擎收录,然后把文件后缀进行列表,然后在依次加入到robots.txt文件中,在上传到对象储存的空间内就可以完美解决了。代码如下:

User-agent: *
Allow: /*.jpg$
Allow: /*.jpeg$
Allow: /*.gif$
Allow: /*.png$
Allow: /*.bmp$
Allow: /*.tiff$
Allow: /*.pcx$
Allow: /*.tga$
Allow: /*.exif$
Allow: /*.fpx$
Allow: /*.svg$
Allow: /*.psd$
Allow: /*.cdr$
Allow: /*.pcd$
Allow: /*.dxf$
Allow: /*.ufo$
Allow: /*.eps$
Allow: /*.ai$
Allow: /*.raw$
Allow: /*.WMF$
Allow: /*.webp$
Allow: /*.ico$
Allow: /wp-content/uploads/*
Disallow: /

因为本站只需要将图片资源进行收录就行了,所以博主把所有的图片格式都写入了robots.txt文件中,每一个后缀名前面写Allow: /,后面写$,然后一行一个,这样就可以解决这个问题了。

我们来解释下上述的代码:

  • User-agent: *表示所有的UA,你可以理解为所有的搜索引擎。
  • Allow: /*.jpg$表示收录http://www.svlik.com/中任何位置的所有的jpg文件,其中橙色部分为后缀名。
  • Allow: /wp-content/uploads/*表示允许收录http://www.svlik.com/wp-content/uploads/下的所有文件。
  • Disallow: /表示禁止收录http://www.svlik.com/下的任何位置所有文件。

注意:robots.txt是有优先级的,请注意顺序不要进行调换,一般来说是先指明允许那些资源被收录,在禁止那些资源被收录。

具体操作步骤

1.我们打开对象储存的域名,后面跟上/robots.txt发现前robots.txt把所有的搜索引擎都禁止了。

1.进入我们的对象储存空间,删除原有的robots.txt文件。

3.将我们上述中的代码复制,粘贴至新建的文本文档并改名为robots.txt,然后上传至我们的对象储存中。

4.找到融合CDN,并将我们的对象储存域名后面跟上/robots.txt写入到刷新文件中,并点击提交。

5.我们使用CTRL + F5强制刷新并访问robots.txt,直到新的代码显示出来。

6.至此,所有修改完毕,现在百度不会在收录你的镜像站,但是会收录你镜像站中的图片资源,当然如果你需要让音乐、压缩包等资源也被百度收录,只需要按照上述代码中的格式将后缀名添加进入就可以了。现在我们就来测试下robots.txt的状态是否符合我们的预期想法。

测试robots.txt方法

测试地址:https://ziyuan.baidu.com/robots/intro

1.把你的对象储存的域名输入到文本框内,然后点击检测,如果没有出现错误的话下面的文本中会显示上述的代码。

2.我们依次输入test.jpg、test.png、test.gif、index.html、index.php,看看是否被允许。正常情况应该是test.jpg、test.png、test.gif显示为允许;index.html、index.php显示为不允许。

声明:本文为原创,作者为 Svlik,转载时请保留本声明及附带文章链接:https://www.svlik.com/1665.html