Google已将Hostgator的url登录cpanel托管编入索引。前任:mysite.com:2082
还用索引了我网站的5页www
。所以我有重复的内容。
被索引,例如mysite.com/page1
和www.mysite.com/page1
我曾尝试删除网站站长工具,但始终在域后添加斜杠(/)。
尝试发送mysite.com:2082
删除时添加了/,得到mysite.com/:2082
有人遇到过这个问题吗?可以采取任何措施删除这些页面吗?谢。
Google已将Hostgator的url登录cpanel托管编入索引。例如:mysite.com:2082
如果您在共享主机上,那么我认为您对此无能为力。
cPanel使用robots.txt阻止对这些页面的爬网。不幸的是,这仍然会在Google SERP中导致仅链接条目,其描述如下:
由于该网站的robots.txt,无法获得此结果的说明-了解更多信息。
为了防止这些页面被索引,它们要么需要noindex
机械手元标记,要么需要类似的noindex
X-Robots-Tag
HTTP响应标头。并删除Disallow
robots.txt中的指令(以防止抓取页面)。据我所知,cPanel页面未返回适当的漫游器元标记。
这个问题已经在cPanel论坛上讨论过了(几年前!),据说“修复程序”已经发布,但是我发现这种行为没有改变。
坦白地说,使用robots.txt阻止对这些页面的爬网可以说是最有效的方法,因为它只是阻止了(好的)漫游器请求页面,从而减少了(仅一点)服务器上的负载。为了阻止这些页面进入Google索引,您需要允许对这些页面进行爬网,以便可以检测到机器人元标记(当前不存在)。有点难为情22。
如果您考虑安全性,那么阻止对这些页面建立索引实际上并没有帮助。充其量只是安全性。可以通过请求标准URL轻松找到cPanel登录页面example.com:2082
。
还用www索引了我网站的5页。所以我有重复的内容。
您可以在Google网站站长工具中为“www
或”或“无”设置首选项www
。或者,您可以在.htaccess中将一个重定向到另一个。哪个是您首选的URL,由您决定。例如,从无www重定向到www ...
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\. [NC]
RewriteRule (.*) http://www.%{HTTP_HOST}/$1 [R=301,L]
坦白地说,尽管如此,Google在解决此问题方面做得非常出色(这很常见)。没有重复的内容“惩罚”,只是如果您不指定首选项,那么任何一个都可以被索引。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句