当前位置:新疆敷依百度排名 > 网站搭建解释 >

网站被镜像了怎么办?

发布时间:2020-07-11 04:12 作者:新疆百度快速seo软 阅读()

seozac.com/blackhat/negative-seo/” target=”_blank” style=”box-sizing:inherit;background-color:transparent;color:#0B65A1;outline:none;transition:all 0.35s ease 0s;opacity:0.8;text-decoration-line:none !important;”>常见负面SEO帖子里提到过,我这个小博客有几十个域名镜像我。有读者问我,怎么知道本身被镜像了,网站被镜像又改怎么处理。今天写个帖子聊一下。

什么是恶意镜像网站?

镜像网站指的是和你的网站根基日常、而且实时同步的其它网站。就像照镜子日常,所以名为镜像。

有的镜像网站是没有恶意的,很可能是你本身设置的,为了轻易用户能从多个域名会见网站,被封了一个,还有其它的域名。好比有名的草榴社区,似乎就有许多镜像或许拜候。

有的镜像,也就是这里评论的镜像,是不怀好意的,凡是是别人设置的,要么为了负面SEO你的网站,要么为了操纵你的内容获得排名,然后把用户转向到敏感、不法内容网站上去。

网上有的文章把采集和镜像混在一路。固然体现形式差不多,但严厉来说,采集和镜像实现方式、浮现形式是有区另外。

采集的网站一样是提前抓取别人网站的内容,放入本身数据库,再用法式挪用到页面上。被采集网站有新内容时,采集网站并不克实时同步更新,要再采集之后才能显现。一旦被采集,内容已经在对方数据库里了,从手艺上是无法阻止采集网站显示这些内容的。这篇帖子说的不是这种。

镜像网站并不事先抓取内容,而是有人接见网站时,实时从被镜像的网站调取内容,做些处理(替代URL、文字,加文字、加JS等),然后实时显示。被镜像的网站有任何更新,镜像网站是实时同步的。

网站被镜像了怎么办?

网上有卖用于镜像网站的小偷法式的。小偷法式凡是也或许用来做采集。为了不给他们做宣传,就不提名字了。从他们的官网摘取几条法式功能,有助于懂得后面的内容:

  • 全主动剖析,表里链接主动转换、图片地址、css、js,主动剖析CSS内的图片
  • 内置壮大替代和过滤功能,标签过滤、站表里过滤、字符串替代、等等
  • 伪原创,近义词替代有利于seo
  • 增加URL路由,实现全站URL变换,个性化本站URL地址
  • 超等模板增加移动模板、自界说栏目功能
  • 增加主动获取301、302重定向的采集,解决跳WWW,跳https采集
  • 代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自界说cookie,以便应对防采集办法

其实我是挺利诱,网信办为什么不责令封闭卖小偷法式的网站,这种网站才是真正该关的,而不是别的一些网站。

被镜像有什么危险

从SEO角度看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容根基平常,搜刮引擎有可能认为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。

对有必然汗青、权重的网站,镜像网站庖代原版网站的可能性微乎其微。但从表情角度考虑,被别人镜像,内容被别人偷走,即使没有其它较着后果,也照样挺烦人的一件事。

另一个烦人的事是,镜像网站普通来说并不是要和你供应同样的产物或办事,而是把用户转到赌钱、色情等办事上去。有的是过程JS把赌钱、色情内容显示给用户,有的直接把用户转向到别的的网站上去。

如何发现本身网站被镜像了

有时候留意到被镜像了是因为本身网站排名下降,思疑有人负面SEO。有时候是搜刮品牌名称,看到镜像网站。已经知道本身被镜像了好办,直接看下面怎么处理部门。

多少站长则完全不知道本身网站是否被镜像了。有几个我常用的查抄方式。

一是百度统计后台:

网站被镜像了怎么办?

受访域名部门列出了使用沟通百度统计代码的域名。个中显现快照、百度/谷歌翻译等是正常的,但泛起一些奇古怪怪的域名就要查看一下了,好比上图里的第5、7、8个,会见一下就知道都是镜像SEO天天一帖,引诱用户赌钱的网站,然后站长把SEO天天一帖的统计代码也照抄曩昔了。

看看上面列出的小偷显现功能就知道,其实统计代码很轻易替代或删除的。所以在受访域名只能看到一小部门镜像网站。

第二是搜刮网站的特征句子。最轻易想到的是网站品牌名称、首页题目等,的确能够发现一些镜像网站。但如前所述,品牌名绝大多数是会被替代的,所以我更喜欢搜刮一些页面上的特征句子,好比本博客最上面的副题目:Zac的SEO博客,对峙12年,优化成为生活。搜刮一下就会看到:

网站被镜像了怎么办?

看来我的博客很轻易吸引菠菜啊。

一样我不搜刮帖子里的句子,因为那会返回大量转载、剽窃的页面,不是镜像的。

从上图能够看到,镜像网站主动把title及正文中的品牌词或指定关头词替代了,接见这类网站结果经常是如许的:

网站被镜像了怎么办?

上图镜像网站没有转向,也没有效JS显示大量菠菜内容,而是直接在正文中插入菠菜内容和链接。有的镜像网站用JS在页面上半部门显示大量内容,就像在典型赌钱网站看到的一般,拉到下面才能看到镜像的内容。

为了搜得更全,还经常需要多搜刮其它处所的特征文字。好比搜刮页脚的声明中的一句:“明明好久一贴,为什么号称“看到另一些镜像网站:

网站被镜像了怎么办?

为什么搜刮句子的一半,不是搜刮“明明良久一贴,为什么号称SEO天天一帖“呢?照样因为品牌词或特征要害词经常是会被替代的,好比如许:

网站被镜像了怎么办?

普通我是用Google做这种搜刮,因为Google什么东倒西歪的都收录。

网站被镜像了怎么办?

首先,一些网上提到的解决法子并没有什么用。

好比有的说页面上的链接用绝对地址有匡助,其实小偷法式城市主动替代网址,用相对地址仍是绝对地址没什么差别。

还有的说页面上加上彀站链接、网站名称、版权声明之类的,搜刮引擎会识别哪个是正版。但镜像小偷法式连链接带文字都能够扫数主动替代,这么做并没有效。

发现镜像网站后的处理原则就是让镜像网站不及在镜像域名上显示你的内容。考虑到镜像网站是要实时会见和挪用被镜像的页面的,所以能够考虑几个方式。

好比用JS检测一下正在被打开的页面是不是在本身的域名上,是的话正常显示,不是的话(域名是镜像网站时)强迫转向到本身域名:

if (window.location.hostname !== ‘www.seozac.com’){
window.top.location.href = ‘https://www.seozac.com/’;
}

(声明:我对法式不熟,代码只是简洁举例,具体怎么写,请问你的法式员。)

不外这种方式只对用户有效,搜刮引擎不执行JS,仍是会抓取到镜像内容。也能够用PHP写剧本判断和转向。

有时候因为各种原因,法式不起感化。另一个直接的方式是樊篱镜像网站来接见的IP地址。先查一下镜像网站办事器IP:

网站被镜像了怎么办?

把对方主机IP先樊篱了。不外镜像网站来实时抓取用的IP大部门情形下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的办事器。要发现必需屏障的IP,需要查看网站原始日志。我的一个小窍门是,接见镜像网站上一个很少人会接见的页面,好比翻页第70页,然后立时查看日志,这个页面被会见的IP就是应该樊篱的IP:

网站被镜像了怎么办?

屏障了这个IP,再接见镜像网站就酿成403错误了:

网站被镜像了怎么办?

不知道页脚的友情链接是镜像网站本身加的?仍是卖法式的人强制加的?

镜像网站经常是会伪造或实时轮换IP地址的,若是屏障一个IP网站还能接见,就再会见翻页69页、68页等等,找到更多IP。樊篱也或许屏障IP段。我的经验是,每每镜像网站不会使用跨越10个IP地址。

当然也能够写个简洁的剧本放本身网站上,好比www.seozac.com/mirror.php:

<?php
echo $_SERVER[‘REMOTE_ADDR’];
?>

剧本独一功能就是显示接见的IP,然后本身接见一下小偷镜像网站的剧本网址,也就是www.bloody-thief.com/mirror.php,页面上就直接显示镜像网站接见你办事器时的IP了。假如镜像网站替代了URL,这个方式就欠好用了。无论如何,日志中是必然有的。

别的,发现镜像网站,能够向百度、域名注册商、主机办事商投诉,要求封闭网站或删除页面。投诉是否管用就是另一回事了,仍是先做好IP樊篱和URL检测。


新疆竞价优化公司
    

    网站首页 -杭州网站搭建 -网站搭建解释 -关键词排名 -企业SEO优化 -TAGS

    Copyright © 2019-2020 新疆敷依百度排名 版权所有

    本网站内容来自于互联网或用户投稿,如有侵权,请联系我们删除 点击这里给我发消息