网站被恶意镜像怎么办？JS，HTML，PHP等代码轻松搞定

jhchina 2023-07-18 273 0条评论

默认

摘要： 有时候你会发现，你在搜索引擎输入网站名称的时候，出来的网站信息是你们的，但是域名却是一个陌生的，这种情况可以基本确定网站被镜像了，那么究竟什么叫网站被镜像？恶意镜像，也叫恶意克隆，...

有时候你会发现，你在搜索引擎输入网站名称的时候，出来的网站信息是你们的，但是域名却是一个陌生的，这种情况可以基本确定网站被镜像了，那么究竟什么叫网站被镜像？

恶意镜像，也叫恶意克隆，恶意解析，是指有人通过域名 A 记录直接解析别人 IP 地址，从而得到一个在访问者眼中完全相同网站的过程。其工作原理基本上是这样子的：有用户访问镜像站点时，程序就会来正版的站点查询数据，并修改相关链接然后呈献给用户，实质上还是在读取原站的数据。严谨一点的解释：通过复制整个网站或部分网页内容并分配以不同域名和服务器，以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。

网站被镜像的危害

通俗的讲，恶意镜像者意图利用自己有一定权重的域名进行威压，通过某些手段复制了你的站点，除了域名不一样之外，其他内容一模一样，用户或许根本无法分辨。甚至对于一些新的站点，搜索引擎都会迷惑到底哪个是真的站点，那么就有可能正牌的网站被删除收录，而盗版的却被搜索引擎青睐。

虽然目前我们还不知道恶意镜像我们的网站到底有什么意图，但肯定对我们没什么好处，如果他这个域名有点什么不健康的信息，那么我们被镜像的站点有可能被污染掉，所以还是要警惕这个现象。

如何知道自己的网站是否被镜像

复制自己网站的完整标题（PS：查看自己站点首页源码，其中 <title>江湖博客 - 分享悲伤;共享快乐</title>），然后在谷歌和百度等搜索引擎里搜索，如搜索：intitle 江湖博客 - 分享悲伤;共享快乐，如果有其他网站的网站标题、描述及网站内容跟你的一样，只有域名不一样，那就是被镜像了。

如何处理网站被镜像

这类镜像看似一个完整的站点，其实上是每次用户访问镜像站点，程序就会来正版的站点查询数据，并修改相关链接然后呈献给用户。实质上还是在读取原站的数据。以下江湖博客就列举几种解决方法，大家自行取舍使用！

方法 1：查清镜像网站的主机 Ip，通过禁止 Ip 来解决

方法 2：JS 来防护

在头部标签：<head></head>里加上下面的 JS 代码：

<script type="text/javascript">
if (document.location.host != "www.jhchina.net") {
location.href = location.href.replace(document.location.host,'www.jhchina.net');
}
</script>

或加上以下的 JS 代码：

<script type="text/javascript">
rthost = window.location.host;
if (rthost != "www.jhchina.net") {
top.location.href = "https://www.jhchina.net";
}
</script>

注意：将上面代码中的www.jhchina.net改为你网站的首页主地址，如果我上面填写的不是我网站的主地址 www.jhchina.net，而是 jhchina.net 的话，就会导致网站一直刷新！

注：经过本站测试，如果镜像站屏蔽了 JS，则该方法失效。所以，最好把方法 2 和方法 3 结合使用！

方法 3：Js 被屏蔽后防止镜像的方法

将以下代码加到网站的 header.php 中：

<div style="display:none;">
<script>proxy2016 = false;</script>
<img src="" onerror='setTimeout(function(){if(typeof(proxy2016)=="undefined"){window.location.host="www.jhchina.net";}},3000);'>
</div>

有些网站会屏蔽掉 JS 代码（如下面的代码）：<script>...</script>

所以 <script>proxy2016 = false;</script> 代码将被过滤掉，img 的 onerror 设置超时时间 3000 毫秒，将运行函数部分，检测是否还存在 proxy2016 字符，如果没有找到就会将主机的 URL 改为 www.jhchina.net；为了安全起见，将 js 部分可以使用 js 代码混淆（本站“JS 代码混淆” 工具或站长之家 JS 混淆工具）。

本站的混淆结果如下：

<div style="display:none;">
<script>proxy2016 = false;</script>
<img src=" " onerror='setTimeout(function(){if(typeof(proxy2016)=="undefined"){window["\x6c\x6f\x63\x61\x74\x69\x6f\x6e"]["\x68\x6f\x73\x74"]="\x77\x77\x77\x2e\x69\x6c\x78\x74\x78\x2e\x63\x6f\x6d";}},3000);'>
</div>

经过我的测试，此代码在 Chrome、IE11 和 360 极速浏览器上均有效，会跳转到源站的原文章页！在 Firefox 上则无效果，镜像的文章页并不会跳转到原站...... 将代码中 img 标签的 src 引用地址改为空格或无效的图片地址后，在 Firefox 上也起作用了！

方法 4：借助 Img 的 Onerror 事件

HTML 通用版

<img style="display:none" src=" " onerror='this.onerror=null;var currentDomain="www." + "jhchina" + ".net"; var str1=currentDomain; str2="docu"+"ment.loca"+"tion.host"; str3=eval(str2) ;if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ){ do_action = "loca" + "tion." + "href = loca" + "tion.href" + ".rep" + "lace(docu" +"ment"+".loca"+"tion.ho"+"st," + "currentDomain" + ")";eval(do_action) }' />

将以上代码中的： var currentDomain="www." + "jhchina" + ".net"; 自行拆分成自己的域名，避免被镜像代码替换掉，比如： var currentDomain="jhchina." + "net";

PHP 通用版：

方法 5：通过禁止某些 User Agent 特征来防

将下面的代码贴到网站入口文件 index.php 中的第一个 <?php之后即可：

//防止恶意HTTP_USER_AGENT采集
$ua = $_SERVER['HTTP_USER_AGENT'];
$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP'); 
if(!$ua) {
header("Content-type: text/html; charset=utf-8");
  die('请勿采集本站，采集者木有小JJ！请正常访问，并认准【侠剑江湖】官方网址！');
}else{
  foreach($now_ua as $value )
  if(eregi($value,$ua)) {
  header("Content-type: text/html; charset=utf-8");
  die('请勿采集本站，采集者木有小JJ！请正常访问，并认准【侠剑江湖】官方网址！');
  }

标签： JavaScript PHP

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31