gravatar头像龙笑天  3个月前 (09-11) 来源:龙笑天下 隐藏边栏 |   131 条评论  2177 
文章评分 174 次,平均分 4.9

网站被恶意镜像怎么办 一段代码轻松搞定(全面版) wordpress

有时候你会发现,你在搜索引擎输入网站名称的时候,出来的网站信息是你们的,但是域名却是一个陌生的,这种情况可以基本确定网站被镜像了,那么究竟什么叫网站被镜像?

恶意镜像,也叫恶意克隆,恶意解析,是指有人通过域名A记录直接解析别人IP地址,从而得到一个在访问者眼中完全相同网站的过程。其工作原理基本上是这样子的:有用户访问镜像站点时,程序就会来正版的站点查询数据,并修改相关链接然后呈献给用户,实质上还是在读取原站的数据。严谨一点的解释:通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为 。

网站被镜像的危害

通俗的讲,恶意镜像者意图利用自己有一定权重的域名进行威压,通过某些手段复制了你的站点,除了域名不一样之外,其他内容一模一样,用户或许根本无法分辨。甚至对于一些新的站点,搜索引擎都会迷惑到底哪个是真的站点,那么就有可能正牌的网站被删除收录,而盗版的却被搜索引擎青睐。

虽然目前我们还不知道恶意镜像我们的网站到底有什么意图,但肯定对我们没什么好处,如果他这个域名有点什么不健康的信息,那么我们被镜像的站点有可能被污染掉,所以还是要警惕这个现象。

如何知道自己的网站是否被镜像

复制自己网站的完整标题(PS:查看自己站点首页源码,其中 <title>龙笑天下 - 分享悲伤;共享快乐</title>),然后在谷歌和百度等搜索引擎里搜索,如搜索:intitle 龙笑天下 - 分享悲伤;共享快乐,如果有其他网站的网站标题、描述及网站内容跟你的一样,只有域名不一样,那就是被镜像了。

如何处理网站被镜像

这类镜像看似一个完整的站点,其实上是每次用户访问镜像站点,程序就会来正版的站点查询数据,并修改相关链接然后呈献给用户。实质上还是在读取原站的数据。以下龙笑天下就列举几种解决方法,大家自行取舍使用!

方法1:查清镜像网站的主机ip,通过禁止ip来解决

本教程基于WordPress程序,其他系统请自测!

1、获取镜像服务器ip。注:这个IP不是ping到他域名的IP

复制如下代码,新建一个php文件,并命名为“ip.php”上传到你的网站根目录。

2、然后访问你网站的镜像站点,在地址后面加.../ip.php,然后你就会在网站根目录找到ip.txt文件了,打开复制里面的ip地址。

3、然后打开你的.htaccess文件,在后面加上如下代码(自行修改为刚刚获得的ip)

当然,如果你使用CDN,可以直接在CDN后台添加ip黑名单

这个时候你再刷新一下镜像站点,是不是已经403报错了呢?这个时候已经解决了这个镜像站点,然后就等待蜘蛛将其解决掉吧。

此方法的缺点就是如果镜像网站更换了ip,那我们的屏蔽就失败了

方法2:JS来防护

在头部标签:取自 @boke112导航

里加上下面的JS代码:

或加上以下的JS代码:

注意:将上面代码中的www.ilxtx.com改为你网站的首页主地址,如果我上面填写的不是我网站的主地址 www.ilxtx.com,而是 ilxtx.com 的话,就会导致网站一直刷新!

注:经过本站测试,如果镜像站屏蔽了JS,则该方法失效。所以,最好把方法2和方法3结合使用!

方法3:js被屏蔽后防止镜像的方法

将以下代码加到网站的header.php中:代码取自 @boke112

有些网站会屏蔽掉JS代码(如下面的代码) :

所以 <script>proxy2016 = false;</script> 代码将被过滤掉,img的onerror设置超时时间3000毫秒,将运行函数部分,检测是否还存在proxy2016字符,如果没有找到就会将主机的URL改为www.ilxtx.com;为了安全起见,将js部分可以使用js代码混淆(本站“JS代码混淆” 工具站长之家JS混淆工具)。

本站的混淆结果如下:

经过我的测试,此代码在Chrome、IE11和360极速浏览器上均有效,会跳转到源站的原文章页!在Firefox上则无效果,镜像的文章页并不会跳转到原站...... 将代码中img标签的src引用地址改为空格或无效的图片地址后,在Firefox上也起作用了!

方法4:借助img的onerror事件

20161119更新(增加搜狗快照支持):此方法使用了后,会导致百度快照、谷歌快照、必应快照和搜狗快照等跳到404页面(360搜索快照则不会~),奈何不知怎么弄,2016-11-10再次经过张戈的指导,将原代码中的:if( str1!=str3 ) 改为 :if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ) 。估计要等快照更新时才能知道效果了!

20161127:经过验证,上述更新已经起作用了!具体效果,请点我~

通过拆分域名链接与镜像站比对,然后用img标签src空值触发onerror来执行js比对,比对失败则跳转回源站。

①、WordPress专用版

经过 @张戈 童学的不断改进(IE不支持 window.stop() 函数,所以“20160909版本”失效...),已经完美的适配Firefox、Chrome、IE11和360极速浏览器,而且可以跳转至源站的相应文章页,在此衷表感谢!下面3段任选一个即可。效果请看这里:http://www.ilxtx.com.dijicat.com/the-shawshank-redemption-1994.html

代码如下:(复制粘贴到主题的functions.php最后一个?>之前)

Ps:如果是丢到wp_head,经过测试发现图片放到head,浏览器会自动进行错误调整,导致一些本来在head的元素被丢到了body当中,比如style.css,估计网页标准中head里面就不应该放置图片,所以移到了footer当中。

或者
或者
Tips:如果想像“20160909版本”一样有个提示语,可将上面这段代码改为此
20160909版本

②、HTML通用版

既然是利用js代码,那么就能用到如何html页面当中了。要不是为了可以放到wp的functions.php,都没必要写成php的模式,直接用html代码即可:

将以上代码中的: var currentDomain="www." + "ilxtx" + ".com"; 自行拆分成自己的域名,避免被镜像代码替换掉,比如: var currentDomain="zhangge." + "net";

然后将代码添加到网站的 <body> 之后即可(不建议放置到 <head> 里面,具体原因上文已说明),这个版本适合任何网页。

方法5:通过禁止某些User Agent特征来防

参考此文:《服务器反爬虫攻略:Apache/Nginx/PHP禁止某些User Agent抓取网站》,禁止UA为PHP的抓取网页!

①、PHP通用版:

将下面的代码贴到网站入口文件index.php中的第一个 <?php之后即可:

②、Wordpress适用版

如果使用上面的php版本,WordPress每次更新就会需要操作index.php,比较麻烦,因此弄个专版。

将下面的代码贴到 functions.php 中的最后一个 ?>之前即可:

经过测试,在functions.php中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,采集者木有小JJ!请正常访问,并认准【龙笑天下网】官方网址!”。

本站目前发现的恶意镜像域名

dijicat.com
lapaleo.com
iaroex.com
disauvi.com
3s3s.org
ytlqpo.com
s3.gvirabi.com
hdtmail.com
dimyapi.com

更多镜像网站等你提供~

在这些域名前面加上你们自己的的域名,看看有没有被恶意镜像。

友情提示:建议方法2和方法3一起使用!方法4包含方法2和方法3~

 

除特别注明外,本站所有文章均为龙笑天下原创,转载请注明出处来自http://www.ilxtx.com/mirrored-website.html

gravatar头像
龙笑天 最后编辑于:2016-11-27
互助分享,互联网本该如此!

发表评论

表情 链接 贴图 私信 格式 签到

最赞评论
  1. gravatar头像
    Koolight 评论达人 LV.3 来自天朝的朋友 Safari浏览器  Android 4.4.2 PE-CL00 Build/HuaweiPE-CL00 湖北省荆州市 电信

    @龙笑天src=” ”一个空格链接直接是指向当前页面,其他(比如src=”nothing”)的会指向一个404错误页面。

    2016-09-12 15:16
    47 0
  2. gravatar头像
    Koolight 评论达人 LV.3 来自天朝的朋友 Safari浏览器  Android 4.4.2 PE-CL00 Build/HuaweiPE-CL00 湖北省荆州市 电信

    @boke112导航

    通过这个办法可以屏蔽UA为PHP/5.4.45的镜像站,如果要屏蔽所有PHP的,估计得写通配符了。

    2016-09-12 15:22
    25 0
  3. gravatar头像
    紫光 来自天朝的朋友 谷歌浏览器 Windows 7 广东省深圳市 联通

    第一种js方法简洁明了,真不错 [鼓掌]

    2016-04-21 16:27
    16 6
  1. gravatar头像
    夏日博客 来自天朝的朋友 谷歌浏览器 Windows 7 北京市朝阳区 联通

    已经用上了,最近的镜像很猖狂。

    58楼 12小时前
    0 0 回复
  2. gravatar头像
    靠谱学生兼职网 来自天朝的朋友 谷歌浏览器 Windows 8.1 广西南宁市 联通

    经不起被镜像啊。。。

    57楼 9天前
    1 0 回复
  3. gravatar头像
    tibat 来自天朝的朋友 Netscape Navigator iPhone iPhone OS 9_3_3 like Mac OS X) AppleWebKit 吉林省 联通

    访问中不直接返回内容 通过js来获取内容并在网页上呈现

    56楼 12天前
    0 0 回复
  4. gravatar头像
    Koolight 评论达人 LV.3 来自天朝的朋友 Safari浏览器  Android 4.4.2 PE-CL00 Build/HuaweiPE-CL00 湖北省 联通

    搜狗的快照也添加上去啊,毕竟腾讯的儿子!

    55楼 13天前
    1 0 回复
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录。
快捷登录后,请完善资料中的电子邮件地址,可及时收到回复邮件通知和用于登录!

切换登录

注册

扫一扫二维码分享