什么是防采集?用大白话来说,就是我们想利用工具采集某个网站的数据(前提当然是公开合法数据),但网站不想给你采集而设置的技术阻挡措施。
什么是防采集?用大白话来说,就是我们想利用工具采集某个网站的数据(前提当然是公开合法数据),但网站不想给你采集而设置的技术阻挡措施。
1、图片加上水印,如果你的文章中有比较多的图片,那么上海网站建设中的图片加水印是不错的选择;另外,可以后台设置水印出现的位置随机,这样对方采集到图片后便无法遮盖你的水印。当然,水印是透明背景且色彩比较浅,这样才不会影响图片质量。此时此刻对方要么继续为你宣传,要么放弃采集图片,要么放弃采集你的网站,这都是对你有利的。
2、用javascript加密内容页面 ,弊端:此方法适用于静态页面,但会严重影响搜索引擎对其收录情况,搜索引擎收到到的内容,也都是加密后的内容。
采集对策:建议不采,如非要采,就把解密码的JS脚本也采下来。
建议:目前没有好的改良建议。
评论:建议指望搜索引擎带流量的站长不要使用此方法。
3、加上版权信息,采集的基本原理就是复制文章,网站建设这里可以设置一段代码来实现复制文章后在末尾添加版权信息;这段版权信息不会在文章中显示,只有在文章内容被复制时才会出现在粘贴的内容中。当然,如果采集规则中屏蔽掉这点尾巴,那么版权信息便不会存在。不过对于那些大量采集的人来说,可能不会注意到这个版权尾巴。
4、使用HTTP_REFERER禁止采集,网站制作中发现来自非本站连接就禁止察看叶面,就像前一段落伍im286.net防DDOS那个禁止调用一样。 这个方法可以比较有效的防止采集,不过也一样把搜索引擎封掉了,对于靠搜索引擎吃饭的站长们来说,得不偿失。对高手无效,因为HTTP_REFERER可以伪造。但对一般使用采集的人来说,已经足够应付了。
5、其他方法如:设置修改为一个ip只能读取50页,要他采集不完也是非常不错,另外将自己网站设计多增加一些内联+外链,用同列网站,交织的让他采集不了等等,很多这种方法应对采集都是非常不错的,谁都不想自己设计好的网站设计被人无端借用的。