Ⅰ 有什么好方法防止自己网页的内容被采集
防止自己网页的内容被采集有非常多的方法
方法一:内容配图加水印
当你的文章中含有图片时候,可以给图片打上水印,这样就留下了你的信息,对方要采集或者复制您文章后,不可能一张一张的去处水印,这样也算是变相地帮助我们宣传网站。
方法二:内容随机穿插版权信息
在不影响用户阅读体验的情况下,尽量在内容段落之间随机插入一些之间的信息,比如:网站名字,链接,版权作者,QQ等,这样的话,就算对方使用采集器过滤也不可能每篇文章都能过滤得掉。
方法三:作品结尾留作者信息及链接
不过这个方法作用不是很大,因为很多人复制或转载内容时直接去掉了,可以参考方法二,适当在段落结尾处不影响阅读的情况下下随机插入较好。
方法四:主动推送网址给网络收录
网络给出的链接提交方式有以下三种:
1、主动推送:最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给网络,以保证新链接可以及时被网络收录。
2、sitemap:您可以定期将网站链接放到sitemap中,然后将sitemap提交给网络。网络会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于主动推送。
3、手工提交:一次性提交链接给网络,可以使用此种方式。
方法五:利用JS加密网页内容
这个方法是在个别网站上看到的,非常暴力。缺点:搜索引擎爬虫无法识别收录和通杀所有采集器,针对极度讨厌搜索引擎和采集器的网站的站长使用,量力而行,您能豁出去了,别人也就没办法采集你了。
方法六:网站随机采用不同模版
分析:因为采集器是根据网页结构来定位所需要的内容,一旦先后两次模版更换,采集规则就失效,不错。而且这样对搜索引擎爬虫没影响。
适用网站:动态网站,并且不考虑用户体验。
采集器会怎么做:一个网站模版不可能多于10个吧,每个模版弄一个规则就行了,不同模版采用不同采集规则。如果多于10个模版了,既然目标网站都那么费劲的更换模版,成全他,撤。
方法七:利用脚本语言做分页(隐藏分页)
分析:还是那句,搜索引擎爬虫不会针对各种网站的隐藏分页进行分析,这影响搜索引擎对其收录。但是,采集者在编写采集规则时,要分析目标网页代码,懂点脚本知识的人,就会知道分页的真实链接地址。
适用网站:对搜索引擎依赖度不高的网站,还有,采集你的人不懂脚本知识。
采集器会怎么做:应该说采集者会怎么做,他反正都要分析你的网页代码,顺便分析你的分页脚本,花不了多少额外时间。
方法八:限制IP地址单位时间的访问次数
分析:没有哪个常人一秒钟内能访问相同网站5次,除非是程序访问,而有这种喜好的,就剩下搜索引擎爬虫和讨厌的采集器了。
弊端:一刀切,这同样会阻止搜索引擎对网站的收录。
适用网站:不太依靠搜索引擎的网站。
采集器会怎么做:减少单位时间的访问次数,减低采集效率。
希望可以帮到你!
Ⅱ 禁止复制网页数据如何复制
方法一(复制源代码)
1、我们打开需要复制内容的页面。然后点击浏览器左上角的查看-源文件!!(这里用ie8做演示!)
Ⅲ 如何强制复制网站中禁止复制网页文字的方法
我们在浏览网页的时候,经常会遇到一些重要的信息文字被网站屏蔽而不能复制而烦恼,下面我简单介绍几种最常用的强制复制的方法。而其中的第一种方法最为简单而且相当实用,它能够广泛应用于大多数的网页。如果第一种方法不能强制复制,那么你就要尝试使用另外几种方法。具体方法如下:
1、选择网页 “文件” 按钮中的——“另存为”,把“保存类型”改为“文本文件(*.TXT)”,把网页另存为文本文件,然后删掉里面不需要的内容,然后再复制文字到WORD或WPS进行编辑。如果没有安装OFFFICEL WORD字处理软件也可以用记事本编辑。这样一切就搞定了
2、启动IE浏览器后,用鼠标点击“工具”中的Internet“选项”菜单,选择“安全”选项卡,接下来点击“自定义级别”按钮,在弹出的窗口中将所有脚本全部选择禁用,确定。然后按F5刷新页面,这时我们就能够对网页的内容进行复制、粘贴等操作。当你收集到自己需要的内容后,再用相同步骤给网页脚本解禁,这样就不会影响到我们浏览其他网页了。你或者选文件另存,格式为TXT,然后排版也可以。
3、左键限制,不让拖动,无法选择内容,怎么办,简单,点右键,点查看源文件,将之前的东东全部DEL,点另存为*。HTM,打开,是不是可以拖了
4、点右键查看 ----原文件----使用替换法把也替换成空格,再保存为htm格式的文件,注意在文件名两头要加上英文字符的"",或在保存类型下拉列表里选择“所有类型”,文件名样例"001.htm"或者直接在你的IE中选择“文件”的“保存”或“另存”
5、把该事件的JavaScript处理代码去掉即可。以微软的IE浏览器为例,具体处理过程如下:点击“查看→源文件”(当主页文本小于64k字节时,自动调用记事本程序打开;否则,用写字板程序打开),寻找语句, 语句类似。将其中的onselectstart="return?false"子句删除。将此删除后的源文件,另存为一文本文件。然后用将此文本文件名的后缀改名为“.htm”。最后用IE浏览器打开此文件。就可以用复制、粘贴的方法将所需的内容按用户所需的格式保存起来了。
6、如果只为了保存文字以备以后查阅,最简单快速的方法是另存为“Web页,仅HTML”类型。选‘文件’菜单中的‘另存为’命令,然后鼠标点击‘保存类型’方框右边的小三角,选第三种‘Web页,仅HTML’类型,在‘保存在’方框处选择要存放的位置,然后选‘保存’按钮即将该网页保存到你的电脑里。(不过这种保存的缺点是只保存文字,没有图片) 注意:这种保存后的网页只是便于收藏和查看,网页内容还是不能复制,如果要复制文字内容,还是要提高浏览器的安全级别后才能复制。 7、对网页禁止复制和屏蔽右键的通用破解方法:小工具――超星图书浏览器!安装上软件后在需要复制的页面上点右键,会出现“导出当前页到超星图书浏览器”,然后会通过这个工具打开页面,此时无论操作都可以!右键菜单全出来了!方法很简单!需要复制页面的。
7、对网页禁止复制和屏蔽右键的通用破解方法:小工具――超星图书浏览器!安装上软件后在需要复制的页面上点右键,会出现“导出当前页到超星图书浏览器”,然后会通过这个工具打开页面,此时无论操作都可以!右键菜单全出来了!方法很简单!需要复制页面的。
还有:第一步:打开你想要复制的那个网站第二步:将该网页另存到你的电脑上(文件|另存为)第三步:用记事本打开你刚保存的网页,找到body onselectstart = "return false"; onpaste="return false" 这段代码(不一定完全是这样的),你把里面的代码(除body)全部删除,最后就剩body,保存文件。第四步:双击刚保存的文件,也就打开保存的那张网页。