百度云离线下载含有违规内容检測方法分析
近期国家開始一轮净网行动,清除网上的淫秽色情信息。各大互联网厂家纷纷開始行动,比方当年非常好用的百度云离线下载就一度关闭。后来再次开启后,就出现了这句经典词。因含有违规内容被屏蔽无法下载。
事实上被屏蔽的不一定都是不健康视频,有些不过由于文件名称含有一些字眼而已,比方一些美国大片的枪版就差点儿都不能通过百度云的离线下载检測。据说这样的方法还在迅雷等地方都有检測。因此我们来分析一下,这个检測究竟是怎样进行的。
首先上传了一个BT文件,BT文件中面的内容为大闹天宫的电影,可是我把文件名称改成了含有敏感词汇的文件名称,图片就不上传了,百度云果断的提示我,因含有违规内容不予下载。
可是我的种子明明是大闹天宫嘛,莫非孙悟空也成了敏感内容?呵呵,无语。以下我们再把种子文件名称改回来。改成大闹天宫,上传完成后果断成功,非常嗨皮。
从这里我们能否够说明,百度云的检測就是简单的基于文件名称的检測?回答是否定的。百度那么牛逼的互联网公司。怎么可能只使用那么小儿科的方法进行屏蔽,那样岂不是改改文件名称就能够轻易的唬过去了?我们来做个试验。
我找了一个不健康种子測试一下,文件名称打乱为一堆数字和字母的混合,发现百度云无情的提示我,含有违规内容。这里能够证明,百度云还会认真的读取种子内的文件的。挨个文件盘查文件名称。
要想绕过这个,网上貌似有人说了能够使用BEncode Editor进行编辑种子文件。可是经过试验。成功率并不高,并且这个软件属于高科技,使用起来好高端,全然不接地气。只是改动种子内部的參数貌似科技含量挺高,在某博客看到了一个站点
http://www.bteditor.com,非常完美的实现了对BT文件内部信息的改动。
经过我測试了几个,全然能够过屏蔽。
可是貌似一些种子文件即使过了屏蔽也是无法离线的,并且貌似经过清洗后。种子的hash code变化了,导致云盘进行文件hash认证的时候找不到原来的资源信息,导致一些种子还是依旧无法下载。
另一些trackerserver貌似也挂掉了,这种原因貌似都能够导致资源无法获取,貌似还是非常复杂的。
下一篇准备研究一下磁力链接的获取,堪称BT2.0的应该会比单纯的种子好非常多。