咨询热线:13080701712
返回
沈宇资讯
加强摄像头干扰器对脚本的过滤管理
由于互联网的发展,互联网用户的年龄逐渐下降。 2010年6月在英国进行的一项社会调查显示,大约有1/3的儿童在10岁之前浏览了灰色网站。许多欧洲国家已经制定了相关法律法规来过滤灰色网站[1]。例如,荷兰政府通过了一项法律,授权警察具有过滤灰色网站的相关权利。但是,在加强摄像头干扰器对灰色网站的过滤时,通常会导致过度阻塞的问题。因此,使用适当的过滤软件和技术已经成为当前的主要问题。
当前,在互联网上传播的灰色信息以文本,图片和监控屏蔽器视频的形式出现。灰色信息将把耸人听闻的感觉带入年轻人的脑海。同时,在性格和人格修养期,灰色材料的刺激性,挑衅性的词语,图片和录像带可能会导致性别观念的异常。更严重的是,它可能导致严重的性骚扰,未成年人强奸,堕胎,传染病以及其他社会问题。结果,这个问题引起了全世界家庭和政府的关注[1]-[3]。在线灰色信息可以通过世界上的任何计算机进行传播。世界各地的政府应该对Web内容进行分类和管理。万维网联盟(W3C)提出了Internet内容选择平台(PICS)作为摄像头屏蔽器网络分类标准系统(http://www.w3.org/PICS/)。市场上有很多关于过滤软件和商业化黑名单数据库的研究[4],[5]。此外,还有一些不适当的内容阻止和过滤软件供用户下载。但是,面对Internet的快速变化,如何有效地更新和提高过滤精度已成为值得讨论的问题。近年来,随着数据挖掘技术的发展,学者们应用各种机器学习方法成功过滤了灰色网页,这些机器学习方法包括:朴素贝叶斯[6],支持向量机[SVM] [7]和决策树[ 8];使用自然语言作为过滤器的方法包括神经网络[9],K近邻[10]。当前常见的网页过滤和分析方法包括关键字匹配[11],统一监控干扰器资源定位器阻止(URL阻止)[12],[13]和图像分析[14]-[17]。
但是,过去提出的这些灰色网页过滤方法具有不足之处。在关键字过滤中,对于给定的关键字数据库,通常将频率较高的关键字存储在关键字数据库中。由于关键字过滤的主要问题是确定语义和出现次数,因此仅使用关键字进行过滤的准确性受到质疑和怀疑。 URL分析基于URL的来源和描述。灰色网站的URL可能包含“ SE”或“ POR”的分词。但是,许多灰色网站的网址通常由不相关的字词或随机数组成。因此,使用网站URL进行过滤的效果非常有限。当前大多数与URL相关的研究都建议建立白名单和黑名单,包括阻止列表中的URL。允许使用白名单上的URL。这种方法的缺点是维护和更新URL列表以保持过滤系统的准确率需要花费大量成本[18]。网页图像分析是根据图片的颜色分布,形状和矢量图确定图片是否为灰色图片。过滤方法的问题是缺乏准确性,并且将花费大量时间。朴素贝叶斯的独立假设太简单了,无法与实际环境保持一致[19]。在数据挖掘机器学习方法中,摄像头干扰器决策树技术的问题在于决策树的增长过程不适用于流数据。为了解决这个问题,学者们使用了概念漂移的数据挖掘方法[8]。通过使用这种技能,即使数据的内容也会随时间变化,决策树也可以加强学习以解决上述问题。