基于多Agent的垃圾邮件过滤系统的研究
随着 Internet 的普及,电子邮件(E-mail)已经成为人们之间相互通信的重要工具,但是垃圾邮件问题也日益严峻。针对垃圾邮件的处理,有人提出通过立法、修改 SMTP 协议或者经济利益等方式来解决[1],但应用比较广泛的还是垃圾邮件过滤技术。目前采用的垃圾邮件过滤技术主要包括:基于黑、白名单过滤[2]、反向DNS查询、基于
由于单个 Agent 的知识、信息和资源是有限的,所以可以将多个具有不同功能的单 Agent 组合在一起构成一个多 Agent 系统 MAS。由于多 Agent系统的分布性、协作性适合于垃圾邮件的检测,所以可以将Multi-Agent技术应用于垃圾邮件检测[5]。
本文基于多 Agent 技术结合各种垃圾邮件过滤技术(黑名单、白名单、反向 DNS 查询、
1 垃圾邮件过滤技术介绍
1.1 基于黑名单的过滤
黑名单技术[2]的原理是确定已知垃圾邮件制造者及其ISP的域名或IP地址,然后将其整理成黑名单。邮件过滤系统拒绝任何来自黑名单上垃圾邮件制造者的邮件。黑名单技术可以有效降低服务器的负担。但是,垃圾邮件发送者很容易通过不同的IP地址来制造垃圾邮件,所以黑名单技术对于通过不断的更改 IP 地址的垃圾邮件就无能为力。
1.2 基于白名单的过滤
白名单技术[2]与黑名单技术相反,在邮件过滤系统中维护一张白名单表,其中收录了用户认可的邮件地址。用户只接收来自白名单中邮件帐户发送的邮件,这种方法能有效的过滤垃圾邮件,但是对那些发件人地址不存在于用户白名单中的合法邮件也将被直接过滤掉。所以白名单过滤方法一般要和其它的过滤方法结合使用。
1.3 反向 DNS 查询
垃圾邮件制造者为了欺骗过滤软件和收信人,常常会在发信人栏窜改域名隐蔽自己的身份,从而表现为一个合法的身份。反向 DNS 查询技术可以根据发信人真实的 IP 通过 DNS 服务器反向解析,获得该发信人的域名。如果根据 IP 通过 DNS 反向解析的域名与邮件中自我声称的域名不一致,则认为该邮件是垃圾邮件。但是这种技术不适用于没有窜改域名的垃圾邮件。
1.4
1.5 基于朴素贝叶斯算法过滤
朴素贝叶斯分类算法[2-4]是一种基于概率统计的机器学习方法,它把邮件看成是一个分类(合法邮件和垃圾邮件)问题。首先要收集大量的合法邮件和垃圾邮件作为邮件样本,然后使用朴素贝叶斯过滤器对邮件样本进行有指导学习,最后通过训练好的朴素贝叶斯过滤器对新邮件进行过滤。朴素贝叶斯过滤器可以自动学习合法邮件和垃圾邮件的特征,而且可以根据用户的选择进行个性化过滤。
相关文章
- 2023-11-03MSP430单片机在新型智能水表开发中的应用
- 2023-10-30智能化仪器监控程序的结构设计
- 2024-05-21再谈智能高速在线涡流探伤系统的研发
- 2024-08-15浅谈风机机座上两轴承孔同轴度偏差过大的修正
- 2024-08-28多功能形位误差测量系统的研制与应用
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。