优秀研究生学位论文题录展示

结合规则过滤和内容过滤的综合型反垃圾邮件系统的研究与实现

专 业: 软件工程
关键词: 计算机网络 网络管理 邮件过滤 软件工具
分类号: TP393.07  TP311.56
形 态: 共 54 页 约 35,370 个字 约 1.692 M内容
阅 读: 全文阅读说明

内容摘要


随着国际互联网Internet的发展和普及,电子邮件已经成为人们日常生活中不可缺少的通信手段之一。

但电子邮件给人们带来极大便利的同时,也日益显示出其负面影响,那就是我们每天收到的邮件中有很大一部分是垃圾邮件。

面临着垃圾邮件问题日益严重的现状,人们开始从多方面寻找解决方法。

目前,常用的垃圾邮件过滤方法有两个:

基于规则的过滤方法和基于贝叶斯理论的内容过滤方法。

其中,基于规则的过滤方法比较简单,系统会采用黑、白名单,发送者验证、接收者验证、速率控制、策略控制等多种方法进行过滤。

相比而言,基于贝叶斯理论的内容过滤方法则比较复杂。

它的处理流程如下:

当处理一封邮件时,系统首先会对这封邮件应用各项内容规则,而每条规则对应一个权重(此权重可正,可负),每封邮件的总权重就是所匹配规则的权重之和。

如果总权重为负,则表示这封邮件被判定为“正常邮件”,然后按照正常邮件的处理方式进行处理,默认处理方式是将邮件投递到用户的收件箱或者投递到用户的自定义文件夹中。

相反,如果总权重为正,则表示这封邮件为“疑似垃圾邮件”,将会按照疑似垃圾邮件的处理方式进行处理。

默认处理方式是将邮件投递到用户的垃圾邮件箱中。

如果某封邮件的总权重超过了预定的阈值,过滤器就会将它判定为“垃圾邮件”,并直接抛弃,不做投递。

这种处理方法的好处是即使有些规则不够完美,但是当与所有其它规则的判定结果结合使用时,在判定过程中,就能够起到很有效的作用。

本文研究并实现了一个结合了基于规则的垃圾邮件过滤方法与基于内容的垃圾邮件过滤方法的综合型反垃圾邮件系统。

实验结果表明,本文所研究与实现的综合型反垃圾邮件系统,垃圾邮件识别率可以达到92%以上,而且误判率为零。

广东某电信部门的电子邮件系统拥有30万用户,于2008年3月第一次投入使用了本文所设计的邮件过滤系统。

在两个月的试运行过程中,抽样检测的结果为:

垃圾邮件拦截率达到98.3%,并且误判率为零..……

全文目录


摘要

1 引言
1.1 背景
1.2 本文的内容安排
2 电子邮件基本原理
2.1 基本概念
2.1.1 邮件服务器
2.1.2 邮件客户端软件
2.1.3 邮件传输协议
2.2 DNS与主机名
2.2.1 面临的问题
2.2.2 DNS
2.2.3 主机名
2.2.4 DNS服务器
2.2.5 正向解析和反向解析
2.2.6 DNS的基本应用
2.3 域名管理与域名的解析原理
2.3.1 DNS域
2.3.2 DNS域的管理
2.3.3 域名的解析原理
2.4 电子邮件的工作原理
2.5 本章总结
3 常见垃圾邮件过滤技术
3.1 基于规则的过滤方法
3.1.1 黑名单和白名单
3.1.2 发送者验证
3.1.3 接收者验证
3.1.4 速率控制
3.1.5 IP地址信誉评价
3.1.6 策略控制
3.1.7 实时意图分析
3.1.8 图像分析
3.2 基于内容的反垃圾邮件过滤技术
3.2.1 贝叶斯定理
3.2.2 贝叶斯理论的应用
3.2.3 基于贝叶斯理论的垃圾邮件过滤技术
3.2.4 贝叶斯理论的学习功能
3.2.5 基于贝叶斯理论过滤垃圾邮件的特点
3.3 中文分词技术
3.3.1 正向最大匹配法
3.3.2 逆向最大匹配法
3.3.3 双向匹配法
3.4 分词中的难题
3.4.1 歧义识别
3.4.2 新词识别
3.5 贝叶斯过滤效果
3.5.1 电子邮件语料
3.5.2 评价指标
3.5.3 贝叶斯理论在PU1语料上的实验
3.5.4 实验结果比较分析
3.6 本章总结
4 基于规则与基于内容过滤方法的结合应用
4.1 基于规则过滤垃圾邮件的不足
4.2 基于贝叶斯理论过滤垃圾邮件的不足
4.3 两种过滤方式的结合应用
4.3.1 综合型垃圾邮件过滤系统的架构
4.3.2 一点攻击,全局防御
4.3.3 三种过滤方法的比较
4.4 项目应用
4.5 本章总结
5 总结
参考文献
附录A
索引

相似论文

  1. 基于EXT和AJAX的富客户端合同管理系统的设计与实现,71 页,TP393.07 TP368.5
  2. 基于P2P流信息的图形化分析系统的设计与实现,60 页,TP393.07 TP391.41
  3. 基于工作流技术的网络办公系统的设计,55 页,TP393.07 TP317.1
  4. 门户网站内容管理系统的研究与开发,75 页,TP393.07 TP311.131
  5. 网关条件下数据流统计工具的分析与实现,64 页,TP393.07 TP311.56
  6. 面向互联网的视频监控系统的设计与实现,74 页,TP393.07 TP391.41
  7. 面向园区网络管理系统的设计与实现,66 页,TP393.07 TP393.18
  8. 基于行为的网格化客群细分方法研究及软件实现,62 页,TP393.07 F713.36
  9. 基于轻量级Java EE开源框架的网络实验管理系统的设计与实现,76 页,TP393.07 TP312
  10. 基于无线射频识别技术的展馆信息系统开发,54 页,TP391.44 G265
  11. 分布式协同项目综合管理系统的设计与实现,75页,TP393.09
  12. 住宅户型平面生成系统,93页,TP393.09
  13. 通用导弹遥测数据处理平台的研究及应用,56页,TP393.09
  14. 基于语义网的E-Learning个性化服务系统研究与实现,68页,TP393.09
  15. 基于知识的软件质量改进技术研究与应用,72页,TP393.09
  16. 非结构化信息处理平台中的基于角色的访问控制框架设计与实现,55页,TP393.08 TP311.56
  17. 基于网络多核处理器的入侵防御系统的设计与实现,72 页,TP393.0
  18. 基于Linux多路嵌入式控制系统的实时通信,71页,TP393.09
  19. 基于构件化SOA证券网站的设计与实现,73 页,TP393.02 F830.91
  20. 动作识别技术在移动通讯终端设备中的应用,61页,TP393.09
中图分类: > TP393.07 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络
其他分类: > TP311.56 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程

© 2012 book.hzu.edu.cn