优秀研究生学位论文题录展示

基于用户本体模型的文本信息过滤方法研究

专 业: 计算机软件与理论
关键词: 文本过滤 用户本体模型 评价指标 语义相关度 网络教学
分类号: TP301
形 态: 共 58 页 约 37,990 个字 约 1.817 M内容
阅 读: 全文阅读说明

内容摘要


随着互联网的发展,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义。

传统的文本过滤方法,如基于统计的向量空间模型方法和概率模型方法,速度快,可实现性好,但由于这些方法缺乏语义理解能力,从而使过滤效果难以满足日益复杂的用户需求。

目前的研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不好。

为了使机器更好地理解用户需求和文本内容,提高文本过滤的准确率和召回率,本文提出了基于用户本体模型(User Ontology Model,UOM)的文本信息过滤模型。

该方法主要包括UOM构建、文本结构分析、信息匹配和语义相关度计算等。

基于UOM的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高。

通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效的为用户提供过滤服务。

本文的主要研究工作有以下几点:

首先,本文给出了过滤技术的历史与现状,给出了文本信息过滤中的关键技术,包括文本信息过滤的含义、基本结构与流程、常用的信息过滤模型、过滤系统的分类、评价指标、以及中文文本过滤中常用的分词理论。

其次,本文介绍了用户需求的表示和获取、本体的相关理论和技术,在此基础上提出了基于UOM的用户需求模型,详细描述了UOM的形式化描述方法和构建过程。

再次,本文提出了基于UOM的文本信息过滤模型,给出了文本结构分析及文本与UOM匹配算法、语义相关度的计算等。

最后,本文将以上研究成果运用到实际应用中,设计并实现了基于UOM的文本信息过滤系统--网络教学资源的智能按需服务系统..……

全文目录


文摘
英文文摘
第一章 绪论
1.1信息检索和信息过滤
1.2过滤技术的历史与现状
1.3主要研究内容
1.4本文组织结构
第二章 文本信息过滤的关键技术
2.1文本信息过滤系统
2.1.1文本信息过滤的含义
2.1.2文本信息过滤系统基本结构与流程
2.2文本信息过滤技术
2.2.1信息过滤与信息检索的关系
2.2.2常用的信息过滤模型
2.2.3信息过滤系统的分类
2.2.4信息过滤系统的评价指标
2.3分词理论
2.3.1中文分词的重要性及其主要指标
2.3.2中文分词的问题
2.3.3中文分词的主要方法
2.4本章小结
第三章 文本信息过滤中的用户需求模型
3.1用户需求模型
3.1.1用户需求表示方法
3.1.2用户需求的获取
3.2本体的相关理论和技术
3.2.1本体的基本概念
3.2.2本体的建模元语
3.2.3本体的描述语言
3.2.4本体的构建标准及过程
3.2.5现有的知识本体及分类
3.3UOM的构建方法研究
3.2.1UOM的形式化描述方法
3.3.2UOM的构建过程
3.4本章小结
第四章 基于UOM的文本信息过滤模型
4.1基于UOM的文本信息过滤模型
4.2文本结构分析及信息匹配
4.3语义相关度计算
4.3.1实例概念关联度计算
4.3.2文本相似度计算
4.4本章小结
第五章 基于UOM的文本信息过滤系统设计与实现
5.1系统实现环境
5.2系统总体框架
5.3主要模块的实现方案
5.3.1文本预处理模块
5.3.2UOM解析模块
5.3.3信息匹配模块
5.3.4语义相关度计算模块
5.3.5文本输出模块
5.4实验结果与分析
5.5本章小结
第六章 结论与展望
6.1结论
6.2展望
参考文献

相似论文

  1. 基于半环代数理论的有限自动机的探讨,56 页,TP301.1 TP301.6
  2. 基于LWOWA算子和文字计算的群组决策方法,57 页,TP301.6
  3. 差异演化算法及其应用研究,103页,TP301.6
  4. 区间值模糊集上的广义粗糙近似算子构造研究,55 页,TP301.6
  5. 微粒群算法在动态优化中的应用研究,52 页,TP301.6 O224
  6. 基于语言偏好关系多目标群组决策的研究与应用,64 页,TP301.6
  7. 智能算法在数字音频水印中的应用研究,78 页,TP301.6 TP391.4
  8. 网络数学公式转换的研究与实现,60页,TP301.6 TP312
  9. 粒子群与差分进化混合算法的研究,64页,TP301.6
  10. 嵌入模糊部件的数值图规划,54页,TP301
  11. 基于均值机群动态负载平衡系统的设计与实现,89页,TP301
  12. 遗传算法的种群退化分析及其抑制技术,63页,TP301
  13. 基于关联规则的审计特征智能提取的应用研究,69页,TP301
  14. 带实时的传值与移动系统研究,171页,TP301
  15. 基于孤立点的数据挖掘研究及其在计算机审计系统中的应用,68页,TP301
  16. 一种基于组件的Web应用建模方法,57页,TP301
  17. 开放网格服务体系结构的研究与应用开发,77页,TP301
  18. 鲁棒灰箱演算的类型系统和代数性质研究,123页,TP301
  19. 基于发展心理学的概念获取与表征研究,58页,TP301
  20. 使用SP-MEC算法求解多目标问题,81页,TP301
中图分类: > TP301 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法

© 2012 book.hzu.edu.cn