维普论文检测系统检测样例:
第四章系统管理平台设计与实现
系统管理平台是针对根据Nutch的农业笔直搜索引擎规划的用于管理搜索引擎的一个东西。该渠道首要集成了农业范畴本体库、根据Nutch的农业笔直搜索引擎、农业信息检索效劳等。本章首要针对体系需求、体系结构以及体系功用进行剖析,最终进行体系测验和点评。
4.1系统管理平台分析与设计
4.1.1系统需求分析
根据Nutch的农业笔直搜索引擎是国家“十二五”乡村范畴国家科技方案课题《西部旱区农业物联信息效劳渠道》中《农业信息效劳联盟》的一个子使命中的一个模块部分。因而,根据Nutch的农业笔直搜索引擎体系办理渠道的规划与完成的使命性很清晰,该渠道的首要意图是便利对根据Nutch的农业笔直搜索引擎的运用和办理。
本研讨结合项目布景和根据Nutch的农业笔直搜索引擎办理需求,剖析与规划了体系办理渠道。其功用需求可以简略总结为几个方面,如下所示:
(1)农业范畴本体库管理
根据Nutch的农业笔直搜索引擎结合农业范畴本体库在智能语义层次上完成主题相关性判别、成果排序、查询扩展等功用。因而,为了便利农业范畴本体库的运用和更新,本研讨树立体系办理渠道可以很方面的办理农业范畴本体库。农业范畴本体库的办理首要是对农业范畴概念和概念间联系的办理,其间农业范畴概念办理首要包含选用Web信息抽取技能获取农业范畴资源的办理、选用中文分词技能进行中文分词及标签清洗等操刁难农业范畴资源进行数据清洗的办理以及选用TF-IDF进行相关度判别的办理,概念间联系办理首要包含选用相关分析对农业范畴概念的剖析办理、选用Jaccard系数进行相关性核算的办理、选用余弦函数进行类似度核算的管理、选用K-means聚类进行聚类的办理以及生成农业范畴本体库的管理。
(2)搜索引擎管理
本研讨最中心的意图是根据Nutch开源搜索引擎开发农业笔直搜索引擎,它与传统搜索引擎的最大区别是添加了主题相关性判别。为了能更好的显现本研讨构建的根据Nutch的农业笔直搜索引擎具有传统搜索引擎所不具有的“专、精、深”特色,因而本研讨搜索引擎选用人工手动调整和主动调整两种方法调整主题相关度阈值,主题相关性判别阈值在系统管理平台的相关度阈值设置模块根据需要进行调整。除此之外,为了方面系统管理员更新索引库,根据Nutch的农业笔直搜索引擎在运用网络爬虫爬取网页前,经过系统管理平台的索引库树立模块别离设定爬取的层数和设置线程个数,进行资源爬取和信息过滤,最终树立索引库,为用户检索效劳。
(3)农业信息检索效劳管理
为了便利用户检索农业范畴相关信息,本研讨在供给根据Nutch的农业笔直搜索引擎检索农业信息的同时,供给一个农业网址导航效劳网站。对根据Nutch的农业笔直搜索引擎的检索效劳,本体系办理渠道供给两种检索接口方法,一种是网页版的检索接口,另一种单机版的检索接口,便利用户检索农业范畴相关信息;农业网址导航效劳网站首要是向用户分类供给一些常用闻名网站的URL链接,同时向用户供给多种搜索引擎检索效劳接口,这样不仅可以便利用户运用搜索引擎,还可以便利用户进行不同搜索引擎检索成果的对比。
4.1.2系统体系结构
根据系统管理渠道需求分析,可以将体系办理渠道划分为三个层次农业范畴本体库办理层、搜索引擎索引库办理层、用户检索接口层。体系渠道在完成过程中,根据体系功用需求又可将其分解为更多个子模块。根据Nutch的农业笔直搜索引擎体系办管理渠道的整体架构。
(1)农业范畴本体库管理层
根据Nutch的农业笔直搜索引擎在完成主题过滤、成果排序、用户检索扩展等功用上都是根据语义层次上完成的,其实质是结合农业范畴本体库进行完成的。农业范畴本体库的办理首要包含农业范畴概念的获取和发现概念间的联系,其间农业范畴概念的获取选用Web信息抽取技能获取农业范畴资源作为语料库,选用中文分词等技能对资源进行分词、数据清洗等操作,结合农业范畴词典对清洗后的数据进行农业相关度判别获取农业范畴概念;发现概念间联系选用根据共现的相关剖析对农业范畴概念进行剖析,选用Jaccard系数、余弦函数等公示对其进行相关度剖析,选用聚类技能对其进行聚类发现概念间联系。最终,将农业范畴概念和其概念间联系以必定方式存储,本研讨将其存入MySQL数据库,构成农业范畴本体库,为后续研讨做准备。
维普论文检测系统文章欢迎转载,转载请以链接方式标明本文地址。