∝ 08 现在的位置:首页 > 期刊导读 > 2018 > 08 >

基于MapReduce的增量式全文Lucene引擎并行检索

作者: 刘永花 [1] 杨丽娜 [2] 王静宇 [3]

关键词: Lucene检索 MapReduce并行 增量索引 大数据

摘要:

为提高 Lucene 针对大数据的检索效率,提出基于 MapReduce 的增量式全文Lucene 引擎并行检索方法.首先,对 Lucene 索引原理结构进行研究,并基于增量索引改进、提高缓冲区索引容量以及降低磁盘文件索引书写频率,实现索引创建效率提高的效果;其次,针对单进程 Lucene 索引效率提升有限的情况,基于 Hadoop 框架下并行MapReduce 计算模块,构建并行 Lucene 全文检索引擎,实现大数据检索的并行化执行;最后,通过构建大数据全文检索仿真环境,显示所提并行检索方式相对单一进程检索方式,可大幅提升检索精度和执行效率.

上一篇: 融合内容和改进协同过滤的个性化推荐算法
下一篇: 含光伏发电系统的冷库多目标优化运行研究

版权所有《控制工程》编辑部 copyright © 2005-2012
地址:沈阳市东北大学310信箱 邮政编码:110004  辽ICP备05001360号