首页出版说明中文期刊中文图书环宇英文官网付款页面

大数据背景下文档关键词抽取方法的探讨

孟 晓燕, 赵 卫红
青岛黄海学院 山东青岛 266427

摘要


关键词抽取是借用计算机从文档中选择出能够反映主题内容的词,提供一个简短的内容摘要,便于用户获取文档信息。在当今大数据时代,在文本处理的许多领域,关键词抽取都是一项重要技术。选取关键词的目的是运用关键词最大限度反映出文档内容,研究从文档集中选取关键词的方法。本文通过引入能够与文档相关程度的指标 (分数),建立出 的数学模型,给出文档关键词抽取方法。

关键词


抽取;TextRank算法;多文档 ;聚类

全文:

PDF


参考


[1]周锦章,崔晓辉.基于词向量与TextRank的关键词提取方法.计算机应用研究[J/OL],2019,36(5). [2018-03-09] [2]罗燕,赵书良,李晓超等.基于词频统计的文本关键词提取方法[J] 计算机应用.2016,36(3):718-725. [3]门家乐.基于TextRank的关键词提取算法. 探索与观察.


Refbacks

  • 当前没有refback。