大数据背景下文档关键词抽取方法的探讨
摘要
关键词抽取是借用计算机从文档中选择出能够反映主题内容的词,提供一个简短的内容摘要,便于用户获取文档信息。在当今大数据时代,在文本处理的许多领域,关键词抽取都是一项重要技术。选取关键词的目的是运用关键词最大限度反映出文档内容,研究从文档集中选取关键词的方法。本文通过引入能够与文档相关程度的指标 (分数),建立出 的数学模型,给出文档关键词抽取方法。
关键词
抽取;TextRank算法;多文档 ;聚类
全文:
PDF参考
[1]周锦章,崔晓辉.基于词向量与TextRank的关键词提取方法.计算机应用研究[J/OL],2019,36(5). [2018-03-09] [2]罗燕,赵书良,李晓超等.基于词频统计的文本关键词提取方法[J] 计算机应用.2016,36(3):718-725. [3]门家乐.基于TextRank的关键词提取算法. 探索与观察.
Refbacks
- 当前没有refback。