Tian14267 / Text_Keywords Public

Notifications You must be signed in to change notification settings
Fork 1
Star 5

基于TF-IDF 与 TextRank 融合算法的文本关键词识别

5 stars 1 fork Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
data		data
Keywords_Algorithm.py		Keywords_Algorithm.py
Keywords_main_MutilSentence.py		Keywords_main_MutilSentence.py
Keywords_main_SingleSentence.py		Keywords_main_SingleSentence.py
README.md		README.md
keywords_tools.py		keywords_tools.py

Repository files navigation

Text_Keywords

功能实现

完成对文本的关键词提取。所用算法：基于TF-IDF 与 TextRank 融合算法
融合算法主要包括三种，分别是：归一化、权值相加以及权值交叉。可以自行选择和设置。
Keywords_main_MutilSentence.py 为读取所有文件并生成关键词；Keywords_main_SingleSentence.py 为读取单个文本内容并提取出关键词。Keywords_Algorithm.py 为所用到的算法；

注意

IDF算法需要提前根据自己的数据集制作IDF文件。可以通过运行keywords_tools.py文件进行制作，但需要修改为自己的数据，具体可以打开./data/dict_idf.json进行查看。

About

基于TF-IDF 与 TextRank 融合算法的文本关键词识别

python

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%