LDA-based-on-partition-PLDA-

所属分类:特征抽取
开发工具:Python
文件大小:16KB
下载次数:0
上传日期:2019-07-08 05:34:29
上 传 者sh-1993
说明:  提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进...
(A partition based LDA topic model (PLDA) is proposed. To improve the traditional LDA model, considering that the text structure of medium and long documents is relatively clear, the traditional LDA cannot identify the theme of each chapter when processing medium and long documents, propose the LDA topic model based on division, and proceed according to paragraphs for medium and long documents such as news reports] work reports of the State Council)

文件列表:
VSM (0, 2019-07-08)
VSM\result_valuate.py (1862, 2019-07-08)
VSM\vsm_tfidf.py (2093, 2019-07-08)
doc2vec (0, 2019-07-08)
doc2vec\doc2vec.py (1978, 2019-07-08)
doc2vec\result_valuate.py (1862, 2019-07-08)
分段LDA (0, 2019-07-08)
分段LDA\cacl_PLDA.py (3804, 2019-07-08)
分段LDA\cacl_partlda使用tfidf.py (3590, 2019-07-08)
分段LDA\result_valuate.py (1862, 2019-07-08)
分段LDA\testxlrd.py (998, 2019-07-08)
分段LDA\testxlrd全部适用.py (1104, 2019-07-08)
ԭʼLDA (0, 2019-07-08)
原始LDA\lda gensim1207不使用tfidf.py (2108, 2019-07-08)
原始LDA\lda gensim使用tfidf.py (2118, 2019-07-08)
ԭʼLDA\merge.py (1450, 2019-07-08)
ԭʼLDA\result_valuate.py (1862, 2019-07-08)
原始LDA\testxlrd仅针对sougou数据库.py (998, 2019-07-08)
原始LDA\testxlrd全部适用.py (1104, 2019-07-08)

# LDA-based-on-partition-PLDA 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道、国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA、LSI及doc2vec进行比较。基于Sougou和Fudan语料库的分类实验验证了PLDA效果最优。 论文被 Annals of Data science 录用。

近期下载者

相关文件


收藏者