NLP

所属分类:人工智能/神经网络/深度学习
开发工具:Visual C++
文件大小:9771KB
下载次数:71
上传日期:2015-01-19 20:30:28
上 传 者jianghh123
说明:  中文文本情感分类。上课的课程作业,本着服务大家的思想上传,包括实验代码,实验数据,实验ppt以及实验报告。非常详细。。。。
(Chinese text sentiment classification. Course work in class, in the service of everyone' s thoughts upload, including experimental code, test data, test and lab reports ppt. Very detailed. . . .)

文件列表:
实验结果\result_book (6400, 2015-01-04)
实验结果\result_dvd (6000, 2015-01-04)
实验结果\result_music (6800, 2015-01-04)
源代码\NLPProject\CommentText.cpp (3473, 2015-01-04)
源代码\NLPProject\CommentText.h (1598, 2014-12-23)
源代码\NLPProject\Data\BigramDict.dct (7544244, 2002-09-13)
源代码\NLPProject\Data\coreDict.dct (1565689, 2002-09-13)
源代码\NLPProject\Data\lexical.ctx (10412, 2002-09-13)
源代码\NLPProject\Data\nr.ctx (1032, 2002-09-13)
源代码\NLPProject\Data\nr.dct (113780, 2002-09-13)
源代码\NLPProject\Data\ns.ctx (408, 2002-09-13)
源代码\NLPProject\Data\ns.dct (54278, 2002-09-13)
源代码\NLPProject\Data\StopWords.txt (7041, 2010-04-28)
源代码\NLPProject\Data\tr.ctx (408, 2002-09-13)
源代码\NLPProject\Data\tr.dct (64000, 2002-09-13)
源代码\NLPProject\Dataset\CSC_book_test (125654, 2014-12-07)
源代码\NLPProject\Dataset\CSC_book_train (1213822, 2014-12-07)
源代码\NLPProject\Dataset\CSC_dvd_test (114030, 2014-12-07)
源代码\NLPProject\Dataset\CSC_dvd_train (1120303, 2014-12-30)
源代码\NLPProject\Dataset\CSC_music_test (113095, 2015-01-04)
源代码\NLPProject\Dataset\CSC_music_train (1130648, 2015-01-03)
源代码\NLPProject\Debug\cl.command.1.tlog (10146, 2015-01-04)
源代码\NLPProject\Debug\CL.read.1.tlog (131582, 2015-01-04)
源代码\NLPProject\Debug\CL.write.1.tlog (7688, 2015-01-04)
源代码\NLPProject\Debug\CommentText.obj (763027, 2015-01-04)
源代码\NLPProject\Debug\ContextStat.obj (24219, 2015-01-04)
源代码\NLPProject\Debug\Dictionary.obj (51803, 2015-01-04)
源代码\NLPProject\Debug\DynamicArray.obj (17381, 2015-01-04)
源代码\NLPProject\Debug\FreeICTCLAS.obj (742769, 2015-01-04)
源代码\NLPProject\Debug\link.command.1.tlog (5188, 2015-01-04)
源代码\NLPProject\Debug\link.read.1.tlog (12858, 2015-01-04)
源代码\NLPProject\Debug\link.write.1.tlog (2250, 2015-01-04)
源代码\NLPProject\Debug\Main.obj (147812, 2015-01-04)
源代码\NLPProject\Debug\Markup.obj (521935, 2015-01-04)
源代码\NLPProject\Debug\mt.command.1.tlog (784, 2015-01-04)
源代码\NLPProject\Debug\mt.read.1.tlog (1114, 2015-01-04)
源代码\NLPProject\Debug\mt.write.1.tlog (430, 2015-01-04)
源代码\NLPProject\Debug\NLPProject.exe.intermediate.manifest (381, 2015-01-04)
源代码\NLPProject\Debug\NLPProject.lastbuildstate (73, 2015-01-04)
... ...

各文件夹作用说明: FreeICTCLAS: 中科院中文分词处理系统接口(修改,添加字母数字剔除,停用词去除) LibSVM: SVM分类器开源库 Data: 分词处理数据字典 Dataset: 处理文本测试集与训练集 Feature: 对训练集提取的特征文件 Model: 利用SVM生成的模型文件 Result: 分类结果文件 其他文件说明: Markup.h与Markup.cpp: 开源的xml文件处理接口 CommentText.h与CommentText.cpp: 评论文本类,文本的主要处理对象,用于分词处理,计算权重等 Processing.h与Processing.cpp: 通用处理接口,包括SVM训练,学习接口,特征选取,权值归一化等

近期下载者

相关文件


收藏者