Complete-Training-of-TC

所属分类:C#编程
开发工具:C#
文件大小:5930KB
下载次数:51
上传日期:2012-05-15 14:09:12
上 传 者lele685
说明:  用贝叶斯模型实现文本分类,;里面包含分词,词频统计,去除停用词等模块,目前完成的是分类的训练阶段。
(realize text categorization by using the NaiveBayes Model )

文件列表:
Web信息预处理120319训练完成\Web信息预处理\BayesClassifier.cs (3496, 2012-02-18)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\交通事故.txt (103221, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\地震.txt (139464, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\干旱.txt (164714, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\恐怖袭击事件.txt (150704, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\火灾.txt (119794, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\病毒传播事件.txt (147456, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\非法侵害事件.txt (147537, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Chi-Square\食品中毒事件.txt (89229, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\BingDu.txt (150366, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\DiZhen.txt (139464, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\FeiFaQinHai.txt (147537, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\GanHan.txt (164714, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\HuoZai.txt (119794, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\JiaoTongShiGu.txt (103221, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\KongBuXiJi.txt (150704, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\ChiSquare2\ShiPinZhongDu.txt (89229, 2012-02-27)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\CiPin.txt (3567, 2012-03-19)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\CiPinStop.txt (2715, 2012-03-19)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\BigramDict.dct (6016856, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\coreDict.dct (1584547, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\engstopwords.txt (607, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\lexical.ctx (10412, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\log.txt (1914, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\nr.ctx (1032, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\nr.dct (232054, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\ns.ctx (408, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\ns.dct (127630, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\stopwords.txt (2398, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\tr.ctx (408, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\Data\tr.dct (129006, 2005-05-17)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\交通事故.txt (261579, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\地震.txt (323756, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\干旱.txt (395821, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\恐怖袭击事件.txt (331434, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\火灾.txt (275627, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\病毒传播事件.txt (385898, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\非法侵害事件.txt (311239, 2012-03-13)
Web信息预处理120319训练完成\Web信息预处理\bin\Debug\NB\食品中毒事件.txt (196522, 2012-03-13)
... ...

计算所汉语词法分析系统ICTCLAS中的数据文件 使用须知: 1. 数据部分有:data1.zip和data2.zip。 2. data1.zip解压缩后,得到data文件夹;dctdata2.zip解压缩后,得到BigramDict.dct,应当将给文件BigramDict.dct拷贝到data文件夹中(因为我的主页一次只能传2M的文件,所以只好分开压缩,给您造成不便,深表歉意!);ICTCLAS_dll.zip解压缩后,data和软件部分的文件必须在同一目录下!

近期下载者

相关文件


收藏者