KNN(CSHARP)

所属分类:人工智能/神经网络/深度学习
开发工具:C#
文件大小:1120KB
下载次数:846
上传日期:2007-02-09 12:14:44
上 传 者linvg
说明:  基于不断学习的贝叶斯-KNN文本分类算法的设计与实现,给出原始几个类别的文本文件,通过机器学习,获取各个类别文本内容的主要特征,在这个基础上,给出待分类的文件库,系统通过自动分类,对文件库中的文本进行分类,把文件分配到最有可能的类别中。
(based learning Bayesian-KNN text classification algorithm design and implementation given several types of the original text file, machine learning, access to all types of text that the key features On this basis, the classification given to the document, the system, through the automatic classification of documents for the text classification, documents distributed to the most likely categories.)

文件列表:
248839\源代码\App.ico (1078, 2006-12-28)
248839\源代码\AddDictionary.cs (1825, 2006-12-28)
248839\源代码\AssemblyInfo.cs (1859, 2006-12-28)
248839\源代码\Help.cs (4822, 2007-01-21)
248839\源代码\MainFrm.cs (49458, 2007-01-03)
248839\源代码\ChineseTextCategorization.csproj (5467, 2007-01-21)
248839\源代码\ChineseTextCategorization.sln (935, 2006-12-28)
248839\测试数据\教育\310.txt (2950, 1997-09-20)
248839\测试数据\教育\312.txt (3205, 1997-09-20)
248839\测试数据\教育\313.txt (1686, 1997-09-20)
248839\测试数据\教育\315.txt (5955, 1997-09-20)
248839\测试数据\教育\316.txt (12195, 1997-09-20)
248839\测试数据\教育\32.txt (6868, 1997-09-20)
248839\测试数据\教育\33.txt (911, 1996-06-01)
248839\测试数据\教育\35.txt (1242, 1996-05-07)
248839\测试数据\教育\36.txt (976, 1997-09-20)
248839\测试数据\教育\38.txt (1512, 1997-09-20)
248839\测试数据\环境\510.txt (1865, 1997-09-26)
248839\测试数据\环境\512.txt (1516, 1997-09-26)
248839\测试数据\环境\513.txt (1393, 1997-09-26)
248839\测试数据\环境\515.txt (1285, 1997-09-26)
248839\测试数据\环境\52.txt (1728, 1997-09-26)
248839\测试数据\环境\53.txt (7508, 1997-09-26)
248839\测试数据\环境\54.txt (3901, 1997-09-26)
248839\测试数据\环境\56.txt (1383, 1997-09-26)
248839\测试数据\环境\57.txt (1201, 1997-09-26)
248839\测试数据\环境\59.txt (2277, 1997-09-26)
248839\测试数据\经济\610.txt (1448, 1996-05-07)
248839\测试数据\经济\612.txt (1413, 1996-05-07)
248839\测试数据\经济\613.txt (547, 1996-05-07)
248839\测试数据\经济\615.txt (1061, 1996-05-07)
248839\测试数据\经济\62.txt (5622, 1996-05-07)
248839\测试数据\经济\63.txt (1216, 1996-05-07)
248839\测试数据\经济\64.txt (1542, 1996-05-07)
248839\测试数据\经济\65.txt (5958, 2003-05-02)
248839\测试数据\经济\67.txt (2702, 1996-05-07)
248839\测试数据\经济\69.txt (1457, 1996-05-07)
248839\测试数据\军事\810.txt (3334, 1999-11-30)
248839\测试数据\军事\812.txt (370, 1996-05-07)
248839\测试数据\军事\813.txt (771, 1996-05-07)
... ...

1、在源代码下,可以用.NET 2003打开工程; 也可以在bin->debug文件夹里,选择exe程序运行。 2、由于工程容量大就没有上传样本库,如果需要可以下载或通知我发送。 3、本程序采用XML做数据库存储样本特征库,已经进行过了样本训练, 可以直接加载词典后进行分本分类。也可以清空样本库, 重新选择样本库进行训练。 4、请勿删除bin下的各种xml文件 5、在操作时,请先加载词典 也就是词库.txt文件 6、在分类时会耗大量的CPU,请勿认为是未响应。 操作: 1、加载词典按钮 选择 词库.txt 2、点击分类文件按钮 选择测试数据下的一个类别的文件夹 3、点击文本分类按钮 4、如果选择再学习将会不断分类不断学习 5、选择显示细节 将会显示每篇文章属于哪个类别 6、程序显示了分句和分词功能

近期下载者

相关文件


收藏者