15520579 联合开发网

Pudn.com > 下载中心 > 其他 > 15520579

15520579

所属分类：其他
开发工具：Java
文件大小：5KB
下载次数：0
上传日期：2018-05-24 14:43:55
上传者：rsbuvt

说明：文本分类器文本分类算法详细介绍了算法过程

文件列表:

wMessageClassifier.java (5141, 2007-11-22)
xMessageClassifier.class (4255, 2007-11-22)

1 介绍：嵌入式机器学习，在自己的算法中调用Weka现文本分类,是一个小的数据挖掘程序，虽然实用价值不是很大，但对于Weka的理解和使用是有帮助的。本例子来自《数据挖掘：实用机器学习技术》第2版。大家可以到 http://blogger.org.cn/blog/message.asp?name=DMman#23691 下载该书察看对算法的详细解释。算法中作了详细的注释，虽然是英文的，但还是比较简单。下面对例子的使用作了浅显的介绍，有兴趣的朋友可以研究。（DMman整理http://blogger.org.cn/blog/blog.asp?name=DMman） 2 功能：使用weka中的j48分类器实现了文本分类的一个小程序。文本文件通过weka的过滤器StringToWordVector预处理。 3 注意：把weka.jar加入你的classpath中，才可以通过编译。 4 使用方法：命令行参数： -t 文本文件路径 -m 你的模型文件路径 -c 可选，类别（hit 或 miss）如果提供了-c则用于训练，否则被模型分类，输出该文本的类型（hit或miss）模型是动态建立的，第一次使用命令行必须指定-c参数，才可以建立模型。 1) 建立模型 >java MessageClassifier -t data/1.bmp -m myModel -c hit 可以看到myModel建立了。然后继续训练一下这个模型。使用的文本实例越多，模型的分类性能越好 >java MessageClassifier -t data/2.bmp -m myModel -c hit >java MessageClassifier -t data/1.gif -m myModel -c miss ...... 2) 使用模型分类有了模型，就可以使用它为文本文件分类了，如 >java MessageClassifier -t data/2.gif -m myModel 3) 可以使用提供-c参数的命令继续完善模型

近期下载者：

相关文件：

评论：[我要评论] [举报此文件]

收藏者：