文本分类算法.rar

  • a8_121505
    了解作者
  • 2.9KB
    文件大小
  • rar
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-05-23 22:15
    上传日期
一个很简单的文本分类算法 使用方法: 命令行参数: -t 文本文件路径 -m 你的模型文件路径 -c 可选,类别(hit 或 miss) 如果提供了-c则用于训练,否则被模型分类,输出该文本的类型(hit或miss)
文本分类算法.rar.rar
  • 文本分类算法
  • MessageClassifier.java
    5KB
  • ReadMe.txt
    1.3KB
内容介绍
1 介绍:嵌入式机器学习,在自己的算法中调用Weka现文本分类,是一个小的数据挖掘程序,虽然实用价值不是很大,但对于Weka的理解和使用是有帮助的。本例子来自《数据挖掘:实用机器学习技术》第2版。大家可以到 http://blogger.org.cn/blog/message.asp?name=DMman#23691 下载该书察看对算法的详细解释。算法中作了详细的注释,虽然是英文的,但还是比较简单。下面对例子的使用作了浅显的介绍,有兴趣的朋友可以研究。(DMman整理http://blogger.org.cn/blog/blog.asp?name=DMman) 2 功能:使用weka中的j48分类器实现了文本分类的一个小程序。文本文件通过weka的过滤器StringToWordVector预处理。 3 注意:把weka.jar加入你的classpath中,才可以通过编译。 4 使用方法: 命令行参数: -t 文本文件路径 -m 你的模型文件路径 -c 可选,类别(hit 或 miss) 如果提供了-c则用于训练,否则被模型分类,输出该文本的类型(hit或miss) 模型是动态建立的,第一次使用命令行必须指定-c参数,才可以建立模型。 1) 建立模型 >java MessageClassifier -t data/1.bmp -m myModel -c hit 可以看到myModel建立了。然后继续训练一下这个模型。使用的文本实例越多,模型的分类性能越好 >java MessageClassifier -t data/2.bmp -m myModel -c hit >java MessageClassifier -t data/1.gif -m myModel -c miss ...... 2) 使用模型分类 有了模型,就可以使用它为文本文件分类了,如 >java MessageClassifier -t data/2.gif -m myModel 3) 可以使用提供-c参数的命令继续完善模型
评论
    相关推荐