ganzhiji

所属分类:多国语言处理
开发工具:Python
文件大小:5036KB
下载次数:43
上传日期:2010-07-09 17:29:39
上 传 者wangkai_lv_poney
说明:  基于感知机的中文分词程序,实现基本的文本分词,正确率高达97 以上
(Perceptron-based Chinese word segmentation program to achieve basic text word, the correct rate of 97 or more)

文件列表:
PTTrain.py (11158, 2008-05-26)
PTData\alph (260, 2007-12-04)
PTData\avgmodel (976127, 2008-05-26)
PTData\date (17, 2007-12-04)
PTData\num (110, 2007-12-04)
PTData\punc (270, 2007-12-04)
PTData (0, 2008-05-23)
msr_train.txt (24476617, 2007-12-17)

近期下载者

相关文件


收藏者