hmmseg:嗯用于分割

  • q2_648106
    了解作者
  • 2.4MB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-05-31 04:42
    上传日期
微信群 hmm 分词:利用最大匹配策略和 hmm 模型对中文词进行分词,具有很强的鲁棒性和可接受的精度。 使用 trie 树存储字典,并提供接口以通过最大匹配策略快速搜索所有匹配的分段 使用 hmm 模型来评估每场比赛的得分,并利用得分最高的那个。 hmm 模型是通过统计训练的,em 训练算法会尽快更新。 这种分割方法对于您的应用程序来说将足够强大,尤其是当您将其应用于长文档分割时。 速度和结果会让你眼前一亮~ 可以使用整个工程也可以只使用test目录下的动态共享库,test_so.cpp中也给出了例子,你只需要把编译好的libhmmseg.so拷贝到/usr/local/lib下,然后输入进入命令“ldconfig或sudo ldconfig”,然后用“g++ -o seg test.cpp -lhmmseg -I../include/”编译你自己的文件 如果您有任何问题或我留在
hmmseg-master.zip
  • hmmseg-master
  • .gitignore
    252B
  • README.md
    1.1KB
  • test
  • main.cpp
    2.8KB
  • msr_training_words.utf8
    1MB
  • msr_test_gold.utf8
    748.8KB
  • train_dict
    58.2KB
  • test_trie
    2.2MB
  • train_model
    221KB
  • test_so.cpp
    877B
  • score
    7.1KB
  • msr_test.utf8
    547.1KB
  • include
  • util.h
    1.6KB
  • trie.h
    2.6KB
  • hmm.h
    5.1KB
  • wordseg.h
    3.9KB
  • src
  • trie.cpp
    4.5KB
  • wordseg.cpp
    7.5KB
  • util.cpp
    2.7KB
  • hmm.cpp
    8.3KB
  • so
  • libhmmseg.so
    329.6KB
  • Makefile
    925B
内容介绍
# hmmseg hmm for segmentation : leverage the maximum match strategy and the hmm model for chinese word's segmentation with great robust and acceptable precision. 1. use trie tree to store the dict and supply a interface for quick search for all the matched segmention by maximum match strategy 2. use hmm model to assess the score of each match, and leverage the one with max score. 3. hmm model is trained by statistics, em training algorithm will be updated soon. 4. this segmentation method will be robust engough for your application, and especially when you apply it to long document segmentation. the speed and outcome will shine you eyes~ 5. you can use the whole project or just the dynamic shared library in the test directory, and the example is also given in the test_so.cpp , you just need to copy the compiled libhmmseg.so to the /usr/local/lib, and type into the command "ldconfig or sudo ldconfig", then compile you own file with "g++ -o seg test.cpp -lhmmseg -I../include/" 6. email me(kymowind@gmail.com) if you have any problem with it or idiot bugs that i left in the program, thanks.
评论
    相关推荐
    • 微信自定义分享
      微信的最新自定义分享代码,网上查了好多不能用,研究了好几天,终于搞出来了
    • 微信订阅号
      微信订阅号,写了自定义菜单和自动回复用户文本内容
    • 微信支付接口
      一、wap支付不支持微信内置浏览器调用.如果要微信内置浏览器里实现微信支付,必须要用公众号支付接口,微信对各个不同的使用场景有不同的接口限制规则 二、支付确认提示窗体,便于用户操作体验. 三、一定要处理好...
    • 微信有关工具
      微信相关工具留着后方便实用,暂时没有测试以后用到的时候在测
    • 微信开发demo
      微信初步开发,申请测试公众号,测试文本、视频、语音、图文 交互。。
    • wepy仿微信聊天界面
      wepy仿微信聊天界面,数据来自mock数据,支持聊天,自动回复等,聊天记录存储在本地storage。
    • java开发微信
      java开发微信,javaweb项目.本人测试过,百分百可以运行.有本地发送消息(文本,语言,图片,地理位置等),还要事件推送,关注微信后推送关注消息等.初学java开发微信必备项目.
    • 微信好友头像获取.rar
      wx2char.py用来扫码登录微信,获取微信好友头像存储到本地,将头像图片拼接成inpt = "二零一九新年快乐!"中的文本内容。 1.需要先安装PIL和itchat库 2.运行代码时需要扫码登录微信网页版 3.目前点阵库是依靠汉字库...
    • ectouch 微信支付插件
      ECTOUCH 201412版,微信支付插件,能够支付成功,完成订单更新。 注意要使用redis 来存储token
    • 微信公众号
      微信公众号开发,android,自定义菜单