Skip to content

Latest commit

 

History

History
20 lines (12 loc) · 454 Bytes

README.md

File metadata and controls

20 lines (12 loc) · 454 Bytes

intelliSeg

####中文分词

参考了jieba分词 jieba

#####使用三种算法分词:

  1. FMM 前向最大匹配
  2. MaxProPath 最大概率路径
  3. HMM&Viterbi 基于字的分词

#####语料库 使用了搜狗提供的互联网词库搜狗互联网词库

还参考了维基百科和若干博客,在此不一一列出 对以上资源表示由衷的感谢