你好,我是pychseg的作者,一直没时间加上download,大家check out源代码就可以用了。

属于中文信息处理、中文分词分类,被贴了 Bakeoff、Java、MMSEG、python、SIGHAN、中文信息处理、中文分词、中文分词入门、最大匹配法、蔡志浩 标签。作者是52nlp。

这里曾写过《中文分词入门之最大匹配法》,并且获得了很高的关注度,不过现在回头来看,这个方法只是最初级的中文分词匹配方法。事实上,很多学者都基于简单的中文分词匹配法做了扩展,其中比较有名的就是台湾蔡志浩老师1996年写的“MMSEG: A Word Identification System for Mandarin Chinese Text Based on Two Variants of the Maximum Matching Algorithm”,在这篇文章的页面中,不仅介绍了相关的中文分词算法,并且提供了一个C版本的mmseg供研究使用,目前根据该文及其代码移植的mmseg程序版本包括C++版、Java版、Python版及Ruby版,影响甚广。属于中文信息处理、中文分词分类,被贴了 MMSEG、中文信息处理、中文分词、中文分词入门、最大匹配法、蔡志浩 标签。作者是52nlp。