中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。SAE分词系统基于隐马模型开发出的汉语分析系统,主要功能包括中文分词、词性标注、命名实体识别、新词识别。
中文分词服务应用场景:
对博客标题进行分词,提取其中的名词作为文章关键词。
对用户搜索条件进行分词,提取其中关键词语进行搜索。
在SAE在线管理平台进入应用的“分词服务”管理页面,启用分词服务,即可开始使用。代码示例:
我稍微改了一下,做了个测试页面:
请求标题词组返回分词字段。