tp391
基于word2vec和logistic回归的中文专利文本分类
基于word2vec和logistic回归的中文专利文本分类研究( /HTML) TP391.1 专利文本作为重要的信息载体对其实现自动分类具有重要的研究意义。针对海量的专利文本提出一种基于word2vec和logistic回归的中文专利文本分类模型的机器学习方法。本方法利用word2vec产生的词向量对专利文本进行表示然后配合logistic回归模型对专利说明和摘要合并的文本语料进行学习和训练从而实现对专利文本的自动分类