fasttext
“本文旨在解决领域情感词典构建任务中标注数据资源相对匮乏以及情感语义表示不充分问题通过多源数据领域差异计算联合权重融合先验情感知识和Fasttext词向量表示学习将情感语义知识映射到新的词向量空间从无标注数据中自动构建适应大数据多领域和多语言环境的领域情感词典。在中英文多领域公开数据集上的对比实验表明与情感词典方法和预训练词向量方法相比本文提出的多源知识融合的领域情感词典表示学习方法在实验数据集上的分类正确率均有明显提升并在多种算法、多语言、多领域和多数据集上具有较好的鲁棒性。本文还通过消融实验验证了所提出模型的各个模块在提升情感分类效果中的作用
“本文旨在解决领域情感词典构建任务中标注数据资源相对匮乏以及情感语义表示不充分问题通过多源数据领域差异计算联合权重融合先验情感知识和Fasttext词向量表示学习将情感语义知识映射到新的词向量空间从无标注数据中自动构建适应大数据多领域和多语言环境的领域情感词典。在中英文多领域公开数据集上的对比实验表明与情感词典方法和预训练词向量方法相比本文提出的多源知识融合的领域情感词典表示学习方法在实验数据集上的分类正确率均有明显提升并在多种算法、多语言、多领域和多数据集上具有较好的鲁棒性。本文还通过消融实验验证了所提出模型的各个模块在提升情感分类效果中的作用
“本文旨在解决领域情感词典构建任务中标注数据资源相对匮乏以及情感语义表示不充分问题通过多源数据领域差异计算联合权重融合先验情感知识和Fasttext词向量表示学习将情感语义知识映射到新的词向量空间从无标注数据中自动构建适应大数据多领域和多语言环境的领域情感词典。在中英文多领域公开数据集上的对比实验表明与情感词典方法和预训练词向量方法相比本文提出的多源知识融合的领域情感词典表示学习方法在实验数据集上的分类正确率均有明显提升并在多种算法、多语言、多领域和多数据集上具有较好的鲁棒性。本文还通过消融实验验证了所提出模型的各个模块在提升情感分类效果中的作用
负责互联网风险预警的算法研发,包括但不限于多语言翻译、事件发现、事件聚类、内容分类、细粒度情感和实体识别等; 参与风险预警与电商领域内的知识图谱构建,为产品应用提供更精准的信息,并能形成很好的关联性分析; 跟进学术界前沿研究和发展趋势,提升算法效果和性能。 2年以上算法研发工作经验,研究生及以上学历优先; 拥有良好的编码能力,有扎实的数据结构和算法功底; 熟练掌握主流的NLP技术工具及模型算法,包括CRF、CNN、RNN、Word Embedding、Seq2Seq、FastText,Bert等,有Tensorflow/PyTorch实战经验优先; 参与过分词、命名实体识别、深度文本匹配、文本分类、知识图谱、自动对话等相关项目; 责任心强,有良好的学习能力及团队合作精神,自我驱动能力强。