文本检索
1、利用自然语言处理技术和机器学习算法对文本数据进行挖掘分析; 2、负责自然语言处理技术在机器翻译、自动批改、自动问答、人机对话、语义理解等方向上的应用研究; 3、负责自然语言处理相关核心技术研发及前沿算法跟踪,根据产品需求完成技术转化,推动业务发展。 能力要求: 3、实践过自然语言处理任务中的至少一种任务,包括但不限于分词、词性标注、命名实体识别、语言模型、句法分析、数据抓取、文本分类、文本检索、情感分析、自动问答、自动批改、自动摘要、机器翻译等; 5、熟悉面向文本的常见机器学习算法(逻辑回归、SVM、决策树、贝叶斯等)的原理与算法,以及CNN、RNN、LSTM、Sequence to sequence、GAN等模型者优先; 6、熟悉Hadoop、Spark、Nutch框架者优先; 7、有Tensorflow Caffe2 Theano等深度学习框架与自然语言处理结合实际项目经验者优先; 8、良好的英语阅读能力,学习能力强,能独立分析并解决问题。
应用于生活中的OCR识别技术到底是什么? OCR(Optical Character Recognition)光学字符识别,是一种计算机技术。随着计算机技术的发展,OCR技术已经成为计算机视觉领域的一个重要组成部分。 OCR技术是一种计算机视觉技术,它通常用于数字化扫描的文档,以便这些文档可以被计算机程序处理,并允许用户搜索文档中的关键字
文章首先总结了以往模型的策略,大体分为三种,Intra-modal Interaction,Cross-modal Interaction,Hybrid-modal Interaction。 动机在于这样模型就固定下来,不同的输出会经过同样处理,即使是简单的,也可能会经历复杂的架构,基于此,提出了动态的架构,可以自由选择。 为了解决这些问题,本文提出了一种基于路由机制的新型模态交互建模网络,这是第一个面向图像-文本检索的统一动态多模态交互框架