语料
自然语言处理是 AI 皇冠上的明珠,而语料预处理是自然语言处理的基础。 机器能跟人类交流吗?能像人类一样理解文本吗?这是大家对人工智能最初的想象。如今,NLP 技术可以充当人类和机器之间沟通的桥梁
《传媒英语》为传媒行业专门用途英语课程。该课程基于传媒行业发展对应用型国际化人才的要求,培养学生在传媒行业/专业英语方面的听、说、读、写、译的语言技能。课程内容内容涵盖报纸、广播、电视、互联网等媒体的真实传播语料,在培育学生跨文化交际意识和能力的同时,探索课程思政融合到语言技能训练中的教学模式
近几年,机器写作不再是纸上谈兵的技术,已然渗透到了我们的生活之中。今日头条、腾讯、百度、360等公司,以及新华社、南方都市报、第一财经等传统媒体单位均开展了机器写作技术的研究与应用。 不久前,在北京大学科技成果发布会暨北京市科技成果转化统筹协调与服务平台系列项目路演中,北京大学计算机科学技术研究所研究员万小军的AI写作机器人颇受关注
德语之中国哲学研究书目(至2006年) 古汉语断句(或称句读 )是中文书写系统中一个经典的议题将文本内容切成句子(sentence)以及子句(clause)辨识句子的边界称为“句”而上述的句子再细分各子句则称为“读”。判断断句仰赖阅读者的经验知识过程费时如果有自动化工具能快速初步解读断句后续由专家校对调整就能大幅降低时间和人力成本。 目前古汉语文本的自动化断句方法主要区分为规则方式和机器学习方式规则方法过于复杂且难以泛用主流为机器学习方法
不少香港家长想子女学好英文,不论在家闲谈或是学习均以英语沟通,反而忽略了中文。香港中文大学儿童双语研究中心的一项追踪研究发现,有在美国出生的华裔儿童从出生起就在家中经常以普通话沟通,同时不同程度地接触英语,发现其中一个三语家庭,即以粤语、普通话和英语沟通的儿童,成功发展出三语能力。 中大今天(12日)宣布推出全球首个“华裔儿童汉语语料库”,率先发布3名儿童从1岁7个月至4岁11个月的纵向语料,这些语料记录了他们参与研究的24到36个月期间,从单词阶段到多词阶段的发展过程
很多人以为 word2vec 指的是一个算法或模型,这也是一种谬误。 因此通过 Word2Vec 技术 输出的词向量可以被用来做很多NLP相关的工作,比如聚类、找同义词、词性分析等等. cbow适用于小规模,或者主题比较散的语料,毕竟他的向量产生只跟临近的字有关系,更远的语料并没有被采用。 而相反的skip-gram可以处理基于相同语义,义群的一大批语料
为了全面提升青年教师职业能力,应人文社会科学学院张权院长邀请,11月7日下午,南京航空航天大学外国语学院张立新教授和东南大学外国语学院教师李晨博士来校做了专场学术报告并聘请两位专家为我院客座教授。张立新教授是大学英语国家级精品课程主讲教师,硕士研究生导师,出版专著3部,发表核心期刊论文20余篇;李晨老师曾荣获全国高校英语教师教学基本功大赛一等奖、省级微课教学比赛一等奖,发表学术论文10余篇。 李晨老师报告的题目是“大学英语教学生态系统研究”
社会化媒体中蕴含着海量的实体、实体间关系(如旅游景区中的景点、新闻语料中的实体),这使得层次分类学结构(Taxonomy)不仅成为一个文本语料库语义分析的基本任务,也是信息过滤、推荐系统等应用的重要环节。已有的研究通常是基于一定的模式来提取实体间的上下层级关系。然而,将(实体的)术语作为一个分类结构上的独立节点,会忽略局部位置关系和语义相关性
基于word2vec和logistic回归的中文专利文本分类研究( /HTML) TP391.1 专利文本作为重要的信息载体对其实现自动分类具有重要的研究意义。针对海量的专利文本提出一种基于word2vec和logistic回归的中文专利文本分类模型的机器学习方法。本方法利用word2vec产生的词向量对专利文本进行表示然后配合logistic回归模型对专利说明和摘要合并的文本语料进行学习和训练从而实现对专利文本的自动分类
自2015年12月以来,本人张利敏担任外国语学院翻译教研室副主任。在这两年多的时间里,在领导的鼓励下和同事们的支持下,我渐渐适应了新的工作要求,并逐步认识到,教学科研是学校的重要工作,要干好这项工作,必须付出努力。两年多来我本着对工作的热爱,恪尽职守,竭尽所能地履行工作职责
