语料
香港可持续发展教育学院(学院)智慧健康学校大数据实验室于今年推出“人工智能与课堂教学分析应用”项目,利用人工智能进行高效、标准化、智能化的课堂评价,将数据的价值最大化,为教师于学校改善课堂教学质量提供方向和指引。 “人工智能与课堂教学分析应用”项目透过课堂“教”与“学”行为数据建立课堂互动编码体系,从功能、形式、层次、范围和倾向五个方面提出13种思维方式,支持深层学习和高阶思维培养。透过多模态课堂数据的采集集成,建立语料库,进行机器学习模型构建,以支持大规模高效率的数据分析,并客观、实证地将分析结果清晰呈现给教师与学校进行课堂教学评估及改进指导
《传媒英语》为传媒行业专门用途英语课程。该课程基于传媒行业发展对应用型国际化人才的要求,培养学生在传媒行业/专业英语方面的听、说、读、写、译的语言技能。课程内容内容涵盖报纸、广播、电视、互联网等媒体的真实传播语料,在培育学生跨文化交际意识和能力的同时,探索课程思政融合到语言技能训练中的教学模式
近几年,机器写作不再是纸上谈兵的技术,已然渗透到了我们的生活之中。今日头条、腾讯、百度、360等公司,以及新华社、南方都市报、第一财经等传统媒体单位均开展了机器写作技术的研究与应用。 不久前,在北京大学科技成果发布会暨北京市科技成果转化统筹协调与服务平台系列项目路演中,北京大学计算机科学技术研究所研究员万小军的AI写作机器人颇受关注
德语之中国哲学研究书目(至2006年) 古汉语断句(或称句读 )是中文书写系统中一个经典的议题将文本内容切成句子(sentence)以及子句(clause)辨识句子的边界称为“句”而上述的句子再细分各子句则称为“读”。判断断句仰赖阅读者的经验知识过程费时如果有自动化工具能快速初步解读断句后续由专家校对调整就能大幅降低时间和人力成本。 目前古汉语文本的自动化断句方法主要区分为规则方式和机器学习方式规则方法过于复杂且难以泛用主流为机器学习方法
很多人以为 word2vec 指的是一个算法或模型,这也是一种谬误。 因此通过 Word2Vec 技术 输出的词向量可以被用来做很多NLP相关的工作,比如聚类、找同义词、词性分析等等. cbow适用于小规模,或者主题比较散的语料,毕竟他的向量产生只跟临近的字有关系,更远的语料并没有被采用。 而相反的skip-gram可以处理基于相同语义,义群的一大批语料
社会化媒体中蕴含着海量的实体、实体间关系(如旅游景区中的景点、新闻语料中的实体),这使得层次分类学结构(Taxonomy)不仅成为一个文本语料库语义分析的基本任务,也是信息过滤、推荐系统等应用的重要环节。已有的研究通常是基于一定的模式来提取实体间的上下层级关系。然而,将(实体的)术语作为一个分类结构上的独立节点,会忽略局部位置关系和语义相关性
CADCC自然口语对话语料库由自然口语对话语音数据和对话文本组成,适用于自然口语研究、语音识别工程和高级汉语普通话教学等领域。 该语料库为保证自然口语的纯粹性,对发音人对话内容不作任何限制,完全反映真实环境下汉语自然口语特征。语料库语音数据由经过挑选的标准普通话发音人在专业录音环境下录制,共计12个对话单元,每一对话单元有两位发音人
为进一步营造良好的教学科研学术氛围,不断拓展外语教师的科研学术视野,11月22日下午,外语系邀请西安交通大学外国语学院语料库语言学专家李颖玉副教授来我院做了题为“语料库语言学与外语教学——从理论到应用”的第三十期外国语言文化论坛讲座。外语系全体教师参加了此次活动。 李颖玉副教授从语料库语言学的流派、特征、技术发展和研究热点入手,概述语料库语言学发展趋势和现状,探讨了语料库语言学在外语教学与研究实际上的应用
随着科技的发展和人们社交网络迅速扩大,为了让人们减轻聊天的压力,越来越多基于内容分析技术的聊天管家开始出现在市场上。这种类型的机器人不仅能让人们轻松管理聊天,而且还可以帮助人们为聊天内容提供分析报告,甚至可以将聊天语料智能化。 聊天管家是一种高级的机器人,可以轻松地满足其他社交礼仪和要求
以前,提起母婴一词,人们可能会想到街上的店面。但是现在,想到的更多是互联网上各式各样的产品与服务。我国的母婴行业以一种极快的速度融入了互联网时代,不断地扩大其业务半径,在满足客户多元化需求的同时,形成了一个新市场