语料
自然语言处理是 AI 皇冠上的明珠,而语料预处理是自然语言处理的基础。 机器能跟人类交流吗?能像人类一样理解文本吗?这是大家对人工智能最初的想象。如今,NLP 技术可以充当人类和机器之间沟通的桥梁
这篇文章将简单介绍seq2seq模型+attention机制,以及在这个模型下,字符级逐字的输入和输出任务产生的句向量的特性。 许久未更博了,在前段时间测试了用seq2seq做ner任务,可以参考之前的文章《RNN的Seq2Seq模型做命名实体识别》 ,之后通过NER做NLU,再加上RL尝试多轮对话,结果达到了期望,但是还有很多工作需要去做,多轮语料采集、句子相似度、句向量,在多轮对话中,我没有尝试将每句话进行分类,我认为句子本身表意就非常清晰,标注反而画蛇添足,特别是上下文中的句子,其意思根据上下文而变化。那么对话中去匹配距离最近的句子,并且人为的反馈,可能是一个多轮对话的主要方式
官方娱乐大全“小学堂闽语数据库”为汉字古今音数据库下的一个数据库,可提供使用者根据字头查询闽语,再透过字头连接到个别的形、音、义数据库或韵书索引。 本资料库的字号、字头直接承袭自汉字古今音数据库,主要根据宋代韵书《广韵》 收字,此外并酌收其他字书、韵书及近代新增的少數字,共计有兩万多字;而其中有对应闽语资料,可供查询的汉字约五千多字。 官方娱乐大全本数据库预计收录闽语方言点58个,实际收录方言点个数、声韵资料笔数请参考“收录现况”;并于检索结果中,列出字头对应之《广韵》韵目、声调、反切、字母、清浊、等第、开合等中古音资料,供使用者参考
ChatGPT为什么爆火? ChatGPT 爆火是因为它提供了一种快速,方便和高效的方法来回答问题。它是一种大型的自然语言处理(NLP)模型,训练了大量的语料,以更好地理解语言和回答问题。 自动回答:只需输入问题,ChatGPT 就会立即回答
改写匠服务亮点说明: 改写匠ReWriter是一款基于数亿字词英文语料大数据,通过人工智能和深度学习技术不断训练、更新评分模型的英语写作智能批改工具。 1. 支持七个维度的AI智能评估。包含:文体适宜性、表达简明性、语句地道性(中式英语)、逻辑衔接性,以及拼写、语法、标点符号等语法正确性检查
计算机辅助翻译原理与实践 Princípios e prática da tradução assistida por computador 对CAT有了整体梳理与把握,理论与实践内容丰富。稍显不足的是,目前有些题目未能及时更新,trados 2007的内容,没有太大的实际意义。 我想学翻译,这门课给我的帮助很大,内容系统,有很多的实际操作,但后来好像同学讨论就不那么积极了,不知道为什么
元宵节快乐!10则物理灯谜,看看你能猜出几个? 文 | 胡升华(科学出版社原副总编辑) 连续几年我以物理学名词为谜目制作元宵灯谜,深感科技名词是上乘的谜目素材,这也是我国独特的科学、历史和文化的体现。 以下谜语各猜物理学名词一,这些名词基本上都可在中学物理教科书中见到。 在我国,主要通过翻译而构筑的中文科学名词体系堪称一项伟大的科学和文化创造工程
近日,外语中文译写规范部际联席会议专家委员会审议通过第十四批13组推荐使用外语词中文译名。 本次拟推荐使用的外语词中文译名,均为与“双碳”经济相关的词条。本次选词主要来源于中国长期低碳发展战略与转型路径研究课题组、清华大学气候变化与可持续发展研究院编著的《读懂碳中和/中国2020—2050年低碳发展行动路线图》,由来自24所科研机构的120余位专家学者合作完成,较为全面地收录了和“双碳”经济有关的各领域科研和实践成果
计算机辅助翻译原理与实践 Princípios e prática da tradução assistida por computador 对CAT有了整体梳理与把握,理论与实践内容丰富。稍显不足的是,目前有些题目未能及时更新,trados 2007的内容,没有太大的实际意义。 我想学翻译,这门课给我的帮助很大,内容系统,有很多的实际操作,但后来好像同学讨论就不那么积极了,不知道为什么
自上世纪九十年代起,汉语词汇史研究日益受到学界重视,常用词演变研究成为一个热点,成果也日渐丰富。中古汉语时期是词汇系统发展演变极为活跃的阶段,常 用词研究对于中古汉语词汇研究具有重要意义。 本文选取横跨中古汉语至近代汉语初期的三部语料: 何晏的《论语集解》、 邢昺的《论语注疏》及朱熹的《论语集注》对该时期词汇史发展进行探源释流的研究