全文检索
ElasticSearch是基于全文搜索引擎库Lucene构建的分布式搜索引擎,我们可以直接使用ElasticSearch实现分布式搜索系统的搭建与使用,都知道,Lucene只是一个搜索框架,它提供了搜索引擎操作的基本API,如果要实现一个能够使用的搜索引擎系统,还需要自己基于Lucene的API去实现,工作量很大,而且还需要很好地掌握Lucene的底层实现原理。 ElasticSearch是一个完整的分布式搜索引擎系统,它的一些基本特性包括如下: 全文检索 提供插件机制,可以共享重用插件的功能 分布式文件存储 分布式实时索引和搜索 实时统计分析 可以横向扩展,支持大规模数据的搜索 简单易用的RESTful API 基于Replication实现了数据的高可用特性 与其他系统的集成 支持结构化和非结构化数据 灵活的Schema设计(Mappings) 支持多编程语言客户端 我个人感觉,ElasticSearch尽量屏蔽底层Lucene相关的技术细节,让你根本无从感觉底层Lucene相关的内容,这样你可以省去了了解Lucene 的成本,学习曲线比较平缓,不像Solr,如果想要构造负责的查询(Query),还是要对Lucene有所了解的。另外,在分布
PubMed Central (PMC 公共医学中心)是一个提供有关生命科学与生物医学的回溯性电子期刊全文数据库,它是在2000年1月由隶属美国国立图书馆(NLM)的国家生物技术信息中 心(NCBI)所创建与管理的。PMC采取自愿加入的原则,某期刊一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给 PMC,由PMC提供免费全文检索和访问。目前已收录5百种期刊
企业网站是用户了解企业的一个至关重要的平台它的产生和出现可以为企业提供信息发布、产品宣传、数据采集以及电子商务等功能成为企业与客户及供应商之间沟通交流的一个纽带。但是随着网站数据量和访问量的不断增加频繁的数据库读写操作将耗费大量的服务器资源给网站性能带来严重的影响进而降低用户的体验。于是,大多数企业会选择通过静态页面生成和站内全文检索技术的应用,从而使网站的响应速度能够跟上,给用户带来更舒适的体验
方正阿帕比已与超过500家的出版社建立全面合作关系,电子书步上了健康、快速的发展轨道。电子图书资源库是方正阿帕比数字内容资源的核心部分。截止到2010年初,在销电子图书达 50万种,其中,2006年后出版的新书占到了70%,涵盖了社科、人文、经管、文学、科技等分类,已经形成最大的文本电子图书资源库
收录了49种全文百科全书,100000多页的内容中含有1775年至2015年所出版的百科全书。该数据库提供在音乐学研究上的重要语言文献,例如:英文、德文、法文、意大利文、荷兰文以及希腊文等。是全面的音乐学百科全书专辑,覆盖了重要的音乐学历史以及民族音乐学等主题,其他重点学科例如:流行音乐、歌剧、乐器、蓝调与福音、音乐录制以及女性音乐家等
企业网盘,简称EDD,是满足集团公司、分/子公司、部门、群组、项目、个人的文档收集、协作、分享、预览、检索、移交、复用的协同共享平台。在收集各种业务执行过程文档的同时,按用户需要进行目录配置、分类归集、整理与发布,既实现过程文档资料的管理,又可形成各种知识库、模板,以保全与复用智力资产,提高企业工作效率、提升企业竞争能力。 管理项目从立项、设计、采购、施工、竣工、验收各阶段的内部、外部协作单位的文档资料
什么是舆情监测分析系统?舆情分析系统是基于信息采集、全文检索、文本挖掘等核心技术,对企业自身、竞争对手和企业外部环境的情报信息进行收集、存储、处理、分析的应用管理系统。 舆情分析系统可以为企业提供坚实的战略决策支持,从而提高企业的核心竞争力。 舆情分析系统是以人的智能为主导、以信息网络为手段、以增强企业竞争力为目标,人机结合的企业竞争战略决策支持与咨询系统,它可收集以下内容: 1. 消费者情报收集,比如购买行为、购买欲望、购买偏好等
Sphinx是一款基于SQL的高性能全文检索引擎,Sphinx的性能在众多全文检索引擎中也是数一数二的,利用Sphinx,我们可以完成比数据库本身更专业的搜索功能,而且可以有很多针对性的性能优化。 Sphinx的特点 快速创建索引:3分钟左右即可创建近100万条记录的索引,并且采用了增量索引的方式,重建索引非常迅速。 闪电般的检索速度:尽管是1千万条的大数据量,查询数据的速度也在毫秒级以上,2-4G的文本量中平均查询速度不到0.1秒
Tim O'Reilly 在他的 Blog 上提到,自 1950 年开始美国最高法院的判决电子资料上网,让人公开使用:Court Decisions Online。 台湾也已经做一阵子了,司法院的“司法院法学资料全文检索资料开放范围”可以看到有哪些资料已经可以在网站上找,比较常用的两个:判决书查询、简易案件查询。当然,不要忘记全国法规数据库
金图外文图书数据库是由北京金图国际开创,联合麦科索斯公司引进20多万种原版的外文电子图书,年更新4万种左右,全部图书严格依照美国国会分类法精准分类,内容涵盖自然科学和社会科学等21个大类。学科范围包括经济、理学、工学、医学、管理学、历史、文学、军事等各个学科。 金图外文图书数据库支持全文检索,可自由下载整本图书或摘录部分数据