全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索目标文档的目的。这种先建立索引,再对索引进行搜索的过程就叫全文检索。 全文检索就是把文本中的内容拆分成若干个关键词,然后根据关键词创建索引。查询时,根据关键词查询索引,最终找到包含关键词的文章。整个过程类似于查字典的过程。 灵玖软件Nlpir Parser智能平台全文搜索系统内核经过精心设计,针对大数据搜索业务需求而打造的一套搜索引擎,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。 同时,全文搜索系统可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。 一、其主要特色在于: 1、可以按照任意指定字段的排序,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索; 2、 支持精确匹配以及模糊匹配,默认为精确匹配,忽略字母大小写进行模糊匹配; 3、实现的是多线程搜索服务; 4、每秒可索引3000条记录(主要瓶颈为数据库或文件记录的读取效率);搜索速度在毫秒级别。 5、兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等。 二、搜索特色功能包括: 1 内嵌正负面情感等极性分析,可以搜索任意对象的正负面结果; 2 语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以自行根据专业知识定制; 3 搜索结果去重:按照指定字段对搜索结果进行去重; 4 邻近搜索功能:可以要求两个关键词必须在一定的词场范围内。 5 内嵌了智能分词系统。 6 数据库实时同步:数据库增删改10秒内即可同步到搜索引擎中 全文搜索适用于多种商业应用场景:例如,电子商务(在网站上搜索项目)、律师事务所(在法律数据库中搜索案件记录)或人力资源部门(从所存储的个人简历中找到符合职位描述的简历)。 不管是什么样的商业应用场景,全文搜索的基本管理任务和开发任务是相同的。 然而,在给定的商业应用场景中,可以对全文索引和查询进行优化以使其满足业务目标。 例如,对于电子商务来说,最大限度地提高性能可能比对结果进行排序、检索的准确性(实际上有多少个现有匹配项是由全文查询返回的)或支持多种语言更重要。
|