免费试用
大数据检索引擎(BSE)
BigData Search Engine (BSE)是基于 Elasticsearch(ES) 构建的高可用、可伸缩的非结构化数据全文搜索服务。
大数据检索引擎
BES

Big Search Engine (BSE)是基于 Elasticsearch(ES) 构建的高可用、可伸缩的非结构化数据全文搜索服务,用户可准确和高效地查询所需的文件数据。用户既可按文件名、文件大小、作者、关键字、标签等这些常规属性的进行检索,也可通过文件内容中出现的关键字作为检索条件来查找定位文件,有效解决非结构化数据检索面临的挑战,


  • 面对海量文件,不仅可通过文件名、上传者、大小等属性查找,还可以依靠文件内容关键字来查找(全文检索)。

  • 检索结果不够准确,想要的文件没有出现在结果中,但又不记得文件存储的位置,以及文件名。


BSE在原ES的基础上,增加了IK analyzer分词插件和垂直行业词库,既有连用科技在非结构化数据方面的计算、存储、安全等领域的技术优势,又保持了 Elasticsearch 本身的兼容与开放,能够为客户提供稳定、弹性可扩展的搜索服务,帮助客户聚焦业务本身。


全量实时

分布式的实时分析搜索引擎;分布式的实时文件存储,并将每一个字段都编入索引,使其可以被搜索。

01
可扩展

可以扩展到上百台服务器,处理PB级别的非结构化数据。

02
专业检索

垂直行业专业词库,搜索更精准;支持同近义词搜索,搜索跟全面。

03
IK分词插件+垂直行业词库

BSE为不同行业提供专有的分词库,使用专有词库对内容进行分词,建立的索引更合理更科学,搜索结果也会更精准。


IK 采用的是“正向迭代最细粒度切分算法分词模型,它具有如下的优点:

  • 支持对中文,还支持对数字、字母、日文、韩文的分词处理;

  • 占用的内存空间较小,处理效率非常高;

  • 可以根据垂直领域的不同,定制个性化扩展词库,提升分词的效率与精准度。


同近义词搜索

用户在使用搜索引擎过程中,由于表述不清晰或者查询词与索引库描述不一致,为了能展示更多更优质的结果展示给用户。这时就需要对用户查询进行分析,寻找与之相近的概念,以关键字为中心扩展包括相关词匹配、同义词匹配。


BSE可定制化同义词、近义词库配置,例如:

  • “鲜花”,可将文档中包含“玫瑰\百合\康乃馨\向日葵\郁金香\马蹄莲”等相近词的文档搜索出来;

  • “上衣”,可将包含“外套\衬衫\T恤\夹克\马夹”等词的文档搜索出来。


立即领取免费试用名额,开启内容管理新体验
免费试用

留言