引入握手
这篇文章是有关Perfitive最新产品的系列中的第一篇:握手,可扩展的搜索连接器。Perficen的数据解决方案组已构建了30多个自定义搜索连接器。Filenet P8,Documentum,Jira/Confluence,Salesforce和Adobe Experience Manager等。随着越来越多的客户认识到搜索的好处,对其他内容来源的需求也会增长。我们已经开发了握手来满足这一需求,并超越了它。
什么是搜索连接器?
搜索用例很丰富。企业,商业,网站和服务是我们合作的实施的主要类别。但是,对于任何用例,搜索引擎仅与其消耗的燃料一样好。
企业搜索应用程序与源连接器捆绑在一起,这些连接器会创建燃料。他们爬网和索引内容客户希望在搜索结果中看到。他们知道如何映射字段充当搜索引擎的方面或过滤器。每个解决方案都有一组支持的连接类型。这些将产品变化为产品,公司与公司。例如,Web内容爬网是一种几乎无处不在的源类型,几乎每种产品都可以使用。另一方面,Sitecore仅由Coveo支持OOTB。
搜索连接器通常是独立应用程序。它旨在与特定的源存储库接口,并爬网以搜索丰富的内容,元数据和安全权限。内容通常将其推向搜索引擎进行索引。在我们的实践中,连接器是为特定作业(特定内容的特定子集)构建的,并执行标准工作流程:连接,标准化或转换以及传输到搜索存储库。
作为集成专家,我们为大多数用例构建了连接器。最常见的用例索引了不支持的来源。这些是像内容管理解决方案一样的来源,它们要么太复杂或太模糊,无法在合作伙伴的标准产品路线图中包含。
为什么“可扩展”?
随着时间的流逝,我们已经确定开发连接器的最劳动密集型方面是将界面定义到源。我们一次又一次地问自己同样的问题:
- 有哪些协议可用于爬网内容?
- 如何合并搜索引擎可消耗的元数据?
- 平坦或映射不同复杂性权限的最佳方法?
- 如何快速阅读内容?
在开发握手时,我们寻求(并已实现!)抽象这些组件并使其可重复使用,插入和播放代码元素。
我们设计了握手来生成连接器实例。这些实例由通过中央用户界面控制的管道组成。与独立的连接器不同,它们不需要重新部署Java申请进行大规模或次要调整。可以轻松地将其他转换添加到管道中。搜索目的地可以在几分钟之内交换。可以相对轻松地将不同的规则应用于多个连接器实例。
我们的框架可以更高的精度和源接口的重复使用。这代表了转换内容所需的自定义代码的大规模减少。我们写一次,重复使用。连接器不再是独立的应用程序,而是共享代码的实例:减少部署和授权管理员控制数据流到其搜索解决方案的时间。
下一步是什么?
In future posts, we will be discussing some of the technology we’ve used to solve this problem, go in depth into some of Handshake’s features, challenges and solutions for search connectors in general, the challenges and benefits of product development at a consulting firm, and what it’s like being integration experts.