Apache Solr 术语


在本章中,我们将尝试理解一些在使用 Solr 时经常使用的术语的真正含义。

一般术语


以下是所有类型的 Solr 设置中使用的通用术语列表:

  • Instance : 就像一个 tomcat 实例 or a 码头实例 ,这个术语是指应用程序服务器,它在 JVM 中运行。 Solr 的主目录提供对这些 Solr 实例中的每一个实例的引用,其中可以配置一个或多个内核以在每个实例中运行。

  • Core : 在你的应用程序中运行多个索引时,你可以在每个实例中拥有多个核心,而不是多个实例每个拥有一个核心。

  • Home : $SOLR_HOME 一词是指主目录,其中包含有关内核及其索引、配置和依赖项的所有信息。

  • Shard : 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中的每一块数据都可以称为一个 Shard .它包含整个索引的一个子集。

SolrCloud 术语


在前面的章节中,我们讨论了如何以独立模式安装 Apache Solr。请注意,我们还可以在分布式模式(云环境)中安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从服务器。

与 Solr Cloud 相关的关键术语如下:

  • Node : 在 Solr 云中,Solr 的每个单个实例都被视为一个 node .

  • Cluster :环境的所有节点组合在一起构成一个 cluster .

  • 收藏 :一个簇有一个逻辑索引,称为 收藏 .

  • Shard :分片是集合的一部分,它具有索引的一个或多个副本。

  • Replica : 在 Solr Core 中,运行在一个节点中的 shard 副本称为 replica .

  • Leader : 也是shard的一个replica,将Solr Cloud的请求分发给剩余的replica。

  • 动物园管理员 : 是 Solr Cloud 用于集中配置和协调,管理集群和选举领导者的 Apache 项目。

配置文件


Apache Solr 中的主要配置文件如下:

  • Solr.xml :就是$SOLR_HOME目录下的文件,里面包含了Solr Cloud相关信息。为了加载内核,Solr 引用此文件,这有助于识别它们。

  • Solrconfig.xml : 该文件包含与请求处理和响应格式相关的定义和核心特定配置,以及索引、配置、管理内存和提交。

  • 架构.xml : 该文件包含整个架构以及字段和字段类型。

  • 核心属性 : 该文件包含特定于核心的配置。它被称为 核心发现 ,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,然后将其视为 核心目录 .