Apache Tajo 配置设置


Tajo 的配置基于 Hadoop 的配置系统。本章详细解释 Tajo 配置设置。

基本设置


Tajo 使用以下两个配置文件:

  • catalog-site.xml:目录服务器的配置。
  • tajo-site.xml:其他 Tajo 模块的配置。

分布式模式配置


分布式模式设置在 Hadoop 分布式文件系统 (HDFS) 上运行。让我们按照步骤配置 Tajo 分布式模式设置。

tajo-site.xml

该文件可用@ /path/to/tajo/conf 目录并充当其他 Tajo 模块的配置。要以分布式模式访问 Tajo,请将以下更改应用于 “tajo-site.xml” .

<property> 
    <name>tajo.rootdir</name>
    <value>hdfs:// 主机名:端口/tajo
</property>
  
<property> 
    <name>tajo.master.umbilical-rpc.address</name>
    <value>hostname:26001</value>
</property> 
 
<property> 
    <name>tajo.master.client-rpc.address</name>
    <value>hostname:26002</value>
</property>
  
<property> 
    <name>tajo.catalog.client-rpc.address</name>
    <value>hostname:26005</value>
</property>   

主节点配置


Tajo 使用 HDFS 作为主要存储类型。配置如下,应该添加到 “tajo-site.xml” .

<property> 
    <name>tajo.rootdir</name>
    <value>hdfs:// namenode_hostname:port/path
</property> 

目录配置


如果要自定义目录服务,请复制 $path/to/Tajo/conf/catalogsite.xml.template to $path/to/Tajo/conf/catalog-site.xml 并根据需要添加以下任何配置。

例如,如果你使用 “蜂巢目录商店” 要访问 Tajo,那么配置应该如下:

<property> 
    <name>tajo.catalog.store.class</name>
    <value>org.apache.tajo.catalog.store.HCatalogStore</value>
</property> 

如果你需要存储 MySQL 目录,然后应用以下更改:

<property> 
    <name>tajo.catalog.store.class</name>
    <value>org.apache.tajo.catalog.store.MySQLStore</value>
</property> 

<property> 
    <name>tajo.catalog.jdbc.connection.id</name>
    <value><mysql user name></value>
</property>
 
<property> 
    <name>tajo.catalog.jdbc.connection.password</name>
    <value><mysql user password></value>
</property>
 
<property> 
    <name>tajo.catalog.jdbc.uri</name>
    <value>jdbc:mysql:// :/
        ?createDatabaseIfNotExist = true</value>
</property> 

同样,你可以在配置文件中注册其他 Tajo 支持的目录。

工作器配置


默认情况下,TajoWorker 将临时数据存储在本地文件系统上。在“tajo-site.xml”文件中定义如下:

<property> 
    <name>tajo.worker.tmpdir.locations</name>
    <value>/disk1/tmpdir,/disk2/tmpdir,/disk3/tmpdir</value>
</property> 

增加每个worker资源运行任务的容量,选择如下配置:

<property> 
    <name>tajo.worker.resource.cpu-cores</name>
    <value>12</value>
</property>
 
<property> 
    <name>tajo.task.resource.min.memory-mb</name>
    <value>2000</value>
</property>
  
<property> 
    <name>tajo.worker.resource.disks</name>
    <value>4</value>
</property> 

要让 Tajo worker 以专用模式运行,请选择以下配置:

<property> 
    <name>tajo.worker.resource.dedicated</name>
    <value>true</value>
</property>