Apache Tajo 自定义函数


Apache Tajo 支持自定义/用户定义函数 (UDF)。可以在 python 中创建自定义函数。

自定义函数只是带有装饰器的普通 python 函数 “@output_type()” 如下:

@ouput_type(“integer”) 
def sum_py(a, b): 
    return a + b;

可以通过在中添加以下配置来注册带有 UDF 的 python 脚本 “tajosite.xml” .

<property> 
    <name>tajo.function.python.code-dir</name>
    <value>file:// /path/to/script1.py,文件:
</property>

注册脚本后,重新启动集群,UDF 将在 SQL 查询中可用,如下所示:

select sum_py(10, 10) as pyfn; 

Apache Tajo 也支持用户定义的聚合函数,但不支持用户定义的窗口函数。