Pig 自定义函数

要指定自定义处理，Pig提供了对用户定义函数(UDF)的支持。因此，Pig允许我们创建自己的功能。当前，可以使用以下编程语言来实现Pig UDF:-

Java Python Jython JavaScript Ruby Groovy

在所有语言中，Pig为Java函数提供了最广泛的支持。但是，仅对Python，Jython，JavaScript，Ruby和Groovy等语言提供有限的支持。

Pig UDF的示例

在Pig中，

所有UDF必须扩展"org.apache.pig.EvalFunc" 所有功能都必须覆盖" exec"方法。

让我们看一个简单的EVAL函数示例，该函数将提供的字符串转换成大写。

UPPER.java

package com.hadoop;
import java.io.IOException;
import org.apache.pig.EvalFunc;
import org.apache.pig.data.Tuple;
public class TestUpper extends EvalFunc<String>   {
    public String exec(Tuple input) throws IOException {  
        if (input == null || input.size() == 0)  
        return null;  
        try{  
                    String str = (String)input.get(0);  
        return str.toUpperCase();  
        }catch(Exception e){  
        throw new IOException("Caught exception processing input row ", e);  
                }  
            }
}