Hadoop教程
HBase
Hive
Pig
Sqoop
Spark

Pig Latin

Pig Latin是Apache Pig用于分析Hadoop中数据的一种数据流语言。它是一种文本语言,将Java MapReduce习惯用法中的编程抽象为一种符号。

PigLatin语句

PigLatin语句用于处理数据。它是一个接受一个关系作为输入并生成另一个关系作为输出的运算符。
它可以跨越多行。 每个语句必须以分号结尾。 它可能包括表达式和模式。 默认情况下,这些语句是使用多查询执行处理的

PigLatin约定

符号 说明
() 括号可以包含一个或多个项目。它也可以用来表示元组数据类型。
示例-(10,xyz,(3,6,9))
[] 直括号可以包含一个或多个项目。它也可以用来指示地图数据类型。
示例-[INNER |外部]
{} 大括号括起来的两个或多个项目。它还可以用于指示bag数据类型
示例-{block | nested_block}
... 水平省略号表示您可以重复一部分代码。
示例-cat path [path ...]

Latin数据类型

简单数据类型
类型 说明
int 它定义了带符号的32位整数。
示例-2
long 它定义了带符号的64位整数。
示例-2L或2l
float 它定义了32位浮点数。
示例-2.5F或2.5f或2.5e2f或2.5.E2F
double 它定义64位浮点数。
示例-2.5或2.5或2.5e2f或2.5.E2F
chararray 它以Unicode UTF-8格式定义字符数组。
示例-lidihuo
bytearray 它定义字节数组。
boolean 它定义了布尔类型值。
示例-true/false
datetime 它按日期时间顺序定义值。
示例-1970-01-01T00: 00: 00.000 + 00: 00
biginteger 它定义Java BigInteger值。
示例-5000000000000
bigdecimal 它定义了Java BigDecimal值。
示例-52.232344535345
复杂类型
类型 说明
tuple 它定义了一组有序的字段。
示例-(15,12)
bag 它定义了一个元组的集合。
示例-{(15,12),(12,15)}
map 它定义了一组键值对。
示例-[open#apache]
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4