Spark filter
Spark filter函数
在 Spark 中,过滤器函数返回一个新数据集,该数据集是通过选择函数返回 true 的源元素而形成的。所以,它只检索满足给定条件的元素。
过滤函数示例
在这个例子中,我们过滤给定的数据并检索所有值除了 35、
要在 Scala 模式下打开 spark,请按照以下命令进行操作。
使用并行化集合创建 RDD。
scala> val data = sc.parallelize(List(10,20,35,40))
现在,我们可以使用以下命令读取生成的结果。
应用过滤器功能并传递执行所需的表达式。
scala> val filterfunc = data.filter(x => x!=35)
现在,我们可以使用以下命令读取生成的结果。
scala> filterfunc.collect
在这里,我们得到了想要的输出。