Weka教程

Weka 文件格式

WEKA 支持大量的数据文件格式。这是完整的列表-
arff arff.gz bsi csv data dat json json.gz libsvm m names xrff xrff.gz
它支持的文件类型列在屏幕底部的下拉列表框中。这显示在下面给出的屏幕截图中。
下拉列表
如您所见,它支持多种格式,包括 CSV 和 JSON。默认文件类型为 Arff。

Arff 格式

Arff 文件包含两部分-标题和数据。
标题描述了属性类型。 数据部分包含逗号分隔的数据列表。
作为 Arff 格式的示例,从 WEKA 示例数据库加载的 Weather 数据文件如下所示-
示例数据库
从截图中,您可以推断出以下几点-
@relation 标签定义了数据库的名称。 @attribute 标签定义了属性。 @data 标记开始数据行列表,每行都包含逗号分隔的字段。 属性可以采用名义值,如此处所示的前景-
@attribute outlook (sunny, overcast, rainy)
在这种情况下,属性可以采用实际值-
@attribute temperature real
您还可以设置一个名为 play 的 Target 或 Class 变量,如下所示-
@attribute play (yes, no)
目标假设两个名义值是或否。

其他格式

Explorer 可以加载前面提到的任何格式的数据。由于 arff 是 WEKA 中的首选格式,您可以从任何格式加载数据并将其保存为 arff 格式以备后用。对数据进行预处理后,只需将其保存为 arff 格式以供进一步分析。
现在您已经学习了如何将数据加载到 WEKA 中,在下一章中,您将学习如何预处理数据。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4