Weka教程

Weka 加载数据

在本章中,我们从您用于预处理数据的第一个选项卡开始。这对于您将应用于数据以构建模型的所有算法都是通用的,并且是 WEKA 中所有后续操作的通用步骤。
要使机器学习算法提供可接受的准确度,您必须先清理数据,这一点很重要。这是因为从该字段收集的原始数据可能包含空值、不相关的列等。
在本章中,您将学习如何预处理原始数据并创建一个干净、有意义的数据集以供进一步使用。
首先,您将学习将数据文件加载到 WEKA 资源管理器中。可以从以下来源加载数据-
本地文件系统 网络 数据库
在本章中,我们将详细了解加载数据的所有三个选项。

从本地文件系统加载数据

就在您在上一课中学习的机器学习选项卡下,您会发现以下三个按钮-
打开文件... 打开网址... 打开数据库...
点击 打开文件 ...按钮。目录导航器窗口打开,如下面的屏幕所示-
本地文件系统
现在,导航到存储数据文件的文件夹。 WEKA 安装提供了许多示例数据库供您试验。这些可以在 WEKA 安装的 data 文件夹中找到。
出于学习目的,请从此文件夹中选择任何数据文件。该文件的内容将在 WEKA 环境中加载。我们很快就会学习如何检查和处理这些加载的数据。在此之前,让我们看看如何从 Web 加载数据文件。

从网络加载数据

点击 打开 URL ... 按钮后,您可以看到如下窗口-
从 Web 加载数据
我们将从公共 URL 打开文件 在弹出框中键入以下 URL-
https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff
您可以指定存储数据的任何其他 URL。 Explorer 会将远程站点的数据加载到其环境中。

从数据库加载数据

一旦你点击 Open DB ...按钮,你可以看到一个窗口如下-
从数据库加载数据
设置到您的数据库的连接字符串,设置数据选择查询,处理查询并在 WEKA 中加载所选记录。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4