【实用算法教学】——教你使用决策树算法预测NBA获胜球队
时间:
来源: 虎扑直播
【实用算法教学】——教你使用决策树算法预测NBA获胜球队视频直播
用read_csv函数就能加载数据集:
上述代码会加载数据集,将其保存到
数据框
(
dataframe
)中。数据框提供了一些非常好用的
方法,后面会用到。我们来看看数据集是否有问题。输入以下代码,输出数据集的前
5
行:
dataset.ix[:5]
输出结果如下:
从输出结果来看,这个数据集可以用,但存在几个小问题。下面我们就来修复这些问题。
从上面的输出结果中,我们发现了以下几个问题。
日期是字符串格式,而不是日期对象。
第一行没有数据。
从视觉上检查结果,发现表头不完整或者不正确。
这些问题来自数据,我们可以改动数据本身,但是这样做的话,容易忘记之前做过哪些操作,
落下步骤或是弄错哪一步,因而无法重现之前的结果。
我们用
pandas
对原始数据进行预处理。
pandas.read_csv
函数提供了可用来修复数据的参数,导入文件时指定这几个参数就好。
导入后,我们还可以修改文件的头部,如下所示:
经过这些处理之后,结果会有很大改善,我们再来输出前5行看看:
dataset.ix[:5]
结果如下:
即使原始数据很规整,比如刚使用的这个,我们仍需要对其做些调整。其中一个原因是,文
件可能来自不同的系统,由于存在兼容性问题,文件也许会发生变化。
<
【文章来源】:虎扑直播篮球资讯,本文唯一链接:http://stonemj.com/news/lanqiu/22922.html
【文章关键词】: