面向绝对初学者的机器学习—第6章:预测未来

现在,您已经改进了模型,现在可以通过预测下个赛季的NBA球员效率评估来充分利用它了。 至此,您所创建的只是训练实验,它是准备数据并仅使用历史数据训练模型的实验。

通过基于在调整后效果更好的算法(神经网络回归)创建预测性实验,将其带入一个新的水平。 我们需要设置Predictive Web Service,因此我们既可以将其用作Azure ML工具上的模块,又可以用作通过HTTP请求通过一些输入数据请求预测的端点。

要设置Web服务,请选择连接到神经网络回归算法的“训练模型”模块,在底部栏上找到“设置Web服务”按钮,然后从导航栏中单击“预测Web服务[推荐]”。弹出:

完成后,您将看到类似于以下屏幕的内容:

请注意,这是一个新实验(名为[Predictive Experiment],并显示在其他选项卡上),其中包含训练实验的一些准备步骤,以及“ Web服务输入”和“ Web服务输出”模块。 还请注意,有一个新模块与您为训练实验指定的名称相同,已连接到“得分模型”模块。

为了为有用的预测性实验奠定基础,让我们将“ Web服务输入”模块连接为“得分模型”模块的数据集输入,然后仅保留“ NBA PER预测-训练”模块(我们的训练模型已经打包)作为一个模块),通过删除其他所有内容,“得分模型”模块以及Web服务输入和输出模块。 我们不需要所有其他步骤,因为我们用于未来预测的输入数据集在赛季开始之前已经只有已知列(球员,位置,年龄,球队,赛季),并且不需要执行任何清洗操作或处理此数据。 我们还使用上载但尚未使用的第三个数据集包括下一个赛季的球员数据集:nba_2017_players_input。 您可以在左侧菜单的“保存的数据集>我的数据集”类别下找到它,并将其拖到画布上后,还应将其与“得分模型”模块作为数据集输入进行连接。 现在,您的预测性实验应如下所示:

如果现在运行预测性实验,您将拥有一个数据集,其中包含2016/2017赛季每个NBA球员PER的预测值,称为“得分标签”。 但同样,最好给它们起一个适当的名称,因此让我们在“得分模型”模块之后添加一个“编辑元数据”模块,以将“得分标签”列重命名为实际名称“ PER”:

恭喜! 如果您查看结果数据集, 则将了解未来 ,并查看2016/2017赛季每个活跃NBA球员的预测球员效率等级值(此实验室的内容是在此之前创建的)季节开始,并且仅使用以前的数据)。 请注意,还有一个名为“ Drafted”的新列,该列对于可视化和使用数据这一章很有用,这一章也是本系列中唯一的一章。

#gkout

戈尔卡·马达里亚加(@ Gk_8)


最初以西班牙语发布于 2017年7月25日 MSDN西班牙 博客上。