Keras上基于PIMA糖尿病数据集的实用深度神经网络

大家好,今天我们将学习如何在实用数据集上编写神经网络代码。

好吧,如果您不知道什么是神经网络,我建议您观看Brandon Rohrer的这段视频:(可选)

我们可以在上方看到我们的数据集,现在我们需要拆分功能和标签。

我们可以看到“ 结果”列确定患者是否患有糖尿病(1-糖尿病,0-无糖尿病),其他列确定了对于预测必不可少的特征。

我们将数据分为要素[X]和标签[Y],并在数据集中删除和丢失值。以下代码完成了所需的任务。

  df_label = dataframe ['结果'] 
df_features = dataframe.drop('结果',1)
df_features.replace('?',-99999,inplace = True)

现在我们将对所有标签类型进行热编码。例如,将1变成[1,0],将0变成[0,1]。

 标签= [] 
用于df_label中的实验室:
如果实验室== 1:
label.append([1,0])#类别1
Elif Lab == 0:
label.append([0,1])#类别0

现在我们将数据分为训练和测试集。

  x_train,x_test,y_train,y_test = train_test_split(数据,标签,test_size = 0.2,random_state = 42) 

现在让我们看一下构建神经网络的代码

 模型= Sequential() 
model.add(密集(500,input_dim = 8,激活='sigmoid'))
model.add(密集(100,激活='sigmoid'))
model.add(密集(2,激活='softmax'))
model.compile(loss ='mean_squared_error',优化器='adam',指标= ['准确性'])
model.fit(x_train,y_train,epochs = 1000,batch_size = 70,validation_data =(x_test,y_test))

在这里,我们创建了一个简单的Keras神经网络,其中包含2个隐藏层,一个包含500个图层,另一个包含100个图层,其中包含8个输入要素和2个标签,可以预测

您可以在此处从我的GitHub帐户下载带有预测的完整源代码

您可以在LinkedIn上关注我,以获取更多见解。

干杯! 🙂