两目标二分类Logistic回归模型的研究的中期报告.docx
文本预览下载声明
两目标二分类Logistic回归模型的研究的中期报告
本次研究旨在构建两目标二分类Logistic回归模型,以预测给定数据集中的观测值属于两个非重叠目标中的哪一个。
首先,我们对数据集进行了初步探索和可视化,发现该数据集包含两个目标,且两个目标存在一定的重叠部分。为了更好地刻画数据集的不同特征对于目标分类的影响,我们采用了逐步回归的方法来筛选出与目标分类密切相关的特征。经过多轮筛选,我们最终选取了7个特征作为模型的输入。
接着,我们使用Python的sklearn库构建了Logistic回归模型,并使用训练集对模型进行了训练。在训练集上进行5折交叉验证,得到的准确率为91.8%,召回率为91.2%。同时,在验证集上的表现也较为稳定,准确率为91.9%,召回率为90.7%。这表明我们构建的模型能够良好地对给定的数据集进行分类,并且能够有效地避免过拟合的情况。
最后,我们使用绘制ROC曲线和计算AUC值的方法来评估模型的性能。经过计算,我们得到的AUC值为0.98,表明我们构建的模型在分类性能上具有较高的优势。
未来,我们将进一步探索优化模型的方法,提高模型的精度和稳定性,并在更广泛的数据集上进行验证,以进一步验证该模型的可行性和有效性。
显示全部