文档详情

《机器学习与Python实践》课件_03-02数据的正则化.pptx

发布:2025-02-10约小于1千字共31页下载文档
文本预览下载声明

01数据集划分;;;;;;;;;;;;;;;;需要做数据归一化/标准化

线性模型,如基于距离度量的模型包括KNN(K近邻)、K-means聚类、感知机和SVM、神经网络。另外,线性回归类的几个模型一般情况下也是需要做数据归一化/标准化处理的。

不需要做数据归一化/标准化

决策树、基于决策树的Boosting和Bagging等集成学习模型对于特征取值大小并不敏感,如随机森林、XGBoost、LightGBM等树模型,以及朴素贝叶斯,以上这些模型一般不需要做数据归一化/标准化处理。;过拟合和欠拟合;过拟合的处理;通过这张图可以看出,各种不同算法在输入的数据量达到一定级数后,都有相近的高准确度。于是诞生了机器学习界的名言:

成功的机器学习应用不是拥有最好的算法,而是拥有最多的数据!

;欠拟合的处理;?;?;正则化;正则化;正则化;偏差和方差;偏差和方差;偏差和方差;偏差和方差;参考文献

显示全部
相似文档