决策树基本概念教材.pptx
1;2;3;4;5;6;7;8;9;10;11;算法基本策略;算法:Generate_decision_tree。由数据分区D中的训练元组产生决策树。
输入:
数据分区D,训练元组和他们对应类标号的集合
attribute_list,候选属性的集合。
Attribute_selection_method,一个确定“最好地”划分数据元组为个体类的分裂准则的过程。这个准则由分裂属性(splitting_attribute)和分裂点或划分子集组成。
输出:一棵决策树。
方法:
(1)创建一个结点N;
(2)ifD中的元组都在同一类C中then
(3)返回N作为叶结点,以类C标记;
(4)ifattribute_list为空then
(5)返回N作为叶结点,标记为D中的多数类;//多数表决
(6)使用Attribute_selection_method(D,attribute_list),找出“最好的”splitting_criterion;
(7)用splitting_criterion标记结点N;
(8)ifsplitting_attribute是离散值的,并且允许多路划分then//不限于二叉树
(9)从attribute_list中删除分裂属性;
(10)forsplitting_criterion的每个输出j
//划分元组并对每个分区产生子树
(11)设Dj是D中满足输出j的数据元组的集合;//一个分区
(12)ifDj为空then
(13)加一个树叶到结点N,标记为D中的多数类;
(14)else加一个由Generate_decision_tree(Dj,attribute_list)返回的结点到N;
endfor
(15)返回N;
;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;组合方法:提高分类准确率;装袋:自助聚集;装袋:自助聚集;提升;41;42;小结;9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。10月-2010月-20Sunday,October11,2020
10、人的志向通常和他们的能力成正比例。08:50:0108:50:0108:5010/11/20208:50:01AM
11、夫学须志也,才须学也,非学无以广才,非志无以成学。10月-2008:50:0108:50Oct-2011-Oct-20
12、越是无能的人,越喜欢挑剔别人的错儿。08:50:0108:50:0108:50Sunday,October11,2020
13、志不立,天下无可成之事。10月-2010月-2008:50:0108:50:01October11,2020
14、ThankyouverymuchfortakingmewithyouonthatsplendidoutingtoLondon.ItwasthefirsttimethatIhadseentheToweroranyoftheotherfamoussights.IfIdgonealone,Icouldnthaveseennearlyasmuch,becauseIwouldnthaveknownmywayabout.
。11十月20208:50:01上午08:50:0110月-20
15、会当凌绝顶,一览众山小。十月208:50上午10月-2008:50October11,2020
16、如果一个人不知道他要驶向哪头,那么任何风都不是顺风。2020/10/118:50:0108:50:0111October2020
17、一个人如果不到最高峰,他就没有片刻的安宁,他也就不会感到生命的恬静和光荣。8:50:01上午8:50上午08:50:0110月-20