统计学 课件 4-4 相对位置的度量:标准化.pptx
第4章数据的概括性度量4.2数据离中趋势的度量相对位置的度量:标准化1
引例:公司的招聘难题某公司要从甲乙两位面试者中录用1人.甲同学在分公司A完成了面试,成绩为1400分,满分为1600分.乙同学在分公司B完成了面试,成绩为30分,满分为36分.两个分公司各面试7人.公司该如何决策?2
引例:公司的招聘难题A99899910001200140014011402B26272728292930方案甲的取值乙的取值录用情况甲乙平均数分数/满分1400/1600=0.87530/36=0.833甲分数/平均分1400/1200=1.16730/28=1.071甲看排名31乙3
标准化:一种相对位置的度量总体的标准化样本的标准化标准分数(Z-score)??????4
B减均值0112Z-score标准化的作用A99899910001200140014011402B26272728292930Z-score方案(A均值:1200,标准差201;B均值:28,标准差1.414)A99899910001200140014011402减均值Z-score作用1:度量某一个值在一组数据中相对位置5
标准化的作用例:哪两位用户行为最相似用户访问频次(次)访问时长(分钟)A620B530C840D545E735F2326
例:哪两位用户行为最相似ABCDEFA0B10.050C20.1010.440D25.0215.005.830E15.035.395.1010.200F12.653.6110.0013.345.830用户ABCDEF658572203040453532未标准化情形下的距离矩阵?7
例:哪两位用户行为最相似计算标准化得分均值标准差用户ABCDEF访问频次访问时长用户ABCDEF访问频次658572访问时长203040453532Z-score8
例:哪两位用户行为最相似ABCDEFA0B1.370C2.752.030D3.211.901.710E1.971.230.831.650F2.601.603.332.292.670标准化得分的距离矩阵9
例:哪两位用户行为最相似回到原始数据,比较是否做标准化对于相似性度量的影响用户ABCDEF访问频次658572访问时长203040453532红色:未做标准化蓝色:标准化作用2:能消除不同数据量纲或规模对计算的影响C标准化的拓展11原始数据?????
小结相对位置:标准化定义:标准化作用:?相对于一组数据中其他值的位置度量相对位置、消除数据规模、……12
思考与练习思考:是不是在任何情况下,在一组中排序第一数据的Z-score都会大于另一组排序第三数据的Z-score?练习:见课程的网络平台.BZ-scoreA99899910001200140014011402Z-score13