你应该知道的统计知识.ppt
文本预览下载声明
你應該知道的統計知識 謝邦昌 輔仁大學統計資訊學系 教授中華資料採礦協會? 理事長 stat1001@.tw WWW.CDMS.ORG.TW 何謂統計學 統計就是從數據中獲取資訊的科學 收集資料 整理資料 分析資料 導出結論 敘述統計學、推論統計學 統計詞彙 母體 個體 樣本 抽樣底冊 參數 統計量 變數 眾數 中位數 平均數 母體與樣本間的關係 騙人的平均數 老謝應徵工作 公司規模:老闆、經理2位、組長3位、職員5位。 老闆:公司平均月薪6萬元,受訓期間1萬五千元,很快會加薪。 平均數:量測觀察值散佈情形的中間值。 標準差:衡量觀察值的散佈情形偏離平均值有多遠。 偏度:描述一個分配偏離對稱性的情形 峰度:衡量觀察值偏離平均數有多快。 變異係數:獲得相對的變異情形。 變異係數=標準差/平均數 某次統計學考試,甲班平均分數為80分,標準差為20,乙班平均分數為75分,標準差為5,哪一班成績較優? 資料衡量尺度 量化的處理工具便稱為衡量的尺度,又稱量表(Scale)。 問卷衡量尺度的設計是評估報告是否深入的關鍵。 不同的量表應用不同的統計分析,準確性才會提高。 考量的依據: 1.研究目的與問題深入的程度 2.事後資料整理時之便利性 3.各種可能選項的周延性與互斥性需兼顧 4.統計的方法 適用於各類量表的統計分析方法列如下表: 資料處理與展示—統計圖表 定性資料 次數分配表 相對次數分配 長條圖 圓餅圖 資料處理與展示—統計圖表 計量資料 次數分配表 相對次數分配表 累加次數分配表 累加相對次數分配表 直方圖 次數多邊圖 枝葉圖 散佈圖 次數分配表 交叉分析表 交叉分析表 圓餅圖 圓餅圖 圓餅圖 折線圖 直方圖 直方圖 直方圖 盒形圖 全班35位同學統計學考試分數 86,77,91,60,35,76,92,47,88,67,23,59,72,75,83,77,68,82 97,89,81,75,74,39,67,79,83,70,78,91,68,49,56,94,81 根據統計顯示,多數車禍發生在車子行駛於一般車速的時候,只有少數車禍發生在車速超過時速150公里。 開快車較安全。 研究顯示,有個城市死於心臟病的人數與口香糖的消費量同時遽增。 嚼口香糖導致心臟病。 現在我要寄一封文件給一位我不認識的人,我先寄給最有可能認識目標者的人,再請他轉寄,如此轉寄到目標者手中,請問中間經過人數? 現場有兩人是同月同日生的機率為? 解讀民意調查 A候選人支持度31.2% B候選人支持度28.5% C候選人支持度24.9% 成功訪問1,068位受訪者,在95%的信心水準下,抽樣誤差為正負3%。 分配(Distribution) 包括了對位置 (location)、散佈 (spread) 及形狀 (shape) 的描述。 在描述 (呈現) 變數的分配形狀時,應了解: (1) 分配的形狀和分配的位置、散佈一樣重要 (2) 在了解分配的形狀時,以視覺化的方式來呈現比以數字來 呈現更令人一目了然 (3) 變數的分配形式決定了用哪一種統計技術來描述比較適當。 位置的衡量(measures of location) 平均數(Mean):平均數指的是算術平均數,也就是在分配中各觀察值的和除以觀察數。 中位數(Median):中位數是分配的中央點。在分配中有一半的觀察點低於,有一半的觀察點高於中位數。如果在分配中觀察點的數目是偶數,則中位數是兩個中間數的平均數。 眾數(Mode):眾數是出現次數最多的那個數字。 散佈的衡量(measures of spread) 變異數(Variance):變異數是衡量以平均數為基準的分配情況。如果所有的分數都相等,則變異數為零。分數分散的情形愈大,則變異數愈大。 標準差(Standard deviation):標準差是變異數的平方根,它免除了變異數的平方,因而增加了解釋力。 全距(Range):全距是分配中最大與最小的分數之差,全距只涉及到最大與最小的分數,因此在衡量散佈方面是相當粗糙的。 散佈的衡量(measures of spread) 四分位距(interquartile range, IQR):是分配中第一、第三分位之差。它也稱為中點分配 (midspread)。第1分位Q1是第25% 的那個數字;中位數或Q2是第50% 的那個數字;第3分位Q3是第75% 的那個數字。 IQR=Q3-Q1 四分位差(quartile deviation):四分位差或稱半四分位距 (semi-interquartile range) 是Q3與Q1間距離的一半。 形狀的衡量(me
显示全部