文档详情

五章购物篮分析MarketBasketAnalysis.ppt

发布:2017-03-24约1.61千字共19页下载文档
文本预览下载声明
第五章 購物籃分析 Market Basket Analysis 購物籃分析的三大特點 虛擬標籤 (Virtual Items) Confidence、Support 使用購物籃分析的基本流程 使用購物籃分析的基本流程 連續時間序列分析 跨時綜覽 (Time Windows) * * 雖然購物分析的主要資料來源是零售業,但是它仍然可以應用在其他的行業中: ●如果消費者使用信用卡消費,我們將可以推知他 們下一項會購買的商品。 ●電話使用者最常選用的附加功能,可以幫助我 們決定配套方案 。 ●消費者的常用銀行服務,可以幫助我們找出他 們會要的其他服務。 ●異常的保險配套方式可能是詐欺的跡象,提醒 我們進行深入調查。 ●依據患者的病歷,我們可以判定他們使用特定 治療方式發生併發症的可能機會。 有用的 - 包含高品質的有效情報 ●在禮拜四,消費者通常同時購買尿布和啤 酒。 明顯的 - 該行老手已經知道的事 ●消費者簽定維修協定後,通常會買大型家 電用品。 無法理解的 - 看起來沒有合理解釋的 ●當一個大型的五金行開幕後,最常賣出的 商品之一是馬桶蓋。 虛擬標籤可以幫助描述一筆交易,但它們並不是真的分類項 可以幫助比較差異 Example: 健怡可樂 低糖百事可樂 低糖蘇打水 可口可樂 百事可樂 蘇打水 交易紀錄 客戶 商品 1 柳橙汁、蘇打飲料 2 牛奶、柳橙汁、玻璃清潔劑 3 柳橙汁、清潔劑 4 柳橙汁、清潔劑、蘇打飲料 規律 條件 結果 有蘇打飲料, 必有柳橙汁 – 100% 有柳橙汁 , 必有蘇打飲料 – 50% Confidence — 在A事件發生的狀況下,同時發生A、B事件的機率 =條件機率 = P(B∣A) Support— 在所有事件發生的狀況下,同時發生A、B事件的機率 =P(B∩A) 選擇正確的組合 *組成的item是取決於各行業所需 *分類法 – 商品分類 *去除雜質 計算超過門檻的商品 * Support - P(A∩B) * Confidence - P(BlA) 定義threshold 大小 分析機率取得規則 ? 規則(如果 條件句,則 結論句) 表8.5 商品及其組合的機率: 表8.6 規則的信心水準 信心水準最的就是最好的規則,所以我們似乎應該選「如果 B和C 則 A」。但是這裡有點問題,這個規則事實上比隨便說A會出現在交易中還糟。A在45%的交易中出現,但是該規則只有33%的信心水準,規則比隨便猜猜還糟。 這種情況就要利用一技巧 -「增益」( Improvement ) 。增益能告訴我們,一條規則在預測結果時能比隨機發生的機會好多少。公式如下: 當增益效果大於1時,那麼最後的結果會在預期結困的基礎上比單純亂數好;但是當數值小於1時,效果就很差了。表8.7顯示了三種規則的增益效果和最高增益的增益效果。 表8.7 規則的增益效果 當增益效果小於1時,否定陳述句會引出一條比較好的規則。例如: 如果 B 和 C,則 A = 有0.33的信心水準; 如果 B 和 C,則 ~A = 會有0.67的信心水準。 P(~A l B∩C) = 0.67 I(~A l B∩C) = 0.67/0.55 = 1.22 購物籃分析主要發生同一時間的事件,在特定時間點發生的事 時間序列資料 (Time series data) 通常建立在顧客的基本資料上, 才能找出同一個人的不同交易紀錄
显示全部
相似文档