Data Mining Pertemuan Ke 3


Entropi (5) = -1 * 10/14 * log(10/14) + (-1) * 4/14 * log(4/14) = 0,86
Entropi (Rainy) = -1 *1/15 * log(1/5) + (-1) * 4/5 * log(4/5) = 0,72
Gain(S, Outlook) = 0,86 - [(4/14 * 0) + (5/14*0,72) + (5/14 * 0,97)] = 0,25


Contoh Algoritma Apriori untuk Pencarian Association Rule

Misalkan :

TID

Itemset
1
A.html, C.html, D.html
2
B.html, C.html, E.html
3
A.html, B.html, C.html, E.html
4
B.html, E.html

Misalkan diinginkan minsup : 50% (2 dari 4 transaksi)

Langkah 1:
L1={large 1-itemset}

Itemset

Support
A
50%
B
75%
C
75%
D
25%
E
75%

Langkah 2: Mencari kandidat itemset untuk L2:

2.1 : Gabungkan itemset pada L1 (algoritma apriori-gen)
           
            { A B, A C, A D, A E, B C, B D, B E, C D, C E, D E}

2.2 : Hapus yang tidak ada dalam itemset
            Itemset { B D, DE} dihapus karena tidak ada dalam itemset
           
Langkah 3 :                                                                    Langkah 4:
Hitung support dari setiap kandidat itemset                 L2 { large 2-itemset}

Itemset

Support




A B
25 %

 

 

 

Itemset

Support
A C
50 %



A C
50 %
A D
25 %



B C
50%
A E
25%



B E
75%
B C
50%



C E
50%
B E
75%




C D
25%




C E
50%






Langkah 5 : Ulangi langkah 2-4

5.1 :  Gabungkan itemset pada L2 & L2:
           

Itemset

Hasil Gabungan (3 itemset)
A C + B C
A C B
A C + B E
A C B, A C E, A B E
A C + C E
A C E
B C + B E
B C E
B C + C E
B C E
B E + C E
B C E

5. 2 : Hapus yang tidak ada dalam itemset : { A C E }

Langkah 6 : Hitung support dari setiap kandidat itemset L3


Itemset

Support
A B C
25 %
A B E
25 %
B C E
50 %

Langkah 7 : L3 { large 3-itemset }  { B C E}


Langkah 8 : STOP karena sudah tidak ada lagi kandidat untuk 4-itemset.

Dari hasil – hasil diatas hasil akhir sebagai berikut:
L1                                   L2                                 L3
A
50%

A C
50%

B C E
50%
B
75%

B C
50%



C
75%

B E
75%



D
25%

C E
50%



E
75%







Untuk mencari aturan asosiasi diperlukan juga minconf
Misal minconf : 75 %, aturan asosiasi yang mungkin terbentuk:
Aturan (X è Y)
Sup(X È Y)
Sup(X)
Confidence
B C à E
50%
50%
100%
B E à C
50%
75%
66.67%
C E à B
50%
50%
100%
A à C
50%
50%
100 %
C à A
50%
75%
66.67%
B à C
50%
75%
66.67%
C à B
50%
75%
66.67%
B à E
75%
75%
100%
E à B
75%
75%
100%
C à E
50%
75%
66.67%
E à C
50%
75%
66.67%

No comments:

Post a Comment

My Shortcut URL: http://bit.ly/udinus << Click Here