Entropi (5) = -1 * 10/14 * log(10/14) + (-1) * 4/14 * log(4/14) = 0,86
Entropi (Rainy) = -1 *1/15 * log(1/5) + (-1) * 4/5 * log(4/5) = 0,72
Gain(S, Outlook) = 0,86 - [(4/14 * 0) + (5/14*0,72) + (5/14 * 0,97)] = 0,25
Contoh Algoritma Apriori untuk Pencarian Association
Rule
Misalkan
:
TID
|
Itemset
|
1
|
A.html,
C.html, D.html
|
2
|
B.html,
C.html, E.html
|
3
|
A.html,
B.html, C.html, E.html
|
4
|
B.html,
E.html
|
Misalkan
diinginkan minsup : 50% (2 dari 4 transaksi)
Langkah
1:
L1={large 1-itemset}
Itemset |
Support
|
A
|
50%
|
B
|
75%
|
C
|
75%
|
D
|
25%
|
E
|
75%
|
Langkah
2: Mencari kandidat itemset untuk L2:
2.1
: Gabungkan itemset pada L1 (algoritma apriori-gen)
{ A B, A C, A D, A E, B C, B D, B E,
C D, C E, D E}
2.2
: Hapus yang tidak ada dalam itemset
Itemset { B D, DE} dihapus karena
tidak ada dalam itemset
Langkah
3 : Langkah
4:
Hitung
support dari setiap kandidat itemset L2
{ large 2-itemset}
Itemset |
Support
|
|||||
A
B
|
25
%
|
Itemset |
Support
|
|||
A
C
|
50
%
|
A
C
|
50
%
|
|||
A
D
|
25
%
|
B
C
|
50%
|
|||
A
E
|
25%
|
B
E
|
75%
|
|||
B
C
|
50%
|
C
E
|
50%
|
|||
B
E
|
75%
|
|||||
C
D
|
25%
|
|||||
C
E
|
50%
|
Langkah 5 : Ulangi langkah 2-4
5.1
: Gabungkan itemset pada L2 & L2:
Itemset |
Hasil
Gabungan (3 itemset)
|
A
C + B C
|
A
C B
|
A
C + B E
|
A
C B, A C E, A B E
|
A
C + C E
|
A
C E
|
B
C + B E
|
B
C E
|
B
C + C E
|
B
C E
|
B
E + C E
|
B
C E
|
5.
2 : Hapus yang tidak ada dalam itemset : { A C E }
Langkah 6 : Hitung support dari setiap kandidat itemset L3
Itemset |
Support
|
A
B C
|
25
%
|
A
B E
|
25
%
|
B
C E
|
50
%
|
Langkah 7 : L3 { large 3-itemset } { B C E}
Langkah
8 : STOP karena sudah tidak ada lagi kandidat untuk 4-itemset.
Dari
hasil – hasil diatas hasil akhir sebagai berikut:
L1 L2 L3
A
|
50%
|
A
C
|
50%
|
B
C E
|
50%
|
||
B
|
75%
|
B
C
|
50%
|
||||
C
|
75%
|
B
E
|
75%
|
||||
D
|
25%
|
C
E
|
50%
|
||||
E
|
75%
|
Untuk
mencari aturan asosiasi diperlukan juga minconf
Misal
minconf : 75 %, aturan asosiasi yang mungkin terbentuk:
Aturan
(X è Y)
|
Sup(X
È Y)
|
Sup(X)
|
Confidence
|
B
C à E
|
50%
|
50%
|
100%
|
B
E à C
|
50%
|
75%
|
66.67%
|
C
E à B
|
50%
|
50%
|
100%
|
A à C
|
50%
|
50%
|
100 %
|
C
à A
|
50%
|
75%
|
66.67%
|
B à
C
|
50%
|
75%
|
66.67%
|
C à
B
|
50%
|
75%
|
66.67%
|
B
à E
|
75%
|
75%
|
100%
|
E
à B
|
75%
|
75%
|
100%
|
C
à E
|
50%
|
75%
|
66.67%
|
E
à C
|
50%
|
75%
|
66.67%
|
No comments:
Post a Comment