Bayes Sınıflandırma Algoritması
Veri Madenciliği ve Makine Öğrenmesi konularında karşımıza çıkan bir diğer sınıflandırma algoritması ise Bayes sınıflayıcıdır.
Bayes sınıflayıcı öğrenilmiş veri (training data) üzerinde belirli matematiksel işlemler yaparak örnek verinin hangi sınıfa ait olduğuna kadar veren bir algoritmadır.
Matematiksel Formül
Basit bir örnek üzerinden gidersek formül daha iyi anlaşılacaktır.
Magazin | Futbol | Dizi | Haber | Cinsiyet |
---|---|---|---|---|
evet | hayır | hayır | hayır | erkek |
evet | hayır | hayır | evet | kadın |
hayır | hayır | evet | hayır | erkek |
evet | evet | hayır | evet | erkek |
evet | hayır | evet | hayır | kadın |
hayır | hayır | evet | evet | kadın |
evet | hayır | hayır | evet | erkek |
hayır | hayır | hayır | evet | erkek |
evet | hayır | hayır | hayır | erkek |
evet | evet | evet | hayır | kadın |
Elimizde yukarıda ki gibi bir veri kümesi olduğunu varsayalım. Erkeklerin ve Kadınların daha önceden bu davranışları kaydedilmiştir. Amacımız bu veri kümesine sonradan eklenecek olan birinin davranışları üzerinden kadın mı erkek mi ayrımını yapmaktır.
Örnek veri de aşağıdaki gibi olsun.
Magazin | Futbol | Dizi | Haber | Cinsiyet |
---|---|---|---|---|
evet | evet | hayır | hayır | ? |
Verilen örnek veriye göre her iki cinsiyet içinde davranışları förmülize edelim.
İlk olarak Erkek cinsiyetinden başlayalım.
Burada ki P harfi olasılığı ifade etmektedir. (Probability)
P(Magazin = evet | Cinsiyet = erkek) = 4/6
P(Futbol = evet | Cinsiyet = erkek) = 1/6
P(Dizi = hayır | Cinsiyet = erkek) = 5/6
P(Haber= hayır | Cinsiyet = erkek) = 3/6
P(Cinsiyet = erkek | Tüm Veri) = 6/10
P(Cinsiyet = erkek | Örnek Veri) = 0.0277 = (4/6) * (1/6) * (5/6) * (3/6) * (6/10)
Verilen örnek veri için erkek olma olasılığı yukarı da hesaplanmıştır. Şimdi diğer bir ihtimal olan kadın olma olasılığına bakalım.
P(Magazin = evet | Cinsiyet = kadın) = 3/4
P(Futbol = evet | Cinsiyet = kadın) = 1/4
P(Dizi = hayır | Cinsiyet = kadın) = 1/4
P(Haber= hayır | Cinsiyet = kadın) = 2/4
P(Cinsiyet = erkek | Tüm Veri) = 4/10
P(Cinsiyet = erkek | Örnek Veri) = 0.0093 = (3/4) * (1/4) * (1/4) * (2/4) * (4/10)
Sonuç olarak 0.0277 > 0.0093 olduğu için verilen örnek verinin cinsiyeti erkektir diyoruz.
Magazin | Futbol | Dizi | Haber | Cinsiyet |
---|---|---|---|---|
evet | evet | hayır | hayır | erkek |
Projenin kod örneğini buradan inceleyebilirsiniz.