En Yakın Komşu (Nearest Neighborhood) Algoritması

Veri analizi veya veri bilimi konularında sıkça karşımıza çıkan k-nn algoritması (en yakın komşu) oldukça önemlidir.

Sınıflandırma adı altında geçen bu algoitma birden çok veri kümesi arasında yeni gelen bir verinin hangi kümeye ait olacağını belirleyen bir olgudur.

Burada ki k değeri ise kaç komşuluğa bakılacağını belirler. Kısa bir ifade ile anlatmakta fayda var.

Yukarı da ki örneği referans alırsak örneğin k değerimiz 1 olsun. Gördüğünüz üzere iki sınıfımız var daire(kırmızı) ve kare(mavi) burada ortaya atılan bir veri(siyah nokta) hangi sınıfa daha yakın ise o sınıfta değerlendirmemiz doğru olacaktır.

Ama k değerimiz farklı bir değer olsa idi mesele 3 en yakın 3 değere bakarak bu sınıflandırmayı yapacaktık.

İpucu : k değerini tek sayı vermek doğru bir yaklaşım olacaktır aksi halde sınıflandırırken kararsız kalma şansımızı ortadan kaldıracaktır. (Eşit olması dahilinde)

Projenin örnek kodlamasına (java) buradan ulaşabilirsiniz.

results matching ""

    No results matching ""