En Yakın Komşu (Nearest Neighborhood) Algoritması
Veri analizi veya veri bilimi konularında sıkça karşımıza çıkan k-nn algoritması (en yakın komşu) oldukça önemlidir.
Sınıflandırma adı altında geçen bu algoitma birden çok veri kümesi arasında yeni gelen bir verinin hangi kümeye ait olacağını belirleyen bir olgudur.
Burada ki k değeri ise kaç komşuluğa bakılacağını belirler. Kısa bir ifade ile anlatmakta fayda var.
Yukarı da ki örneği referans alırsak örneğin k değerimiz 1 olsun. Gördüğünüz üzere iki sınıfımız var daire(kırmızı) ve kare(mavi) burada ortaya atılan bir veri(siyah nokta) hangi sınıfa daha yakın ise o sınıfta değerlendirmemiz doğru olacaktır.
Ama k değerimiz farklı bir değer olsa idi mesele 3 en yakın 3 değere bakarak bu sınıflandırmayı yapacaktık.
İpucu : k değerini tek sayı vermek doğru bir yaklaşım olacaktır aksi halde sınıflandırırken kararsız kalma şansımızı ortadan kaldıracaktır. (Eşit olması dahilinde)
Projenin örnek kodlamasına (java) buradan ulaşabilirsiniz.