Selamlar,

datamining odevi yapmaya calisirken bir yerde takildim, age,income ve gender var datada. k-means kullanarak clusterlara ayirmam gerek. normalization yaptim age ve income'a ama simdi ne yapacagimi bulamadim gender icin.

gender'a normalization yapsam olmayacak, 0 1 cikacak yine :) nasil handle edecegiz bu durumu?

acil cevap please :(

 

Bir sıkıntı olmaz. 1'ler ve 0'lar birleşince zaten [0,1] aralığında bir küme merkezi yaratıyor. 0'lar daha çok olunca küme merkezi 0'a yaklaşıyor, 1'ler çok olunca küme merkezi 1'e yaklaşıyor ve o şekilde sonlanıyor. Normalizasyona gerek yok. Bir de gender'ı ikiye ayırıp Kadın ve erkek diye iki sütunluk data yapılıyrsa (probleme göre) daha güzel olabilir. (Benimkinde o olmadan da düzgün sonuçlar veriyordu). Bunu, 33 tane binary özelliği olan veriye yaptım, cevap olumlu.

aychovsky
1

mobil görünümden çık