KNN & Karar Ağacı
Bu araştırma, göğüs kanseri teşhisi yapmak için kullanılan özelliklerin dijital görüntülerinden elde edilen veri seti üzerinde temellenmiştir. Veri seti, göğüs kanseri teşhisinde önemli bir rol oynayan 10 gerçek değerli özellik içermektedir. Bu özellikler, hücre çekirdeğinin çeşitli parametrelerini ifade eder ve ortalama, standart hata ve en büyük değerler şeklinde 30 farklı özellikle temsil edilir. Bu çalışmada, veri setindeki kanser tanısını belirleyen "diagnosis" sütununa odaklanılmıştır; "M" değeri kötü huylu kanseri, "B" ise iyi huylu kanseri temsil eder.
KNN ve karar ağacı gibi iki makine öğrenimi algoritması, veri seti üzerinde uygulanmıştır. KNN algoritması, sınıflandırma işlemlerini özellikler arasındaki benzerliklere dayanarak yapması ve basitliği sebebiyle tercih edilmiştir. Karar ağacı modeli ise veri setindeki değişkenler arasındaki ilişkileri görsel olarak açıklayarak veri setinin yapısını anlamak için kullanılmıştır.
Sonuçlar incelendiğinde, KNN modelinin kötü huylu kanseri tespit etme konusunda yüksek hassasiyet ve düşük hata oranına sahip olduğu görülmüştür. KNN modelinin kötü huylu kanseri tespit etme konusunda yüksek hassasiyet ve düşük hata oranına sahip olduğu görülmüştür. Karar ağacı modelinin ise özellikle yüksek özgüllük gerektiren durumlarda tercih edilebileceği belirlenmiştir. Ancak, genel olarak, KNN modelinin kanser teşhisinde daha başarılı olduğu sonucuna varılmıştır.
Anahtar Kelimeler: göğüs kanseri, makine öğrenimi, K-En yakın komşu, karar ağacı, kanser teşhisi
Bu çalışmanın sonucunda elde edilen bulgular, KNN modelinin hassas ve doğru bir şekilde kötü huylu kanserleri tespit etme kabiliyetine sahip olduğunu göstermektedir. Ancak, özgüllük konusunda daha fazla iyileştirmeler yapılabilir. Bununla birlikte, karar ağacı modelinin belirli durumlarda tercih edilebileceği ve özellikle yüksek özgüllük gerektiren durumlarda kullanılabileceği sonucuna varılmıştır.
Özellikle, farklı makine öğrenimi modellerinin bu tür kanser teşhisi problemlerindeki performanslarının karşılaştırılması ve iyileştirme potansiyellerinin araştırılması önerilebilir. Ayrıca, daha geniş veri setleriyle yapılan çalışmaların sonuçlarına odaklanarak, model performansının genelleştirilebilirliği de araştırılmalıdır.