Araştırma Makalesi

KARMA TİPTEKİ VERİLERİ KAMILA, K-ORTALAMALAR, KORTAYLAR ve K-PROTOTİPLER ALGORİTMALARIYLA KÜMELEME: KARŞILAŞTIRMALI BİR UYGULAMA

Cilt: 20 Sayı: 2 30 Kasım 2019
PDF İndir
EN TR

KARMA TİPTEKİ VERİLERİ KAMILA, K-ORTALAMALAR, KORTAYLAR ve K-PROTOTİPLER ALGORİTMALARIYLA KÜMELEME: KARŞILAŞTIRMALI BİR UYGULAMA

Öz

Kümeleme Analizi Sosyal Bilimlerden Fen Bilimlerine birçok alanda yaygın olarak kullanılan önemli bir araçtır. Kümeleme Analizini gerçekleştirebilmek için hazırlanmış pek çok algoritma mevcuttur. Günümüzde bu algoritmalar ile ilgili olarak en çok tartışılan hususlardan ilk ikisinin, karma tipteki veri setleri için hangi kümeleme algoritmasının kullanılması gerektiği ve en iyi küme sayısının nasıl belirlenebileceği olduğu söylenebilir. Bu çalışmada, farklı ölçeklerle ölçülmüş karma tipteki değişkenlerin değerlerini içeren bir veri seti, bu tip veriler için yeni ve çok iddialı bir şekilde oluşturulmuş olan KAMILA algoritması ile analiz edilecektir. Daha sonra veri seti bu algoritmadan önce karma tipteki veriler için kullanılagelen k-ortalamalar, k-ortaylar ve k-prototipler gibi algoritmalarla da kümelere ayrılacaktır. Bu doğrultuda, İstanbul’da faaliyet gösteren yerel bir süpermarket zincirinden sağlanan alışveriş işlem verileri, R programlama dili kullanılarak analiz edilmiştir. Mağazaları İstanbul’un farklı semtlerinde bulunan bu firmanın müşterileri farklı demografik özelliklere ve farklı satın alma davranışlarına sahiptir. İşlem kolaylığı açısından 999 müşteri için sağlanmış olan veri kümesi, müşterilerin firmanın kârlılığı açısından önem arz eden ürün kategorilerinden alış veriş yapıp yapmadıklarını ve satın alınan ürünlerin toplam fiyatının ne kadar olduklarını içermektedir. Bu veriler müşteri segmentasyonu amacıyla kümeleme analizine tâbi tutulmuştur. Sonuç olarak, KAMILA algoritmasının altın segment olarak isimlendirebilecek segmentteki müşterileri başarıyla tespit edebildiği gözlenmiştir. 

Anahtar Kelimeler

Kaynakça

  1. AGGARWAL, Charu C (2015), Data mining: The textbook, Switzerland: Springer.
  2. CUI, Hongyan, Kuo ZHANG, Yajun FANG, Stanislav SOBOLEVSKY, Carlo RATTI and Berthold KP HORN (2017), "A Clustering Validity Index Based on Pairing Frequency", IEEE Access, 5, 24884-24894.
  3. EVERITT, Brian and Torsten HOTHORN. (2011). Cluster analysis An Introduction to Applied Multivariate Analysis with R (pp. 163-200): Springer.
  4. R Development Core Team (2008). R: A language and environment, STATISTICAL COMPUTING. R FOUNDATION FOR STATISTICAL COMPUTING and Austria. ISBN 3-900051-07-0 VIENNA, URL http://www.R-project.org.
  5. FOSS, Alex, Marianthi MARKATOU, Bonnie RAY and Aliza HECHING (2016), "A semiparametric method for clustering mixed data", Machine Learning, 105(3), 419-458.
  6. FOSS, Alexander H, Marianthi MARKATOU and Bonnie RAY (2018), "Distance Metrics and Clustering Methods for Mixed‐type Data", International Statistical Review.
  7. GAN, Guojun, Chaoqun MA and Jianhong WU (2007), Data clustering: theory, algorithms, and applications, (Vol. 20): Siam.
  8. GOWER, John C (1971), "A general coefficient of similarity and some of its properties", Biometrics, 857-871.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

30 Kasım 2019

Gönderilme Tarihi

2 Ocak 2019

Kabul Tarihi

1 Kasım 2019

Yayımlandığı Sayı

Yıl 2019 Cilt: 20 Sayı: 2

Kaynak Göster

APA
Bilgiç, E. (2019). KARMA TİPTEKİ VERİLERİ KAMILA, K-ORTALAMALAR, KORTAYLAR ve K-PROTOTİPLER ALGORİTMALARIYLA KÜMELEME: KARŞILAŞTIRMALI BİR UYGULAMA. Cumhuriyet Üniversitesi İktisadi ve İdari Bilimler Dergisi, 20(2), 48-70. https://doi.org/10.37880/cumuiibf.507182

Cumhuriyet Üniversitesi İktisadi ve İdari Bilimler Dergisi Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY NC) ile lisanslanmıştır.