Veri madenciliği, büyük ölçekli verilerin içinden faydalı bilgiye ulaşmayı sağlayan işleme verilen isimdir. Büyük veri yığınları içerisinden bilgi edinmeyi sağlar. Geçmişte edinilen verileri kullanarak gelecek ile ilgili tahminlerde bulmayı kolaylaştırır. Ortaya çıkan sonuçlar ile gelişecek senaryolar hakkında önlemler almak veya iyileştirmeler yapmak mümkündür. Veri Madenciliği Hangi Alanlarda Kullanılır?
Veri madenciliğinin kullanım alanları ile ilgili herhangi bir sınırlama yoktur ve verinin biriktiği her yerde veri madenciliği yapılabilir. Günümüzde veri madenciliğinin en yaygın olarak kullanıldığı alanlara bakacak olursak;
Veri Madenciliği Kullanım Alanları
Pazarlama alanında sıkça kullanılan bir yöntemdir. Satılan ürünler ve müşteriler ile ilgili bilgilerin toplanılması ile sağlanır. Bu toplanan verileri satış miktarının tahmin edilmesi ve arttırılması gibi amaçlarla kullanılır.
Bunun dışında hizmet sektörünün de birçok kolunda uygulamalar yapmak mümkündür. Ayrıca bankacılık alanındaki kredilerin belirlenmesi için de faydalanıldığı söylenebilir.
Veri Madenciliği Süreçleri Nelerdir?
Veri Filtreleme: Veri madenciliğinde kullanılacak verilerin belirlenir.. Veri Temizliği: Toplanmış olan verinin içerisinden gereksiz, tutarsız olan verilerin ayıklanır. Veri Birleştirme: Çeşitli kaynaklardan elde edilen ve benzer özelliklerdeki ya da bağlantılı verilerin bir araya getirilir. Veri Seçme: Temizlenmiş ve birleştirilmiş verilerden, analize uygun olanlara karar verilir. Veri Dönüştürme: Eldeki verilerin madencilik için kullanılabilecek türden bir biçime dönüştürülür. Madencilik Çalışması: Bu aşamada, önceki adımlar ile hazırlanmış olan veriler üzerinde, belirlenen amaçlara yönelik veri madenciliği algoritmaları uygulanır. Yorumlama ve Doğrulama: Veri madenciliği uygulaması gerçekleştirildikten sonra, ortaya çıkan sonuçlar değerlendirilir. Doğrulama işlemi, farklı uygulamalardan elde edilen sonuçların karşılaştırılması ile gerçekleştirilir.