Veri Madenciliği ve OLAP
Hem veri madenciliği hem de OLAP, yaygın İş Zekası (BI) teknolojilerinden ikisidir. İş zekası, iş verilerinden faydalı bilgileri tanımlamak ve çıkarmak için bilgisayar tabanlı yöntemleri ifade eder. Veri madenciliği, büyük veri kümelerinden ilginç kalıpların çıkarılmasıyla ilgilenen bilgisayar bilimi alanıdır. Yapay zeka, istatistik ve veritabanı yönetimine kadar birçok yöntemi birleştirir. OLAP (çevrimiçi analitik işleme), adından da anlaşılacağı gibi, çok boyutlu veritabanlarını sorgulama yollarının bir derlemesidir.
Veri madenciliği, verilerde Bilgi Keşfi (KDD) olarak da bilinir. Yukarıda bahsedildiği gibi, daha önce bilinmeyen ve ilginç bilgilerin ham verilerden çıkarılmasıyla ilgilenen bir bilgisayar bilimi alanıdır. Özellikle iş gibi alanlarda verilerin katlanarak büyümesi nedeniyle, veri madenciliği, bu büyük veri zenginliğini iş zekasına dönüştürmek için çok önemli bir araç haline geldi, çünkü son birkaç on yılda kalıpların manuel olarak çıkarılması imkansız hale geldi. Örneğin şu anda sosyal ağ analizi, dolandırıcılık tespiti ve pazarlama gibi çeşitli uygulamalar için kullanılmaktadır. Veri madenciliği genellikle şu dört görevle ilgilenir: kümeleme, sınıflandırma, gerileme ve ilişkilendirme. Kümeleme, yapılandırılmamış verilerden benzer grupların belirlenmesidir. Sınıflandırma, yeni verilere uygulanabilen öğrenme kurallarıdır ve tipik olarak aşağıdaki adımları içerir: verilerin ön işlenmesi, modellemenin tasarlanması, öğrenme/özellik seçimi ve değerlendirme/doğrulama. Regresyon, verileri modellemek için minimum hatayla işlevler bulmaktır. Ve ilişkilendirme, değişkenler arasındaki ilişkileri arıyor. Veri madenciliği genellikle gelecek yıl Wal-Mart'ta yüksek kâr elde etmeye yardımcı olabilecek ana ürünler nelerdir gibi soruları yanıtlamak için kullanılır.
OLAP, çok boyutlu sorgulara yanıtlar sağlayan bir sistem sınıfıdır. Tipik olarak OLAP, pazarlama, bütçeleme, tahmin ve benzeri uygulamalar için kullanılır. OLAP için kullanılan veritabanlarının hızlı performans göz önünde bulundurularak karmaşık ve geçici sorgular için yapılandırıldığını söylemeye gerek yok. Tipik olarak bir OLAP çıktısını görüntülemek için bir matris kullanılır. Satırlar ve sütunlar, sorgunun boyutlarına göre oluşturulur. Özet elde etmek için genellikle birden çok tabloda toplama yöntemlerini kullanırlar. Örneğin, bu yılın Wal-Mart'taki satışlarını geçen yıla göre öğrenmek için kullanılabilir mi? Önümüzdeki çeyrekte satışlara ilişkin öngörü nedir? Yüzde değişimine bakarak trend hakkında ne söylenebilir?
Veri madenciliği ve OLAP'ın istihbarat elde etmek için veriler üzerinde çalıştıkları için benzer olduğu açık olsa da, temel fark veriler üzerinde nasıl çalıştıklarından kaynaklanmaktadır. OLAP araçları çok boyutlu veri analizi sağlar ve verilerin özetlerini sağlar, ancak bunun aksine, veri madenciliği veri setindeki oranlara, örüntülere ve etkilere odaklanır. Bu, verilerin "toplama" yoluyla çalışmasına dayanan, ancak veri madenciliği "bölme"ye karşılık gelen, toplamayla ilgili bir OLAP anlaşmasıdır. Diğer dikkate değer fark, veri madenciliği araçları verileri modelleyip eyleme geçirilebilir kurallar getirirken, OLAP'ın gerçek zamanlı olarak iş boyutu boyunca karşılaştırma ve kontrast tekniklerini yürütecek olmasıdır.