KDD ve Veri Madenciliği Arasındaki Fark

KDD ve Veri Madenciliği Arasındaki Fark
KDD ve Veri Madenciliği Arasındaki Fark

Video: KDD ve Veri Madenciliği Arasındaki Fark

Video: KDD ve Veri Madenciliği Arasındaki Fark
Video: Sermaye Yapısı Farklılıkları (Finans ve Sermaye Piyasaları) 2024, Kasım
Anonim

KDD vs Veri madenciliği

KDD (Veritabanlarında Bilgi Keşfi), insanların büyük sayısallaştırılmış veri koleksiyonlarından yararlı ve önceden bilinmeyen bilgileri (yani bilgi) çıkarmasına yardımcı olacak araçları ve teorileri içeren bir bilgisayar bilimi alanıdır. KDD birkaç adımdan oluşur ve Veri Madenciliği bunlardan biridir. Veri Madenciliği, verilerden kalıp çıkarmak için belirli bir algoritmanın uygulanmasıdır. Bununla birlikte, KDD ve Veri Madenciliği birbirinin yerine kullanılır.

KDD nedir?

Yukarıda bahsedildiği gibi, KDD, ham verilerden önceden bilinmeyen ve ilginç bilgilerin çıkarılmasıyla ilgilenen bir bilgisayar bilimi alanıdır. KDD, uygun yöntem veya teknikler geliştirerek verileri anlamlandırmaya çalışma sürecidir. Bu süreç, düşük seviyeli verilerin daha kompakt, soyut ve kullanışlı olan diğer formlara eşlenmesiyle ilgilenir. Bu, kısa raporlar oluşturarak, veri üretme sürecini modelleyerek ve gelecekteki vakaları tahmin edebilen tahmine dayalı modeller geliştirerek elde edilir. Özellikle iş gibi alanlarda verilerin katlanarak büyümesi nedeniyle, KDD, bu büyük veri zenginliğini iş zekasına dönüştürmek için çok önemli bir süreç haline geldi, çünkü son birkaç on yılda kalıpların manuel olarak çıkarılması imkansız hale geldi. Örneğin, şu anda sosyal ağ analizi, dolandırıcılık tespiti, bilim, yatırım, üretim, telekomünikasyon, veri temizleme, spor, bilgi alma gibi çeşitli uygulamalar ve büyük ölçüde pazarlama için kullanılmaktadır. KDD genellikle gelecek yıl Wal-Mart'ta yüksek kar elde etmeye yardımcı olabilecek ana ürünler nelerdir gibi soruları yanıtlamak için kullanılır. Bu işlemin birkaç adımı vardır. Uygulama alanı ve hedef hakkında bir anlayış geliştirmek ve ardından bir hedef veri kümesi oluşturmakla başlar. Bunu, verilerin temizlenmesi, ön işlenmesi, az altılması ve projeksiyonu takip eder. Bir sonraki adım, modeli belirlemek için Veri Madenciliği'ni (aşağıda açıklanmıştır) kullanmaktır. Son olarak, keşfedilen bilgi görselleştirerek ve/veya yorumlayarak pekiştirilir.

Veri Madenciliği Nedir?

Yukarıda bahsedildiği gibi, Veri Madenciliği genel KDD sürecinin yalnızca bir adımıdır. Uygulamanın amacı tarafından tanımlanan iki ana Veri Madenciliği hedefi vardır ve bunlar doğrulama veya keşiftir. Doğrulama, kullanıcının veriler hakkındaki hipotezini doğrularken, keşif otomatik olarak ilginç kalıplar buluyor. Dört ana veri madenciliği görevi vardır: kümeleme, sınıflandırma, regresyon ve ilişkilendirme (özetleme). Kümeleme, yapılandırılmamış verilerden benzer grupların belirlenmesidir. Sınıflandırma, yeni verilere uygulanabilen öğrenme kurallarıdır. Regresyon, verileri modellemek için minimum hatayla işlevler bulmaktır. Ve ilişkilendirme, değişkenler arasındaki ilişkileri arıyor. Ardından, belirli veri madenciliği algoritmasının seçilmesi gerekir. Hedefe bağlı olarak lineer regresyon, lojistik regresyon, karar ağaçları ve Naive Bayes gibi farklı algoritmalar seçilebilir. Daha sonra bir veya daha fazla temsili formdaki ilgi örüntüleri aranır. Son olarak, modeller tahmine dayalı doğruluk veya anlaşılabilirlik kullanılarak değerlendirilir.

KDD ile Veri madenciliği arasındaki fark nedir?

KDD ve Veri Madenciliği terimleri birbirinin yerine yoğun şekilde kullanılsa da, birbiriyle ilişkili ancak biraz farklı iki kavramı ifade eder. KDD, verilerden bilgi çıkarmanın genel sürecidir, Veri Madenciliği ise verilerdeki kalıpları tanımlamayla ilgilenen KDD sürecinin içindeki bir adımdır. Başka bir deyişle, Veri Madenciliği, yalnızca KDD sürecinin genel amacına dayanan belirli bir algoritmanın uygulanmasıdır.

Önerilen: