Sınıflandırma ve regresyon ağacı arasındaki temel fark, sınıflandırmada bağımlı değişkenlerin kategorik ve sırasız olması, regresyonda ise bağımlı değişkenlerin sürekli veya sıralı tam değerler olmasıdır.
Sınıflandırma ve regresyon, toplanan verilerden tahmin modelleri oluşturmaya yönelik öğrenme teknikleridir. Her iki teknik de grafiksel olarak sınıflandırma ve regresyon ağaçları veya daha doğrusu her adımdan sonra veri bölümleri olan akış şemaları veya daha doğrusu ağaçtaki “dal” olarak sunulur. Bu işleme özyinelemeli bölümleme denir. Madencilik gibi alanlar bu sınıflandırma ve regresyon öğrenme tekniklerini kullanır. Bu makale, Sınıflandırma ağacı ve regresyon ağacına odaklanmaktadır.
Sınıflandırma Nedir?
Sınıflandırma, bir öncü değişkenle başlayan verilerin organizasyonunu gösteren bir şemaya ulaşmak için kullanılan bir tekniktir. Bağımlı değişkenler verileri sınıflandırır.
Şekil 01: Veri Madenciliği
Sınıflandırma ağacı, mevcut bağımlı değişkenler tarafından belirlenen şekilde iki gruba ayrılan bağımsız değişkenle başlar. Bağımlı değişkenlerin neden olduğu kategorizasyon şeklinde yanıtları açıklamayı amaçlar.
Regresyon Nedir
Regresyon, varsayılan veya bilinen bir sayısal çıktı değerine dayanan bir tahmin yöntemidir. Bu çıktı değeri, her adımın bir sayısal değere ve bunun gibi başka bir çifte ayrılan başka bir bağımlı değişken grubuna sahip olduğu bir dizi özyinelemeli bölümlemenin sonucudur.
Regresyon ağacı, bir veya daha fazla öncü değişkenle başlar ve bir son çıktı değişkeni ile sona erer. Bağımlı değişkenler ya sürekli ya da ayrı sayısal değişkenlerdir.
Sınıflandırma ve Regresyon Arasındaki Fark Nedir?
Sınıflandırma ve Regresyon |
|
Hedef değişkenin ayrı bir değer kümesi alabileceği bir ağaç modeli. | Hedef değişkenin sürekli değerler alabildiği, tipik olarak gerçek sayılar olan bir ağaç modeli. |
Bağımlı Değişken | |
Sınıflandırma ağacı için bağımlı değişkenler kategoriktir. | Regresyon ağacı için bağımlı değişkenler sayısaldır. |
Değerler | |
Belirli miktarda sırasız değere sahiptir. | Ya ayrık ancak sıralı değerlere ya da ayrık değerlere sahiptir. |
Yapımın Amacı | |
Regresyon ağacını oluşturmanın amacı, her determinant dalına, beklenen çıktı değeri gelecek şekilde bir regresyon sistemi sığdırmaktır. | Bir sınıflandırma ağacı, önceki düğümden türetilen bir bağımlı değişken tarafından belirlendiği şekilde dallara ayrılır. |
Özet – Sınıflandırma ve Regresyon
Regresyon ve sınıflandırma ağaçları, ister sınıflandırmada ister tek bir sayısal değerde çalışılmış bir sonuca işaret eden süreci haritalamak için yararlı tekniklerdir. Sınıflandırma ağacı ile regresyon ağacı arasındaki fark, onların bağımlı değişkenidir. Sınıflandırma ağaçlarının kategorik ve sırasız bağımlı değişkenleri vardır. Regresyon ağaçları, sürekli değerler veya sıralı tam değerler olan bağımlı değişkenlere sahiptir.