ETL, verileri düzenli ve sistematik bir biçimde toparlamak için kullanılan bir veri işleme yöntemidir. Bu yöntemde veriler hedef kaynaktan çekilir ve dönüştürülerek hedef sistemlere aktarılır. Genellikle çok çeşitli veriler biçimleri ve formları birbirinden farklı durumdadır. Bu verilerin analiz edilebilmesi ve anlamlandırılabilmesi için tek bir kaynağa veya aynı biçimlere sahip olması büyük önem taşır. Aksi takdirde analiz süreçleri zorlu ve maliyetli bir hal alabilir. ETL veri işleme yöntemi hem maliyet hem de zaman tasarrufu açısından avantajlıdır. Çünkü bu yöntemde genel olarak veriler ulaşılabilir, değerli ve anlamlı kılınır. ETL işleme yöntemini veri göçü ve entegrasyon süreçlerinde görmek mümkündür.
ETL veri işleme kavramının açılımı “Extract, Transform ve Load” anlamındadır. Bu kavramlar Türkçede “Çekme, Dönüştürme ve Aktarma” anlamına gelir. ETL veri işleme süreci bir depolama alanı hedeflenerek bu üç aşamada ilerler. Bu süreçteki hedeflenen depolama alanı veri ambarı gibi büyük veri için oluşturulan depolama alanları olabilir. ETL veri aktarım süreci aşamaları şu şekilde özetlenebilir:
- Extract (Çekme): Veritabanları, dosya sistemleri veya web servisleri gibi kaynak sistemlerden verilerin çekilme sürecidir. Veriler, kaynak sistemlerdeki tablolardan veya dosyalardan seçilir ve alınır. Bu aşamada, verilerin güvenli bir şekilde ve uygun bir biçimde alınması sağlanır.
- Transform (Dönüştürme): Verilerin dönüştürülmesi aşamasıdır. Bu aşamada, verilerin kaynak sistemden hedef sistemlere aktarılacak formata dönüştürülmesi ve gerektiğinde temizlenmesi, düzenlenmesi veya birleştirilmesi gibi işlemler gerçekleştirilir. Veri dönüşümü süreci verilerin tek bir kanaldan incelenebilmesi ve değerlendirilebilmesi açısından oldukça önemlidir. Veri türü dönüşümleri, değer dönüşümleri, veri birleştirmeleri, filtrelemeler ve hesaplamalar işlemler bu süreçte kullanılır.
- Load (Aktarma): Dönüştürülmüş verilerin hedef sistemlere aktarılması aşamasıdır. Bu aşamada, veriler hedef veritabanlarına, veri depolama sistemlerine veya veri ambarlarına yüklenir. Verilerin hedef sistemlere doğru şekilde ve güvenli bir şekilde aktarılması sağlanır.