Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) veri tabanındaki yanlış – alakasız, tutarsız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Bununla amaç bir veri standardizasyonu sağlamaktır.

Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) denilen işlem, ilgili veri tabanındaki yanlış – alakasız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Burada yinelenen bilgiler, alakasız veriler vs. tespit edilerek çıkarılır, biçimlendirilir, gerekirse veri tabanından silinir. Hatalı ve tutarsız verileri şekle sokmak, mümkünse kaldırmaktan meydana geldiği için veri temizlemenin en büyük amacı veri kalitesini artırmak ve veri güvenilirliğini, doğruluğunu sağlamaktır. Veri temizleme (Data Cleansing) işlemi içerisinde veri tabanından kaldırılan / silinenlere ise genellikle “kirli veri” adı verilir. Özellikle devasa veri kümelerine & veri tabanına sahip şirketler, işletmeler, markalar bu işlemden sıklıkla yararlanır. Bunun içinse bu tür kayıtları tespit edebilen ve yaygın hataları, tutarsızlıkları düzeltebilen otomatik araçlar ve algoritmalar kullanılabilmektedir. Özellikle büyük işletmeler otomatik işlem sağlayan bu tür araçlardan yararlanarak zamandan da ciddi ölçüde kazanabilmektedir. Buna bir örnek vermek gerekirse yanlış girilen veriler (müşteri bilgileri gibi), boş kalmış alanlar, geçersiz değerler ya da aynı verinin tekrar etmesi gibi durumlar veri tabanının doğruluğunu ve güvenilirliğini olumsuz anlamda etkiler. Böyle şartlarda firmalar, veri temizliğine girişerek veri tabanı güvenilirliğini artırabilir.

Veri temizleme işlemi 5 farklı adımdan meydana gelebilir. İlk adımda veri tabanındaki veriler analiz edilir ve buradaki olası hatalar, tutarsızlıklar, eksikler ya da tekrara düşenler belirlenir. Ardından ayıklanan bu verilere yönelik olarak düzeltme işlemine gidilir. Örneğin, yanlış girilen değerler bu aşamada düzenlenir. Üçüncü adımda ise eksik verileri tamamlamak mümkündür. Dördüncü adımda ise tüm önceki işlemlerden sonra gereksiz olan veriler ayıklanır ve kaldırılır. Bu aşamada kaldırılan veriler genellikle tekrar eden kayıtlardır. Son olarak ise tüm bu işlemlerin ardından bir standardizasyon sağlanır. Tarih bilgilerinin ya da adres kayıtlarının aynı formatta girilmesi buna örnek gösterilebilir. Veri temizleme süreci bu beş adımdan meydana gelebilmektedir. Amazon Web Services (AWS) gibi yan kuruluşlar veri temizleme için sık kullanılan platformlardır.

Sözlükte Keşfet

Kalite Puanı (Quality Score)

Kalite Puanı, belli anahtar kelimelerinizle arama yapan ziyaretçilerin reklamınızda veya açılış sayfanızda yaşadığı...

SPAM

SPAM, elektronik posta ya da sosyal medya gibi platformlarda, alıcının isteği ve izni...

Veri Bilimi (Data Science)

Veri bilimi (data science), devasa miktarlara ulaşan verilerin toplanıp işlenebilmesini sağlayan bir çalışma...

Customer Churn Analizi

Customer Churn analizi, müşteri bağlılığını artırmaya ve müşteri kaybının sebeplerini tespit etmeye yönelik...

Data Mart

Data mart, bir kurumun hızlı ve pratik bir şekilde bilgi ihtiyaçlarını karşılamak amacıyla...

Yeniliklerden Haberdar Olun!

Dijital pazarlama dünyasını takip etmek için hemen haber bültenimize abone olun!

Arama Sonuçları