Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) veri tabanındaki yanlış – alakasız, tutarsız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Bununla amaç bir veri standardizasyonu sağlamaktır.

Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) denilen işlem, ilgili veri tabanındaki yanlış – alakasız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Burada yinelenen bilgiler, alakasız veriler vs. tespit edilerek çıkarılır, biçimlendirilir, gerekirse veri tabanından silinir. Hatalı ve tutarsız verileri şekle sokmak, mümkünse kaldırmaktan meydana geldiği için veri temizlemenin en büyük amacı veri kalitesini artırmak ve veri güvenilirliğini, doğruluğunu sağlamaktır. Veri temizleme (Data Cleansing) işlemi içerisinde veri tabanından kaldırılan / silinenlere ise genellikle “kirli veri” adı verilir. Özellikle devasa veri kümelerine & veri tabanına sahip şirketler, işletmeler, markalar bu işlemden sıklıkla yararlanır. Bunun içinse bu tür kayıtları tespit edebilen ve yaygın hataları, tutarsızlıkları düzeltebilen otomatik araçlar ve algoritmalar kullanılabilmektedir. Özellikle büyük işletmeler otomatik işlem sağlayan bu tür araçlardan yararlanarak zamandan da ciddi ölçüde kazanabilmektedir. Buna bir örnek vermek gerekirse yanlış girilen veriler (müşteri bilgileri gibi), boş kalmış alanlar, geçersiz değerler ya da aynı verinin tekrar etmesi gibi durumlar veri tabanının doğruluğunu ve güvenilirliğini olumsuz anlamda etkiler. Böyle şartlarda firmalar, veri temizliğine girişerek veri tabanı güvenilirliğini artırabilir.

Veri temizleme işlemi 5 farklı adımdan meydana gelebilir. İlk adımda veri tabanındaki veriler analiz edilir ve buradaki olası hatalar, tutarsızlıklar, eksikler ya da tekrara düşenler belirlenir. Ardından ayıklanan bu verilere yönelik olarak düzeltme işlemine gidilir. Örneğin, yanlış girilen değerler bu aşamada düzenlenir. Üçüncü adımda ise eksik verileri tamamlamak mümkündür. Dördüncü adımda ise tüm önceki işlemlerden sonra gereksiz olan veriler ayıklanır ve kaldırılır. Bu aşamada kaldırılan veriler genellikle tekrar eden kayıtlardır. Son olarak ise tüm bu işlemlerin ardından bir standardizasyon sağlanır. Tarih bilgilerinin ya da adres kayıtlarının aynı formatta girilmesi buna örnek gösterilebilir. Veri temizleme süreci bu beş adımdan meydana gelebilmektedir. Amazon Web Services (AWS) gibi yan kuruluşlar veri temizleme için sık kullanılan platformlardır.

Sözlükte Keşfet

Oyunlaştırma (Gamification)

Oyunlaştırma (Gamification), oyunlarda kullanılan ödüllendirme sistemlerini, rekabet unsurlarını iş dünyası başta olmak üzere...

Python

Python, nesne odaklı yüksek seviye programla dili olarak piyasaya sürülmüştür. Web uygulamaları, yazılım...

Yeniliklerden Haberdar Olun!

Dijital pazarlama dünyasını takip etmek için hemen haber bültenimize abone olun!

Arama Sonuçları