Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) veri tabanındaki yanlış – alakasız, tutarsız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Bununla amaç bir veri standardizasyonu sağlamaktır.

Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) denilen işlem, ilgili veri tabanındaki yanlış – alakasız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Burada yinelenen bilgiler, alakasız veriler vs. tespit edilerek çıkarılır, biçimlendirilir, gerekirse veri tabanından silinir. Hatalı ve tutarsız verileri şekle sokmak, mümkünse kaldırmaktan meydana geldiği için veri temizlemenin en büyük amacı veri kalitesini artırmak ve veri güvenilirliğini, doğruluğunu sağlamaktır. Veri temizleme (Data Cleansing) işlemi içerisinde veri tabanından kaldırılan / silinenlere ise genellikle “kirli veri” adı verilir. Özellikle devasa veri kümelerine & veri tabanına sahip şirketler, işletmeler, markalar bu işlemden sıklıkla yararlanır. Bunun içinse bu tür kayıtları tespit edebilen ve yaygın hataları, tutarsızlıkları düzeltebilen otomatik araçlar ve algoritmalar kullanılabilmektedir. Özellikle büyük işletmeler otomatik işlem sağlayan bu tür araçlardan yararlanarak zamandan da ciddi ölçüde kazanabilmektedir. Buna bir örnek vermek gerekirse yanlış girilen veriler (müşteri bilgileri gibi), boş kalmış alanlar, geçersiz değerler ya da aynı verinin tekrar etmesi gibi durumlar veri tabanının doğruluğunu ve güvenilirliğini olumsuz anlamda etkiler. Böyle şartlarda firmalar, veri temizliğine girişerek veri tabanı güvenilirliğini artırabilir.

Veri temizleme işlemi 5 farklı adımdan meydana gelebilir. İlk adımda veri tabanındaki veriler analiz edilir ve buradaki olası hatalar, tutarsızlıklar, eksikler ya da tekrara düşenler belirlenir. Ardından ayıklanan bu verilere yönelik olarak düzeltme işlemine gidilir. Örneğin, yanlış girilen değerler bu aşamada düzenlenir. Üçüncü adımda ise eksik verileri tamamlamak mümkündür. Dördüncü adımda ise tüm önceki işlemlerden sonra gereksiz olan veriler ayıklanır ve kaldırılır. Bu aşamada kaldırılan veriler genellikle tekrar eden kayıtlardır. Son olarak ise tüm bu işlemlerin ardından bir standardizasyon sağlanır. Tarih bilgilerinin ya da adres kayıtlarının aynı formatta girilmesi buna örnek gösterilebilir. Veri temizleme süreci bu beş adımdan meydana gelebilmektedir. Amazon Web Services (AWS) gibi yan kuruluşlar veri temizleme için sık kullanılan platformlardır.

Sözlükte Keşfet

Hedef Kitle

Hedef kitle, gerçekleştirilen faaliyetlerin muhatabı olarak kabul edilen belirli demografik gruplardır.

ELT

ELT, büyük veri kümelerini verimli bir şekilde değerlendirmek için kullanılan bir yöntemdir.

R Programlama Dili

R, istatistik ve veri analizi alanlarında kullanın bir programlama dilidir. Açık kaynaklı bir yazılım...

Alan Adı (Domain)

Alan adı (Domain), kullanıcıların web sitelerine girmek için Google Chrome gibi tarayıcıların adres...

Yeniliklerden Haberdar Olun!

Dijital pazarlama dünyasını takip etmek için hemen haber bültenimize abone olun!

Arama Sonuçları