Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) veri tabanındaki yanlış – alakasız, tutarsız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Bununla amaç bir veri standardizasyonu sağlamaktır.

Veri Temizleme (Data Cleansing)

Veri temizleme (Data Cleansing) denilen işlem, ilgili veri tabanındaki yanlış – alakasız verileri tespit etmek, düzenlemek ya da listeden kaldırmaktır. Burada yinelenen bilgiler, alakasız veriler vs. tespit edilerek çıkarılır, biçimlendirilir, gerekirse veri tabanından silinir. Hatalı ve tutarsız verileri şekle sokmak, mümkünse kaldırmaktan meydana geldiği için veri temizlemenin en büyük amacı veri kalitesini artırmak ve veri güvenilirliğini, doğruluğunu sağlamaktır. Veri temizleme (Data Cleansing) işlemi içerisinde veri tabanından kaldırılan / silinenlere ise genellikle “kirli veri” adı verilir. Özellikle devasa veri kümelerine & veri tabanına sahip şirketler, işletmeler, markalar bu işlemden sıklıkla yararlanır. Bunun içinse bu tür kayıtları tespit edebilen ve yaygın hataları, tutarsızlıkları düzeltebilen otomatik araçlar ve algoritmalar kullanılabilmektedir. Özellikle büyük işletmeler otomatik işlem sağlayan bu tür araçlardan yararlanarak zamandan da ciddi ölçüde kazanabilmektedir. Buna bir örnek vermek gerekirse yanlış girilen veriler (müşteri bilgileri gibi), boş kalmış alanlar, geçersiz değerler ya da aynı verinin tekrar etmesi gibi durumlar veri tabanının doğruluğunu ve güvenilirliğini olumsuz anlamda etkiler. Böyle şartlarda firmalar, veri temizliğine girişerek veri tabanı güvenilirliğini artırabilir.

Veri temizleme işlemi 5 farklı adımdan meydana gelebilir. İlk adımda veri tabanındaki veriler analiz edilir ve buradaki olası hatalar, tutarsızlıklar, eksikler ya da tekrara düşenler belirlenir. Ardından ayıklanan bu verilere yönelik olarak düzeltme işlemine gidilir. Örneğin, yanlış girilen değerler bu aşamada düzenlenir. Üçüncü adımda ise eksik verileri tamamlamak mümkündür. Dördüncü adımda ise tüm önceki işlemlerden sonra gereksiz olan veriler ayıklanır ve kaldırılır. Bu aşamada kaldırılan veriler genellikle tekrar eden kayıtlardır. Son olarak ise tüm bu işlemlerin ardından bir standardizasyon sağlanır. Tarih bilgilerinin ya da adres kayıtlarının aynı formatta girilmesi buna örnek gösterilebilir. Veri temizleme süreci bu beş adımdan meydana gelebilmektedir. Amazon Web Services (AWS) gibi yan kuruluşlar veri temizleme için sık kullanılan platformlardır.

Sözlükte Keşfet

Finans Analitiği

Finans analitiği bir işletmenin ekonomik performansını değerlendirme ve gelecek stratejileri şekillendirme amacıyla gerçekleştirilen...

A/B Testi

A/B Testi web sitesi / sayfası, mobil uygulama, reklam, varış sayfası (landing page)...

MLOps

Makine öğrenimi işlemleri anlamına gelen MLOps, makine öğrenimi modellerinin güvenilir ve verimli bir...

Veri Bilimi (Data Science)

Veri bilimi (data science), devasa miktarlara ulaşan verilerin toplanıp işlenebilmesini sağlayan bir çalışma...

Sayfa Gösterimi (Page View)

Sayfa gösterimi (Page View), internet kullanıcılarının web sitenizdeki sayfaları gezmesi ve gün içerisinde...

Yeniliklerden Haberdar Olun!

Dijital pazarlama dünyasını takip etmek için hemen haber bültenimize abone olun!

Arama Sonuçları