Veri entegrasyonu (data integration) bir firmanın, şirketin farklı kaynaklardan gelen verilerinin birleştirildiği, ayıklandığı ve geliştirildiği sürecin adıdır. Bir firma / şirketin tüm departmanlarında kendine has veriler yer alır. Bu farklı verileri birleştiren karmaşık bir süreç olan veri entegrasyonu sayesinde çeşitli öngörüler elde etmek mümkündür. Söz konusu entegrasyon çalışmaları sonucunda şirketinize, firmanıza ait tüm verileri net bir şekilde görebilir, analiz edebilirsiniz. Bir örnek üzerinden açıklamak gerekirse; reklamcılık stratejilerini geliştirmek isteyen bir firma için pazarlama ve finans verileri birbirinden ayrı iki devasa veridir. Bu nedenle her iki veri de ayıklanıp birleştirilerek yeniden biçimlendirilebilir. Bu sayede ilgili reklam şirketi, reklamcılık faaliyetleri ve stratejileri ile alakalı yeni bir plan – program ortaya koyabilir. BT mimarisi bu entegrasyona engel teşkil eden firmalar ise bizzat veri entegrasyonu hizmeti veren şirketlerden destek alabilmekte. Peki veri entegrasyonu neden bu kadar önemli? Özellikle büyük firma ve şirketler, mevcut büyük verilerinin zorluklarını – avantajlarını tespit edebilmek için buna ihtiyaç duyar. Böylece veri analistleri ve yöneticiler, hedeflerden (KPI) finansal risklere, üretimdeki güçlüklerden lojistiğe kadar kendi şirketlerine ait tüm süreçleri daha net bir şekilde görebilir.
Veri entegrasyonu uygulamalarında genel olarak 4 farklı yaklaşım vardır. Bunlardan ilki veri birleştirmedir. Bu uygulamada veriler ayıklanır, temizlenir ve depolanır. Veri birleştirme modelinde “ayıkla – dönüştür – yükle” ve “ayıkla – yüklü – dönüştür” seçenekleri vardır. Bir diğer yaklaşık ise veri çoğaltmadır. Bu yaklaşımda verilerin mükerrer kopyaları oluşturulur. Bu yaklaşım daha çok nispeten az veri kaynağı olan küçük ve orta işletmeler için idealdir. Üçüncü yaklaşım ise veri sanallaştırmadır ve tüm veri kaynaklarını entegre eden bir sanal birleşik görünüm oluşturur. Son olarak veri federasyonu ise birden çok veri kaynağının üzerinde bir sanal veritabanı oluşturmaktır. Veri sanallaştırmaya benzer şekilde ilerler fakat ondan farklı olarak veri kaynaklarını entegre etmez.