Toplanan verilerin türlerini, bunların ilgili kuruluşta nasıl kullanılıp depolandığının yönetilmesine veri mimarisi (data architecture) denmekte. Bir diğer ifade ile veri mimarisi; firmanın veri tabanı sistemleri içerisinde bu verilerin nasıl kullanıldığını, saklandığını, yönetildiğini ve entegre edildiğini gösteren kural, politika veya standartlar bütünüdür. Dijitalleşmenin yol açtığı büyük verilerin bu şekilde bir düzen içerisine alınması gerektiği bir gerçek. Bu karmaşık veri tabanlarından doğru verileri seçebilmek de bu nedenle değer kazanıyor. Bazı durumlarda bu miktar, yüzlerce gigabayt veri anlamına gelirken, bazı veriler için yüzlerce terabaytı ifade etmek mümkün. Bu büyük veri kümelerini bir standart üzerine oturttukça, büyük verilerin anlamına yönelik de daha çok çıkarım elde edilebilir. Büyük veri mimarisinin bileşenlerine bakıldığında ise; veri kaynakları, veri depolama, toplu işleme, gerçek zamanlı ileti alımı, akış işleme, makine öğrenmesi ve analiz – raporlama gibi pek çok bileşen var. Veri mimarisi oluşturulurken her çözümde bu bileşenlerin tamamını görmek şart değildir. Ne var ki özellikle büyük veri mimarilerinin çoğunda bunlar vardır.
Örneğin, veri kaynakları; uygulama verisi depoları, statik dosyalar ya da Iot gibi cihazlardaki gerçek zamanlı veri kaynakları olabilir. Toplu işleme aşaması ise verilerin filtrelenmesi, toplanması gibi yollar ile verilerin işlenmesini ifade eder. Makine öğrenmesi de önemli bileşenlerden biridir ve sonuçları tahmin edebilen ya da verileri sınıflandırabilen modeller oluşturmak için makine öğrenmesi algoritmaları kullanılabilir. Peki veri mimarisi olmak için gerekenler neler? Genelde üniversitelerin ilgili fakültelerindeki bilgisayar mühendisliği, bilişim sistemleri mühendisliği, bilgisayar ve yazılım mühendisliği gibi bölümlerinden mezun olma şartı aranır. Server yönetimi, SQL veri tabanı uzmanlığı ya da veri tabanına uygun fiziksel depolama aygıtlarını belirlemek veri mimarlarından beklenenler arasındadır.