Home > Articoli > Data Warehouse con SQL Server: Architetture Fast Track

Data Warehouse con SQL Server: Architetture Fast Track

Una degli ambiti principali delle consulenze che svolgo è quello di creare soluzioni per Data Warehouse e Business Intelligence ad alte performance. Ed una della cose che ancora, all’alba del 2016, mi trovo a dover affrontare e con la quale devo  combattere tutti i giorni è un hardware…inadeguato.

Inadeguato per un Data Warehouse, chiaramente, dove macchine anche molto costose (leggi SAN) hanno delle performance assolutamente basse rispetto al costo che hanno (essendo il più delle volte ottimizzate per altri casi d’uso), e che quindi rendono l’utente finale solitamente molto poco contento.

Il punto è che un Data Warehouse ha bisogno principalmente di una cosa: un sistema di I/O che sia in grado di avere uno scan rate molto alto (diciamo come minimo oltre 1 Gb/sec, tanto per dare un riferimento spannometrico)

Creare una macchina del genere non è per niente complesso, ma bisogna seguire alcune regole di base, altrimenti si rischia di spendere una montagna di soldi laddove non servono a nulla, rendendo ancora più economicamente inefficiente l’intera soluzione.

Tanto per dare un’idea, un Data Warehouse con 16 core non serve a nulla se non è sostenuto da un sistema di I/O sufficiente a dare in pasto dati alle CPU abbastanza velocemente. Ed oggi che il costo di SQL Server è proporzionale al numero di core, avere 16 core usati al 15% è un cosa che NON volete che succeda.

Per capire un po’ le basi della logica che sta dietro alla creazione di un server specializzato in carichi di lavoro tipici di un Data Warehouse, potete dare un’occhiata a queste slide che ho fatto tempo fa ma che sono ancora abbastanza attuali:


 

Detto ciò, sottolineo quanto sia importante, in questi casi, affidarsi ad architetture di riferimento che permettono di avere i compiti a casa già fatti, usando l’esperienza fatta da Microsoft e dai vendor Hardware in questo campo per evitare di spendere soldi inutilmente. L’architettura Fast Track è stata definita proprio con questo scopo.

Data Warehouse Fast Track

Il documento completo che ne spiega in dettaglio l’architettura è questo:

Fast Track Data Warehouse Reference Guide for SQL Server 2012 (version 4.0)

L’ultimo aggiornamento per SQL Server 2014 lo potete trovare qui:

What’s new for Data Warehouse Fast Track for SQL Server 2014 White Paper

e qui invece potete vedere una sessione dedicata al Fast Track ed alle sue evoluzioni:

SQL Server Warehousing (Fast Track 4.0 & PDW)

Tenete quindi ben a mente questa architettura ogni qualvolta dovete spendere dei soldi per un server dedicato al Data Warehouse…altrimenti potreste aver un server costato diverse centinaia di migliaia di euro che va più piano del mio portatile, che con un SSD SATA6 arriva tranquillamente a fare circa 500Mb/sec di transfer rate…nel qual caso sarò molto felice di affittarvelo per metà del prezzo della vostra SAN. 🙂

Chi è Davide Mauri

Microsoft Data Platform MVP dal 2007, Davide Mauri si occupa di Data Architecture e Big Data nel mondo dell'IoT. Attualmente ricopre il ruolo di "Director Software Development & Cloud Infrastructure" in Sensoria, societa specializzata nella creazione di Wearables e sensori per l'IoT applicati a tessuti ed oggetti sportivi.

Leggi Anche

Unit testing: Come scrivere la tua prima unit test!

Nell’articolo precedente, il secondo di questa serie, abbiamo descritto come installare il framework tSQLt, il …