Che cos'è un database verticale?

Un database verticale è quello in cui il layout fisico dei dati è colonna per colonna anziché riga per riga. Anziché essere disposti in strutture di record orizzontali ed elaborati verticalmente, i dati in un database verticale vengono organizzati in strutture verticali, note come alberi dei predicati o P-tree, ed elaborati orizzontalmente.

Estrazione dei dati

I database orizzontali sono adatti per applicazioni in cui il risultato richiesto è un insieme di record orizzontali, ma meno per applicazioni come il data mining, in cui i ricercatori sono generalmente interessati a risultati che possono essere espressi in modo succinto. I P-tree, d'altra parte, sono adatti al data mining. I P-tree vengono generalmente creati scomponendo ciascun attributo, o colonna, di una tabella di record orizzontali in vettori di bit separati o strutture di dati di array. I P-tree possono essere unidimensionali, bidimensionali o multidimensionali; se i dati da memorizzare nel database hanno dimensioni naturali, ad esempio dati geospaziali o informazioni geografiche, le dimensioni del P-tree sono abbinate a quelle dei dati.

Prestazione

I dati in un database verticale vengono elaborati tramite operatori logici veloci, quali AND, OR, OR esclusivo e complemento. Inoltre, disponendo i dati per colonna anziché per riga, è possibile eseguire query, o ricerche, sui dati senza accedere a pagine su un disco rigido che non sono interessate dalla query e quindi aumentare la velocità di recupero dei dati . Questa è una considerazione importante durante il data mining in repository di dati molto grandi.

Dimensioni della pagina

Un altro vantaggio dei database verticali è che consentono di archiviare i dati in pagine di grandi dimensioni. Una dimensione della pagina grande significa che è possibile recuperare un numero elevato di elementi di dati rilevanti in una singola operazione di lettura. Al contrario, una singola operazione di lettura su un database orizzontale recupera non solo elementi di dati rilevanti, ma anche attributi, o colonne, che non sono rilevanti per la query in questione e favorisce le dimensioni di pagina ridotte.

Applicazioni scientifiche

I database verticali hanno ricevuto un rinnovato interesse da parte della comunità scientifica negli ultimi anni. Il numero di utenti simultanei nelle applicazioni di database scientifici è generalmente molto inferiore rispetto alle applicazioni commerciali, ma gli utenti tendono a inviare query più complesse e impreviste. Inoltre, le applicazioni di database scientifiche devono fornire in genere una risposta più automatizzata a query complesse a causa dell'assenza di database e personale di supporto dei sistemi. Gli utenti scientifici in genere preferiscono lavorare con sistemi informatici interni dedicati, quindi le applicazioni di database scientifiche devono essere portatili tra vari modelli di computer. I database verticali sono migliori, sotto tutti questi aspetti, delle loro controparti orizzontali.