Array

Da Wikipedia, l'enciclopedia libera.

In informatica un array[1] o vettore è una struttura dati complessa, statica e omogenea, usata in molti linguaggi di programmazione e chiaramente ispirata alla nozione matematica di vettore, (o di matrice, nel caso di array bidimensionali). Più precisamente, l'array è in genere classificato come un costruttore di tipo: in altre parole, esso consente di definire nuovi tipi di dati a partire da (come aggregati di valori di) tipi preesistenti.

Caratteristiche[modifica | modifica wikitesto]

Array di numeri interi con numerazione degli indici che parte da 0

Si può immaginare un array come una sorta di contenitore o casellario, le cui caselle sono dette celle dell'array stesso. Ciascuna delle celle si comporta come una variabile tradizionale che rappresenta un elemento dell'array; tutte le celle sono variabili di uno stesso tipo preesistente, detto tipo base dell'array. Si parlerà perciò di tipi come "array di interi", "array di stringhe", "array di caratteri" e così via. Quello che si ottiene dichiarandolo è dunque un contenitore statico ed omogeneo di valori, variabili o oggetti. In alcuni linguaggi, la dimensione dell'array (ovvero il numero celle di cui esso è composto) viene considerato parte della definizione del tipo array; in tal caso, si parlerà più precisamente di tipi come "array di 100 caratteri" o "array di 10 interi".

Ciascuna delle celle dell'array è identificata da un valore di indice. L'indice è generalmente numerico e i valori che gli indici possono assumere sono numeri interi contigui che partono da 0[2] o da 1.[3] Si potrà quindi parlare della cella di indice 0, di indice 1, e, in generale, di indice N, dove N è un intero compreso fra 0 (o 1) e il valore massimo per gli indici dell'array. La sua principale caratteristica è che può essere indicizzato tramite un indice intero e scorso sequenzialmente in entrambe le direzioni tramite un ciclo iterativo in tutti i suoi elementi o a partire da alcuni di essi oltre a poter accedere singolarmente ad una sua generica posizione.

Ecco un esempio, che si serve della sintassi C (simile, comunque, a quella di molti altri linguaggi) per definire e valorizzare un array:

 int vettore[10]; // definisce "vettore" come array di 10 elementi interi
 vettore[0] = 0;  // assegna il valore "0" alla cella di indice 0
 vettore[1] = 1;
 vettore[2] = 1;
 vettore[3] = 2;
 vettore[4] = 3;

(Il vettore sopra indicato contiene i primi cinque numeri di Fibonacci).

Alcuni linguaggi ammettono indici di tipo non numerico, per esempio stringhe. Si parla in questo caso di hash table, o di array associativo, perché ogni valore stringa utilizzato come indice viene associato a un valore dell'array. Vediamo un esempio in linguaggio PHP:

$persona["nome"] = "Mario";
$persona["cognome"] = "Rossi";
$persona["eta"] = 32;

Come si vede, l'esempio è molto simile al precedente; l'unica differenza rilevante (se si esclude una piccola differenza puramente sintattica tra i linguaggi) è che l'indice dell'array è di tipo stringa. Inoltre, il lettore esperto potrà osservare che in PHP non esiste il vincolo di un "tipo base" fissato per tutte le celle dell'array: alle prima due è stata assegnata una stringa, alla terza un numero intero.

Array multidimensionali[modifica | modifica wikitesto]

È infine da segnalare che un array (sia esso associativo o meno) può avere più di una dimensione. Nel caso un array abbia più dimensioni (specialmente nel caso bidimensionale), esso viene spesso definito "matrice", in riferimento alla nozione matematica di matrice da cui prende ispirazione. La differenza è che una matrice ha due (o più) indici (ogni indice è una dimensione) e ogni elemento è identificato dalla combinazione di valori di tutti gli indici del vettore. Ecco un esempio:

$persona[0]["nome"] = "Mario";
$persona[0]["cognome"] = "Rossi";
$persona[1]["nome"] = "Giorgio";
$persona[1]["cognome"] = "Bianchi";

In questo caso ogni valore corrisponde a una caratteristica di una certa persona. Il primo indice, in questo caso numerico, identifica una persona. Il secondo indice, in questo caso una stringa, indica la caratteristica in questione. Di conseguenza per accedere a un elemento non è sufficiente il primo indice, perché non indica quale caratteristica ci serve; ma nemmeno il secondo, perché non indica a quale persona ci stiamo riferendo. È dunque la combinazione di entrambi gli indici a identificare un valore.

Un array a due dimensioni è visualizzabile come una tabella, in cui la prima colonna contiene i valori di un indice, la prima riga i valori di un altro indice e le singole celle i vari elementi. Per gli stessi principi, se ha tre dimensioni è visualizzabile come un cubo. Una matrice potrebbe contenere anche più di tre indici, ma ciò avviene solo in casi molto particolari, per esempio in applicazioni scientifiche o di datawarehousing.

Array e strutture di controllo[modifica | modifica wikitesto]

La maggior parte dei programmi che utilizzano array si servono della struttura di controllo "cicli for" per attraversare gli array, ovvero per accedere sequenzialmente alle celle. Il ciclo for si presta molto naturalmente all'uso combinato dell'array proprio perché consente di specificare un tipo particolare di iterazione di un certo insieme di istruzioni, controllato da un indice che assume un insieme di valori solitamente interi e contigui. Per esempio, il codice Java per stampare i contenuti di un array di 100 interi potrebbe essere come segue:

 
for(int i=0; i<100; i++) // per i crescente con passo 1 da 0 a 99
System.out.println(vettore[i]); // stampa la i-esima cella

Aspetti implementativi[modifica | modifica wikitesto]

Gli array sono generalmente allocati in aree contigue della memoria del computer. Un array occuperà un'area di memoria le cui dimensioni complessive sono date dalla dimensione del tipo base moltiplicata per il numero totale di celle. Il reperimento di un elemento su base indice avviene sommando all'indirizzo di memoria di partenza dell'array (noto al compilatore o all'interprete informatica) il valore dell'indice moltiplicato per la dimensione del tipo base. Così, se un array di interi C viene allocato all'indirizzo 1000 della memoria, su una macchina in cui gli interi occupano 4 byte, il suo quinto elemento (che ha indice 4) sarà allocato alla posizione 1000+(4*(5-1))=1016. Questa regola permette di ottenere accessi efficienti alle celle dell'array in termini di tempo speso, attraverso meccanismi di indirizzamento indiretto che sono forniti da tutti i processori (e quindi da tutti i linguaggi macchina) oppure tramite la manipolazione numerica di puntatori all'interno del programma.

Controllo sui limiti[modifica | modifica wikitesto]

Exquisite-kfind.png Per approfondire, vedi Aliasing (programmazione)#Array.

Alcuni linguaggi, soprattutto fra quelli compilati, non impongono all'ambiente di esecuzione alcun controllo sulla correttezza degli indici utilizzati per accedere a una determinata cella di un array. Di conseguenza, in un programma scritto in C, se un array di 20 elementi di dimensione 2 byte è allocato all'indirizzo 1000, l'ultima cella valida ha indice 19 e indirizzo 1038; ma se il programmatore, per errore, tenta di accedere alla quarantesima cella (che non esiste), il linguaggio non rileverà l'errore e fornirà un accesso scorretto alla locazione di memoria 1078.

In genere, questi linguaggi di programmazione non stabiliscono il risultato esatto della lettura o della scrittura fuori dai limiti degli array, e ciò rende questo meccanismo una fonte di bug nei programmi che calcolano un valore degli indici errato. Il motivo è che la disposizione e l'allineamento dei dati memorizzati all'interno del programma (quindi, la corrispondenza tra le celle della memoria e le celle degli array e le variabili) dipendono sia dall'implementazione del compilatore adottato, sia dall'implementazione dell'architettura del sistema su cui il programma sarà eseguito.

Nel migliore dei casi, se la memoria a cui si è tentato di accedere non era stata allocata dal programma, il risultato sarà la lettura di un valore casuale o la scrittura su una locazione di memoria non utilizzata in alcuna altra parte del programma; nel caso peggiore, è possibile che quella zona di memoria fosse invece allocata per una variabile o per un altro array, e di conseguenza il programma sovrascriverebbe i propri dati, alterando la propria esecuzione in modo imprevedibile.

Questo tipo di errori nell'indicizzazione degli array sono, insieme agli errori sui puntatori, fra le più frequenti cause di malfunzionamento di programmi scritti nei linguaggi C e C++. Altri linguaggi (per esempio Java) impongono che l'ambiente di esecuzione in cui il programma viene lanciato blocchi gli accessi agli array fuori dai limiti imposti, ed eventualmente segnali questo problema con un errore all'interno del programma.

Note[modifica | modifica wikitesto]

  1. ^ Per una discussione sull'ipotetica traduzione italiana del vocabolo array, con cenni alla sua etimologia, si veda — in nota — la voce Wullenweber.
  2. ^ (EN) Array Code Examples - PHP Array Functions - PHP code, Computer Programming Web programming Tips. URL consultato l'8 aprile 2011.
    «In most computer languages array index (counting) starts from 0, not from 1. Index of the first element of the array is 0, index of the second element of the array is 1, and so on. In array of names below you can see indexes and values.».
  3. ^ (EN) Chapter 6 - Arrays, Types, and Constants in Modula-2 Tutorial. URL consultato l'8 aprile 2011.
    «The names of the twelve variables are given by Automobiles[1], Automobiles[2], ... Automobiles[12]. The variable name is "Automobiles" and the array subscripts are the numbers 1 through 12. [i.e. in Modula-2, the index starts by one!]».

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

 Collegamenti esterni[modifica | modifica wikitesto]

  • Array e Iteratori su "Imparare a Programmare", libro gratuito sulle basi della programmazione.
Informatica Portale Informatica: accedi alle voci di Wikipedia che trattano di Informatica