Come accennato nell’
articolo introduttivo, la compressione dati ha molti usi. Un esempio interessante, è la trasmissione dati tramite fax. Una pagina fisica viene convertita da uno scanner in una sequenza di bit, che rappresentano spazi bianchi e spazi neri del documento. Gli spazi neri sono in generale associati al testo. Supponendo che lo scanner non sia a colori, ripetendo il procedimento per ogni lettera della pagina e in considerazione del fatto che si usa generalmente una risoluzione alta, ad una singola lettera corrisponderà una sequenza di bit elevata.
Se lo scanner è a colori, la situazione si complica ulteriormente, in quanto ogni punto deve essere rappresentato da una tripla di numeri, che indicano l’intensità di colore RGB (Red Green Blue). Per risolvere il problema della mole eccessiva del pacchetto dati da trasferire, è possibile ricorrere ad una tecnica di compressione che sfrutti la ridondanza dei bit nel documento
scannerizzato. La seguente immagine mostra un esempio di
scannerizzazione della lettera A di un documento.
<center>[img]http://farm1.static.flickr.com/189/513914423_5cbc7c74a6.jpg?v=0[/img]</center>
Osservando meglio la figura, si nota la ripetizione di alcuni bit; consideriamo per esempio la prima riga: il primo bit è zero e si ripete 11 volte; dopo l’ultima ripetizione segue il numero 1 che si ripete 3 volte, l’ultimo 1 della serie è infine seguito da uno zero. Se rappresentassimo ogni riga specificando per ogni bit la lunghezza delle ripetizioni, anziché indicare ogni singolo bit della sequenza, otterremmo uno schema del tipo: 11(0),3(1),1(0), decisamente più compatto dello schema a bit. Ciò che si è fatto, è stato comprimere i dati risultanti dalla scansione, con significativa riduzione dello spazio occupato.
In definitiva, se si considera l’intera riga del documento, usare degli interi per rappresentare la sequenza di bit ripetuti, si rivela più economico della rappresentazione di ogni singolo bit. Dal punto di vista della trasmissione dati, la compressione implica quindi la costruzione di un pacchetto da trasferire di dimensioni notevolmente ridotte rispetto al pacchetto non compresso, con conseguente riduzione della banda di trasmissione.
Sfruttare la ridondanza di caratteri, stringhe o simboli in un file, è una soluzione efficace per ridurne la dimensione preservando il "significato" dell’informazione che essi racchiudono. La logica alla base del processo di compressione, offre infatti l’opportunità di ricostruire l’informazione partendo dalla forma compressa, tramite un processo di decompressione. La ridondanza è alla base delle tecniche di compressione, come sarà chiarito nella seconda parte dell'articolo.