Formato documentale
In informatica, un formato documentale è un formato di file utilizzato per rappresentare un documento digitale (sia file di testo sia file binari). Esistono numerosi formati documentali, la maggior parte dei quali sono incompatibili fra loro.
I componenti di un formato documentale[modifica | modifica wikitesto]
Secondo la scienza dell'informazione, la parola documento si riferisce alla combinazione di un supporto fisico e informazioni (che sono rilevanti per l'utente). Se si esamina un generico documento digitale possiamo trovare quattro tipi di informazioni o componenti: il contenuto, la struttura, lo stile di presentazione e i metadati. In genere queste informazioni vengono confuse in unico file: si provi ad aprire ad esempio un file .doc con un editor di testo. Il linguaggio XML rappresenta una soluzione a questo problema: esso infatti consente di tenere separate queste componenti. Anche il file XSV rappresenta un'altra ottima soluzione in quanto perfettamente leggibile.
Contenuto[modifica | modifica wikitesto]
Il contenuto è generalmente costituito dalle parole che compongono il documento; un documento elettronico può contenere dati di diversa natura: testo, immagine, audio e video.
Struttura[modifica | modifica wikitesto]
La struttura di un documento è la sua componente logica: è l'informazione che indica come suddividere il contenuto in elementi, eventualmente suddivisi in sottoelementi e così via in una sorta di gerarchia ad albero. Ad esempio, questo documento ha un titolo e una successione di sezioni aperte a loro volta da un titolo. Inoltre possiamo avere che il contenuto delle sezioni è suddiviso in paragrafi, sottoparagrafi, liste, ecc.
Stile[modifica | modifica wikitesto]
Lo stile è l'informazione legata a come rendere il documento su un particolare dispositivo. In genere i documenti sono stati pensati principalmente per essere "resi" su carta, ovvero "stampati" o su monitor. In questo caso si dice che sono visualizzati. Ma possiamo anche pensare ad altri modi di rappresentare un documento: ad esempio su un dispositivo per ipovedenti. In questo caso il documento viene "letto". Avremo quindi bisogno di altre informazioni di stile per istruire un sintetizzatore vocale affinché possa convertire contenuto e struttura in segnale audio.
Metadati[modifica | modifica wikitesto]
Se andiamo a esaminare da vicino le informazioni contenute in un file elettronico, troviamo essenzialmente i tre tipi di informazioni succitati. In realtà esiste anche un quarto tipo di informazione di cui molte volte ignoriamo l'esistenza. Si tratta di informazioni "bibliografiche" (come il nome di chi ha composto il documento ovvero dell'autore, le date di creazione e di ultima modifica, il nome del programma usato per comporre il documento), oppure informazioni per descrivere e rendere più facile la ricerca del documento stesso. Questo tipo di informazioni vengono genericamente detta "metainformazioni" ovvero informazioni sulle informazioni. Per evitare fraintendimenti, si precisa che la suddivisione tra informazione (contenuto, struttura e stile) e metainformazione non è affatto netta e precisa: quello che per alcuni è informazione, per altri viene visto come metainformazione. Ad esempio, il titolo di un libro può essere classificato in entrambe le maniere.
Formati elettronici più diffusi[modifica | modifica wikitesto]
- .doc per Microsoft Word
- .rtf
- .tex
- .Troff
- .txt (puro testo)
- WordPerfect (.doc)
- .xls Excel
- .mp3 Files musicali compressi
- .xsv File for storage data
- Formati SGML/XML
- TEI (molto usato in ambito di pubblicazioni)
- DocBook (adatto per la documentazione tecnica)
- Office Open XML (Standard ECMA per i documenti d'ufficio)
- OpenDocument (Un altro standard per documenti di ufficio)
- HTML | XHTML (Formato standard per rappresentare documenti ipermediali sul web)