Formato documentale
Un formato documentale è un formato testo o binario per salvare documenti elettronici su un supporto di memorizzazione. Con documento si intende qualsiasi oggetto portatore di significato sia esso un testo, un'immagine, un video, un audio o una qualsiasi combinazione dei precedenti. Nel senso comune quando si parla di formati file si distingue tra formati per documenti, audio, video, immagini, cartografie, ... in cui il documento elettronico viene associato al software che l'ha prodotto. In questa accezione per documento si intende del testo corredato eventualmente da immagini, tabelle, grafici (più raramente da audio e video) prodotti con strumenti che vanno dai software di produttività personale stile Office, a prodotti di desktop publishing o semplici editor di testo. Attualmente esistono una moltitudine di formati documentali incompatibili fra loro. Il più diffuso probabilmente è il formato (.doc) utilizzato di default con il programma Microsoft Word che costituisce quindi uno standard de facto.
Le componenti di un formato documentale [modifica]
Se si esamina il contenuto di un generico file documentale possiamo trovare quattro tipi di informazioni o componenti che sono: il contenuto, la struttura, lo stile di presentazione e i metadati. In genere queste informazioni vengono confuse in unico file si provi ad aprire ad esempio un file .doc con un editor di testo. Con XML si è cercato invece di separare queste componenti.
Contenuto Il contenuto è generalmente costituito dalle parole che compongono un documento più precisamente il contenuto è l'insieme dei dati multimediali (testo, audio, video, immagine e quant'altro) contenuti nel documento.
Struttura La struttura di un documento è quell'informazione che indica come suddividere il contenuto in elementi eventualmente suddivisi in sottoelementi e così via in una sorta di gerarchia ad albero. Ad esempio questo documento ha un titolo e una successione di sezioni aperte a loro volta da un titolo. Inoltre possiamo avere che il contenuto delle sezioni è suddiviso in paragrafi, sottoparagrafi, liste etc.
Stile Lo stile è l'informazione legata a come rendere il documento su un particolare dispositivo. In genere i documenti sono stati pensati principalmente per essere "resi" su carta ovvero "stampati" o su monitor in questo caso si dice che sono visualizzati. Ma se ci sforziamo un attimo possiamo pensare ad altri modi di rappresentare un documento ad esempio su di un dispositivo per ipovedenti. In questo caso il documento viene "letto". Avremo quindi bisogno di altre informazioni di stile per istruire un syntetizer a convertire contenuto e struttura in audio.
Metadati Se andiamo a esaminare da vicino le informazioni contenute in un file elettronico troviamo essenzialmente questi tre tipi di informazioni. In realtà troviamo anche un quarto tipo di informazione di cui molte volte ignoriamo l'esistenza. Possono essere informazioni di contorno come il nome di chi ha composto il documento ovvero dell'autore, le date di creazione e di ultima modifica, il nome del "tool" usato per editare il documento, oppure informazioni per descrivere e rendere più facile la ricerca del documento stesso. Questo tipo di informazione viene genericamente detta "metainformazione" ovvero informazione su informazione. Si precisa subito per evitare fraintendimenti, che la suddivisione tra informazione (contenuto, struttura e stile) e metainformazione non è affatto netta e precisa, e quello che per alcuni è informazione per altri viene visto come metainformazione. Ad esempio il titolo di un libro può essere classificato in entrambi le maniere.
I più comuni formati documentali [modifica]
- .doc per Microsoft Word
- RTF
- TeX
- Troff
- TXT (puro testo)
- WordPerfect (.doc)
- Formati SGML/XML
- TEI (usato molto in ambito di pubblicazioni)
- DocBook (usato per la documentazione tecnica)
- Office Open XML (Uno standard ECMA pei i documenti di ufficio)
- OpenDocument (Un altro standard per documenti di ufficio)
- HTML | XHTML (Formato standard per rappresentare documenti ipermediali su web)
Voci correlate [modifica]
|
|