Linguaggio formale (matematica)
In matematica, logica, informatica e linguistica, per linguaggio formale si intende un insieme di stringhe di lunghezza finita costruite sopra un alfabeto finito, cioè sopra un insieme finito di oggetti tendenzialmente semplici che vengono chiamati caratteri, simboli o lettere.
In maniera formale, un linguaggio L è definito come
. Un linguaggio può essere di cardinalità finita, infinita o nulla. È importante notare che il linguaggio vuoto (denotato da
) differisce dal linguaggio composto esclusivamente dalla stringa muta (o parola vuota), denotata con e,
o λ.
Ad esempio, dato l'alfabeto
alcuni possibili linguaggi su tale alfabeto sono:
- il linguaggio vuoto
(linguaggio costituito solamente dalla stringa vuota)
(linguaggio finito)
(linguaggio infinito definito da un'espressione regolare)
In generale diremo che un modello formale che può riconoscere e generare tutte e sole le stringhe di un linguaggio formale agisce come una definizione di tale linguaggio. Secondo i due principali approcci alla definizione dei linguaggi formali, un modello si può concretizzare in una grammatica formale (approccio generativo) o in un automa (approccio riconoscitivo).
Indice |
[modifica] Definizione di un linguaggio formale
Un linguaggio formale può essere definito in una grande varietà di modi:
- l'insieme delle stringhe derivate da una grammatica generativa
- l'insieme delle stringhe fornite da un'espressione regolare
- l'insieme delle stringhe accettata da un automa
- le domande a risposta affermativa, nell'ambito di un problema di decisione, la cui risposta è di tipo binario (sì/no o vero/falso)
[modifica] Esempi di linguaggi formali
Sebbene siano stati definiti sopra alcuni esempi di linguaggi formali, è possibile esprimere alcuni linguaggi formali su Σ nel seguente modo:
- il linguaggio di tutte le stringhe che contengono lo stesso numero di a e di b;
- l'insieme di tutte le parole su Σ o l'insieme vuoto;
- l'insieme delle stringhe della forma an con n numero primo;
- l'insieme dei programmi in un dato linguaggio di programmazione che si dimostrano sintatticamente corretti;
- l'insieme degli input che causano l'arresto di una determinata macchina di Turing
[modifica] Operazioni sui linguaggi formali
È possibile definire alcune operazioni unarie o binarie per generare un nuovo linguaggio a partire da lunguaggi dati. Siano L1 ed L2 due linguaggi su un dato alfabeto.
è la concatenazione o giustapposizione dei due linguaggi. Consiste nell'insieme di tutte le stringhe vw tali che
e
.
è l'intersezione di L1 ed L2. Consiste nell'insieme di tutte le stringhe
, ovvero tutte le stringhe contenute sia in L1 che in L2.
è l'unione di L1 ed L2. Consiste nell'insieme di tutte le stringhe
, ovvero tutte le stringhe che appartengono ad almeno uno dei due linguaggi.
è il complemento del linguaggio L1. Consiste in tutte le stringhe
, ovvero tutte stringhe sull'alfabeto Σ che non sono contenute in L1.
è il quoziente destro di L1 da L2. Consiste in tutte le stringhe v per le quali esiste una stringa w in L2 tale che
.
è la star di Kleene. Consiste nel linguaggio
, ovvero tutte le stringhe della forma
tali che
. Poiché
si ha che la stringa muta
.
è il riflesso. Se
e
, il linguaggio L contiene tutte le stringhe
, ovvero tutte le stringhe riflesse di L1.- Il mescolamento o shuffle di L1 ed L2 consiste di tutte le stringhe che si possono scrivere nella forma
tali che
.
Uno dei problemi più comuni legati ai linguaggi formali riguarda il membership problem. Data un stringa w ed un linguaggio L, verificare se
è un problema che coinvolge sia la teoria della calcolabilità che la teoria della complessità.
[modifica] Voci correlate
[modifica] Bibliografia
- Formal languages in Encyclopedia of Computer Science (in inglese), Hoboken, Wiley, 2003.
- John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman, Languages in Introduction to Automata Theory, Languages, and Computation (in inglese), Addison Wesley, 15 luglio 2006. 978-0321462251
|
|
| Teoria degli automi: linguaggi formali e grammatiche formali | |||
|---|---|---|---|
| Gerarchia di Chomsky | Grammatica | Linguaggio | Automa minimo |
| Tipo-0 | (illimitato) | Ricorsivamente enumerabile | Macchina di Turing |
| (illimitato) | Ricorsivo | Decider | |
| Tipo-1 | Dipendente dal contesto | Dipendente dal contesto | Automa lineare |
| Tipo-2 | Libera dal contesto | Libero dal contesto | Automa a pila ND |
| Tipo-3 | Regolare | Regolare | A stati finiti |
| Ciascuna categoria di linguaggio o grammatica è un sottoinsieme del proprio sovrainsieme di categoria direttamente sottostante. | |||
(linguaggio costituito solamente dalla stringa vuota)
(linguaggio finito)
(linguaggio infinito definito da un'
è la concatenazione o giustapposizione dei due linguaggi. Consiste nell'insieme di tutte le
e
.
è l'intersezione di
, ovvero tutte le stringhe contenute sia in
è l'unione di
, ovvero tutte le stringhe che appartengono ad almeno uno dei due linguaggi.
è il complemento del linguaggio
, ovvero tutte stringhe sull'alfabeto
è il quoziente destro di
.
è la
, ovvero tutte le stringhe della forma
tali che
. Poiché
si ha che la stringa muta
.
è il riflesso. Se
e
, il linguaggio L contiene tutte le stringhe
, ovvero tutte le stringhe riflesse di
tali che
.