Lessico-grammatica

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search

Si definisce lessico-grammatica sia il metodo sia la pratica di descrizione formale delle lingue[1] sviluppati da Maurice Gross dalla fine degli anni sessanta[2]. Realizzati contemporaneamente, metodo e pratica si incrementano reciprocamente.

La base teorica su cui si fonda il lessico-grammatica è il distribuzionalismo di Zellig S. Harris[3][4], e in particolare la nozione di trasformazione. Le notazioni convenzionali per la presentazione delle informazioni grammaticali sono quanto più possibile semplici e trasparenti. La metodologia del lessico-grammatica si ispira alle scienze sperimentali[5]. Pone l'accento sulla raccolta dei fatti linguistici, quindi sul confronto con la realtà degli usi linguistici, dal punto di vista quantitativo (descrizione sistematica del lessico) e qualitativo (precauzioni metodologiche). Inoltre, esigenza primaria del lessico-grammatica è la formalizzazione. I risultati della descrizione devono essere sufficientemente formali da permettere un'applicazione nel trattamento automatico delle lingue, in particolare attraverso la realizzazione di analizzatori sintattici messi a punto da informatici[6][7].

Il modello formale è concepito in modo tale che i risultati della descrizione vengano presentati sotto forma di tabelle a doppia entrata, chiamate tavole o matrici, che incrociano entrate lessicali con proprietà sintattico-semantiche[8]. I risultati ottenuti costituiscono una base di dati sintattico-semantici. L'esperienza ha mostrato che più persone o équipe possono pervenire alla cumulatività dei risultati delle loro descrizioni.

Base teorica[modifica | modifica wikitesto]

La base teorica su cui si fonda il lessico-grammatica è il distribuzionalismo di Zellig Harris[3][4], di cui Maurice Gross fu allievo, e in particolare la nozione di trasformazione intesa appunto in senso harrisiano. Le notazioni convenzionali per la presentazione delle informazioni grammaticali sono quanto più possibile semplici e trasparenti. Tale era l'intento di Zellig Harris, la cui teoria si orienta verso la superficie direttamente osservabile; in questo, si differenzia dalla grammatica generativa, solita ricorre a strutture astratte quali le strutture profonde.

Raccolta dei fatti linguistici[modifica | modifica wikitesto]

La metodologia del lessico-grammatica si ispira alle scienze sperimentali[5]. Pone l'accento sulla raccolta dei fatti linguistici, quindi sul confronto con la realtà degli usi linguistici[9], dal punto di vista quantitativo e qualitativo. Quantitativamente, il lessico-grammatica comporta un programma di descrizione sistematica del lessico. Ciò implica un lavoro su vasta scala, realizzabile da parte di équipe e non di singoli studiosi[10]. La ricerca esclusiva di regole sintattiche generali, indipendenti dal materiale lessicale a cui si applicano, è indicata come una vera e propria impasse[11]. Altra differenza rispetto alla grammatica generativa, che avvalora la nozione di generalizzazione. Qualitativamente, per assicurare una buona riproducibilità delle osservazioni, e in particolare per contrastare i rischi legati agli esempi costruiti[12], vengono adottate delle precauzioni metodologiche. La prima consiste nel considerare la frase elementare come l'unità semantica minima[13][14]. In effetti, una parola acquisisce un determinato senso solo in un certo contesto; inserendo poi una parola in una frase, si ha il vantaggio di manipolare una sequenza che può essere giudicata accettabile o inaccettabile. È stata questa la condizione imprescindibile per stabilire che delle proprietà sintattico-semantiche fossero definite con un grado di precisione tale che avesse senso rapportarle al lessico considerato nella sua totalità.

Delle precauzioni che si sono evolute di pari passo con il progresso tecnologico: così, a partire dai primi anni novanta, l'équipe impegnata nella ricerca ha potuto far ricorso sempre più facilmente alla scelta di esempi attestati in corpora[15]. Questa nuova precauzione si è semplicemente aggiunta alle precedenti, rendendo il lessico-grammatica un metodo che riprende sia la linguistica introspettiva sia la linguistica dei corpora[16], un po' come aveva preconizzato Fillmore[17]. I progetti americani FrameNet[18] e VerbNet[19] testimoniano del resto una relativa convergenza verso obiettivi vicini a quelli del lessico-grammatica.

Formalizzazione[modifica | modifica wikitesto]

Esigenza primaria del lessico-grammatica è la formalizzazione. I risultati della descrizione devono essere sufficientemente formali da permettere: - una verifica tramite confronto con l'uso reale; - un'applicazione nel trattamento automatico delle lingue, in particolare attraverso la realizzazione di analizzatori sintattici messi a punto da informatici[6][7]. L'esigenza di formalizzazione si manifesta attraverso l'adozione di un modello discretizzato della sintassi e della semantica. In tal modo, l'accettabilità è modellizzata da una proprietà binaria: per i bisogni della descrizione, una frase è considerata o accettabile o inaccettabile, secondo le stesse modalità e per gli stessi motivi teorizzati dalla grammatica generativa. Anche l'ambiguità lessicale è rappresentata separando con cura ogni parola in un numero intero di entrate lessicali, distinte l'una dall'altra come se fossero entrate di parole morfologicamente diverse (per esempio, i differenti significati di mancare corrispondono ad entrate diverse).

Le proprietà sintattico-lessicali delle entrate (ad esempio le strutture frastiche in cui può comparire un dato verbo, o la distribuzione del soggetto) formano una lista confrontata sistematicamente con tutte le entrate. Esse sono identificate da intestazioni abbastanza informali del tipo , che rappresenta una trasformazione tra due strutture frastiche (o costruzioni sintattiche) derivanti da una stessa entrata lessicale. La nozione di entrata lessicale non è quindi confusa con quella di costruzione sintattica. Per questo, si evita il termine di “quadro di sottocategorizzazione”, spesso usato nel contesto di modelli che tendono a considerare le due nozioni in rapporto di biiezione.

Nell'ambito del lessico-grammatica, le decisioni riguardo alla classificazione (“sottocategorizzazione”) di un'entrata si fondano a priori sull'insieme delle costruzioni sintattiche che derivano dall'entrata, non su una sola costruzione (“quadro”). Infine, vengono mantenute soltanto le proprietà per le quali esiste un procedimento in grado di determinare in modo sufficientemente affidabile se una data entrata la possieda o no. Tale procedura è determinata per via sperimentale testando la riproducibilità dei giudizi di accettabilità su un vasto vocabolario.

Le proprietà, dunque, sono modellizzate come binarie e non come dei continuum. Dato questo modello formale, il carattere essenziale della descrizione di una lingua consiste nello specificare le proprietà delle entrate. I risultati della descrizione assumono così, in modo del tutto naturale, la forma di tabelle a doppia entrata, chiamate tavole o matrici, che incrociano entrate lessicali con proprietà sintattico-semantiche[8]. La descrizione della struttura delle frasi implica l'identificazione di un insieme di argomenti caratteristici di ogni entrata predicativa; in particolare, si applicano dei principi per distinguere gli argomenti (soggetti e oggetti o complementi essenziali) dai complementi avverbiali (o circostanziali).

Risultati[modifica | modifica wikitesto]

I risultati ottenuti con l'applicazione di questi principi metodologici da parte di alcune decine di linguisti per alcune decine di anni, costituiscono una banca dati sintattico-semantica per il trattamento delle lingue. La sua qualità è facilmente valutabile se si tiene conto:

  • del suo volume, quantificabile dal numero di entrate;
  • della ricchezza dei fenomeni linguistici che prende in considerazione, quantificabile dal numero di proprietà;
  • del suo grado di formalizzazione.

Per il francese sono state definite oltre 75 000 entrate[20]; seguendo lo stesso modello, sono state realizzate descrizioni più o meno considerevoli di una decina di altre lingue, tra cui spiccano l'italiano[21], il portoghese[22], il neogreco[23] e il coreano[24].

Nell'ambito del lessico-grammatica, a partire dagli anni Settanta, sono stati realizzati e pubblicati vari lavori sui sostantivi predicativi[25], e dagli anni Ottanta, anche sulle espressioni fisse (o polirematiche)[26].

La nozione di sostantivo predicativo, mutuata da Zellig Harris[27], parte dall'idea che se, per esempio, il verbo studiare è analizzato come predicato nella frase Max studia le eclissi, è naturale analizzare il sostantivo studio (o la sequenza fare uno studio) come predicato nella frase Max fa uno studio sulle eclissi. In tal caso, il sostantivo in questione è detto predicativo; il verbo che l'accompagna, fare, è definito verbo supporto. Questa idea è stata applicata sistematicamente nell'ambito del lessico-grammatica a partire dagli anni settanta[25][28][29][30][31][32]. Gli addetti ai lavori sul lessico-grammatica parlano di frasi fisse quando un'espressione (ad esempio parola d'ordine) possiede proprietà specifiche (in questo caso il senso) che le permettono di costituire un'entrata lessicale, nonostante sia costituita da più elementi (parola, di e ordine) che, in un modo o nell'altro, possono essere considerate come parole[26]. A partire dagli anni Ottanta è stato intrapreso un programma sistematico di descrizione di queste espressioni nell'ambito del lessico-grammatica[33][34][35][36][37][38][39][40].

Cumulatività[modifica | modifica wikitesto]

Queste esperienze hanno mostrato che più studiosi o più équipe possono pervenire a risultati identici. La riproducibilità assicura la cumulatività delle descrizioni e si tratta di un risultato cruciale per il futuro del trattamento delle lingue: la qualità dei dati che deve essere accumulata e rappresentata in un modello coerente è tale da richiedere la cooperazione di numerose e équipe di ricerca e sviluppo, e i loro risultati devono poter essere riuniti senza che sia necessario riscrivere parti sostanziali della grammatica e del lessico di ogni lingua. Un'esigenza difficile da soddisfare, in quanto si conoscono pochi esempi di grammatiche di dimensioni significative che non siano opera di un solo specialista.

Note[modifica | modifica wikitesto]

  1. ^ (FR) Ibrahim, Amr Helmy. 2003. Le cadre du lexique-grammaire. Linx 48:101-122.
  2. ^ (FR) Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe. Paris : Larousse (ripubblicato sotto lo stesso titolo, Paris: Cantilène, 1986).
  3. ^ a b (EN) Harris, Zellig. 1964. "Transformations in Linguistic Structure", Proceedings of the American Philosophical Society 108:5, pp. 418-122.
  4. ^ a b (FR) Harris, Zellig, Notes du cours de syntaxe, Paris, Seuil, 1976.
  5. ^ a b (FR) Lamiroy, Béatrice. 2003. "In memoriam Maurice Gross", Travaux de linguistique 46:1, pp. 145-158.
  6. ^ a b (FR) Michel Delamar, Maurice Gross, Copia archiviata, su univ-paris-diderot.fr. URL consultato il 10 ottobre 2013 (archiviato dall'url originale il 6 dicembre 2006).
  7. ^ a b (EN) Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, Cambridge, Mass./ London, MIT Press.
  8. ^ a b (FR) Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives. Paris : Hermann.
  9. ^ (EN) Laporte, Eric, 2015, "The Science of Linguistics", Inference. International Review of Science 1(2).
  10. ^ Elia, Annibale. 1984. Lessico-grammatica Dei Verbi Italiani E Completiva. Liguori. 160 p. ISBN 8820713446.
  11. ^ (EN) Gross, Maurice. 1979. On the failure of generative grammar. Language 55:4, pp. 859-885.
  12. ^ (EN) Gross, Maurice, A linguistic environment for comparative Romance syntax, Papers from the XIIth Linguistic Symposium on Romance Languages, 1984, pp. 373-446, Amsterdam/Philadelphia: John Benjamins.
  13. ^ (EN) Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, Séoul : Hanshin Pub. Co.
  14. ^ Vietri, Simonetta. 2004. Lessico-grammatica dell'italiano. Metodi, descrizioni e applicazioni. UTET Università. 304 p. ISBN 8877508884.
  15. ^ Soprattutto attraverso il software Intex sviluppato da Max Silberztein.
  16. ^ Laporte, Éric. 2008. Exemples attestés et exemples construits dans la pratique du lexique-grammaire, in J. François (ed.), Observations et manipulations en linguistique: entre concurrence et complémentarité, Louvain/Paris/Dudley : Peeters. Mémoires de la Société de linguistique de Paris. Nouvelle Série. Vol. 16, pp. 11–32.
  17. ^ (EN) Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, Mouton de Gruyter, pp. 35-60. (Proceedings from a 1992 Nobel Symposium on Corpus Linguistics, Stockholm.)
  18. ^ (EN) Baker, Collin F., Charles J. Fillmore, Beau Cronin. 2003. "The Structure of the Framenet Database", International Journal of Lexicography 16.3, pp. 281-296.
  19. ^ (EN) Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.
  20. ^ (FR) Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), Berlin-New York: Walter de Gruyter, pp. 2122-2129.
  21. ^ (EN) D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, Amsterdam/Philadelphia : Benjamins, pp. 125–136.
  22. ^ (EN) Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
  23. ^ (FR) Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
  24. ^ (FR) Nam, Jee-sun, 1997, "Lexique grammaire des adjectifs coréens et analyse syntaxique automatique", Langages 126, Paris : Larousse.[collegamento interrotto]
  25. ^ a b (FR) Labelle, Jacques. 1974. "Le substantif symétrique". Cahiers de Linguistique 5, pp. 17-49, Montréal: UQAM.
  26. ^ a b (FR) Gross, Maurice. 1982. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11.2, pp. 151-185, Montréal: UQAM.
  27. ^ (EN) Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphie, University of Pennsylvania (ripubblicato in Papers in Structural and Transformational Linguistics, 1970, Dordrecht:Reidel).
  28. ^ (FR) Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique. Genève: Droz.
  29. ^ (FR) Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support. Genève: Droz.
  30. ^ (FR) Gross, Gaston. 1989. Les constructions converses du français, Genève : Droz.
  31. ^ Cicalese, Anna. 1995. L'analisi dei nomi operatori con il verbo fare, in E. d'Agostino (ed.), Tra sintassi e semantica, Napoli, ESI, pp.113-166.
  32. ^ Tronci, Liana. 2007. Spunti per una lessico-grammatica dei predicati psicologici in italiano[collegamento interrotto], Linguisti in contatto. Ricerche di linguistica italiana in Svizzera.
  33. ^ (FR) Danlos, Laurence. 1981. La morphosyntaxe des expressions figées. Langages 63, pp. 53-74, Paris : Larousse. pdf[collegamento interrotto]
  34. ^ Vietri, Simonetta. 1984. Lessico e sintassi delle espressioni idiomatiche. Una tipologia tassonomica in italiano e in inglese, Liguori Editore: Napoli, ISBN 88-207-1349-7.
  35. ^ (EN) Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6. pdf
  36. ^ Elia, Annibale. 1990. Chiaro e tondo: Lessico-Grammatica degli avverbi composti in italiano, Salerno: Segno Associati.
  37. ^ (PT) Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguística 1-2, Lisboa: Instituto Nacional de Investigação Científica.
  38. ^ Elia, Annibale. 1994. Per filo e per segno: gli avverbi composti dell'italiano, in E. D'Agostino (ed.), Tra sintassi e semantica, Napoli, ESI, p.167-264.
  39. ^ De Gioia, Michele. 2001. Avverbi idiomatici dell'italiano. Analisi lessico-grammaticale, Torino: L'Harmattan Italia, 345 p.
  40. ^ Vietri, Simonetta. 2014. Idiomatic Constructions in Italian. A Lexicon-Grammar approach, Amsterdam: John Benjamins, 259 p.

Bibliografia[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]