Please enable JavaScript.
Coggle requires JavaScript to display documents.
italiano COMUNICAZIONE ISTITUZIONALE, LINGUISTICA DEI CORPORA - Coggle…
-
LINGUISTICA DEI CORPORA
CORPORA
La linguistica dei corpora non ha tanto a che vedere con il concetto di madrelingua ma ha a che fare con la performance, i testi effettivamente prodotti dai madrelingua. Non si basa sulle regole astratte ma sulla realizzazione di enunciati.
La linguistica dei corpora non ha a che vedere con la competenza ma con la performance ovvero l’effettivo comportamento linguistico da parte della popolazione
CORPUS
-
Leach 1996 “a helluva lot of text, stored on a computer”
elementi necessari sono le dimensioni e il computer, che possono gestire molte più informazioni degli esseri umani-> analisi automatica
-
defnizione di barbera: raccolta di testi (scritti orali o multimediali) o parti di essi in numero finito in formato elettronico trattati in modo uniforme (ossia tokenizzati ed addizionati di markup adeguato) così da essere gestibili ed interrogabili informaticamente; se (come spesso) le finalità sono linguistiche (descrizione di lingue naturali o loro varietà), i testi sono perlopiù scelti in modo da essere autentici e rappresentativi
-
L’analisi dei corpora non è sempre votata all’analisi della lingua, molto spesso viene utilizzata per analizzare i contenuti
La prima applicazione linguistica su ampia scala è la grammatica edita da Fries che si basava sulla trascrizione di conversazioni telefoniche (descriveva alcuni fenomeni della lingua)
Il primo corpus moderno (1954) è il Brown Corpus of American Written English compilato alla Brown University del Rhode Island, che aveva lo scopo di rappresentare l’americano scritto dell’inizio degli anni ’60.
-
LIMITI
Non è possibile studiare una lingua in sé e per sé con la statistica. La lingua è illimitata, non osservabile e instabile
+ampio il campione considerato, + i risultati sono affidabili
La popolazione (in questo caso la lingua) non è osservabile, non è limitata e quindi la lingua (intesa come performance, produzione linguistica) non è logisticamente osservabile
-
riassunto: la linguistica dei corpora ci può permettere di individuare delle tendenze di fondo difficilmente percepibili con un'analisi qualitativa perché richiedono una grossa mole di dati per essere estrapolati, problema principale è quella di confrontare i termini di paragonare che ci permettono di valutare il significato. la lingua per sé non è indagabile.