Please enable JavaScript.

Coggle requires JavaScript to display documents.

italiano COMUNICAZIONE ISTITUZIONALE, LINGUISTICA DEI CORPORA - Coggle…

- - - - chi scrive vuole mantenere la gerarchia rispetto a chi legge
      - non c’è interesse a farsi capire
      - per abitudine (sappiamo che dobbiamo usare una lingua diversa da quella che usiamo giornalmente)
        
        Traduzione endolinguisitca : all’interno della stessa lingua
  - - - tutti i giorni migliaia di persone avvocati carabinieri giornalisti traducono da un italiano comprensibile ad un italiano inesistenti e incomprensibile
        
        Per Calvino questo uccide la comunicazione
  - - - parole che una volta non si utilizzavano e ora sono di uso comune come internet, caso o anglicismi
  - - - I limiti: Non capisce la difficoltà semantica o se la retorica è sbagliata
  - - - iniziativa inglese per dare dei consigli per scrivere in maniera +chiara i testi dell'Unione europea
- - - - ipotassi: abuso di alcuni modi verbali che la determinano
        
        gerundio:vincolo di dover avere lo stesso soggetto della principale,è un modo flessibile dal punto di vista sintattico, molte funzioni e permette di compattare le informazioni
        
        participio: permette di risparmiare spazio perche sostituisce una relativa
      - incisi e parentiche: cambiano il normale ordine sov-> devono essere spostate prima dopo così da evitare di invertire l'ordine sov
      - Nominalizazzione: caratteristica del registro alto, compatta le info e occulta l'agente, formano cumuli nominali
      - verbi di significato generico seguito da pronominale
      - litote: figura retorica in cui si nega qualcosa invece di affermare un concetto. + negazioni mettono difficoltà
      - Lunghezza delle frasi: massimo 25 parole su carta/ 15 su schermo per farsi capire. una frase = un informazione.
      - Spersonalizzazione: forme impersonali o passivanti al posto dell'agente come soggetto. se non abbiamo un soggetto agente specifico si può ricorrere ad espressioni generiche (agente generico: il/la richiedente)
      - tra sintassi e morfologia
        
        Il congiuntivo è complicato per gli italiani per cui è meglio evitarlo se scriviamo testi x la popolazione media
        
        Futuro deontico: il futuro può essere utilizzato x indicare un dovere
        
        Participio presente: in italiano contemporaneo non si usa +, espilicitare con una relativa con senso verbale
  - - - impersonale
    - - parole in disuso o non esistenti nel vocabolario, finta ricerca di precisione
    - - tecnicismi collaterali (parole che sembrano più specifiche ma in realtà non hanno un significato + specifico)
  - - - L'oggetto deve permettere di identificare l’argomento e la funzione del testo, non deve essere troppo generico
        
        brevi ma esaurienti
      - se un testo ci arriva senza molte informazioni noi tendiamo ad inserire delle informazioni per renderlo coerente->il titolo deve dare delle informazioni per aiutarci a decodificare il testo
    - - comunicazioni burocratiche fanno riferimento alle leggi-> sono dei testi secondi che si riferiscono ad altri testi
        
        si trovano spesso in incisi che interrompono l'ordine normale sov->possiamo metterli tra parentesi o in nota. è opportuno specificare il titolo della legge o l’argomento
      - Intertestualità
    - - aspetti grafici: non leggibilità, centrato-> modo più difficile per leggere. tutto in maiuscolo è più difficile da leggere
      - scelte che devono essere sempre uguali dando degli standard di editing. cose che vanno regolamentate x ogni azienda
- - - - Questa definizione non è accurata perché se questa fosse la definizione di corpus gli estensori del vocabolario della Crusca già avevano fatto ricerca dei corpora
        
        Il vocabolario è stato costruito selezionando una lista di autori, ritenuti autorevoli, e in base a come le parole erano utilizzate in questo tipo di testi se ne è dedotto il significato
        
        pre-corpora (no grandi dimensioni, no analisi
        automatica)
    - - elementi necessari sono le dimensioni e il computer, che possono gestire molte più informazioni degli esseri umani-> analisi automatica
  - - - token : parola, contare le parole è la prima operazione da fare
        
        Tokenizzare significa dare delle informazioni standard
        
        Mark-up: informazioni esterne e interne al testo
        
        POS tagging: assegnazione delle classi nominali
        
        Lemmatizzazione
        
        Riconoscimento delle unità lessicale superiori o polirematiche: parole uniche, il significato complessivo è diverso dalla somma dei significati singoli, non si possono avere altre collocazioni e non si possono separare
        
        1 more item...
- - - - La popolazione (in questo caso la lingua) non è osservabile, non è limitata e quindi la lingua (intesa come performance, produzione linguistica) non è logisticamente osservabile
- - - - Apaxh parola che compare una volta sola nel corpus.
  - - - quando incontro due forme grafiche che hanno la stessa frequenza esse segnano il confine tra le parole di alta frequenza e le parole di media frequenza
        
        poi troviamo il primo salto di frequenza che segnala il salto tra le parole di media e bassa frequenza.