Formati “proprietari” (doc, pdf, ecc.)
• essere creati, letti e interpretati solo da specifico programma (es. Word, Adobe)
• oltre a sequenze di bits codificano caratteri, il file>sequenze binarie corrispondono a istruzioni di formattazione, codificate secondo le convenzioni di un certo programma
Vantaggi
• massima capacità espressiva e fruibilità per l’utente umano
• rappresenta aspetti relativi codifica di alto livello
• ma solo per quanto riguarda la struttura testuale!!
Svantaggi
• formato “chiuso” minima portabilità e interscambiabilità
• codifica no categorie testuali “astratte”, ma modalità di visualizzazione
• le informazioni linguistiche comunque implicite nel testo