Che cos'è un file di testo?

Un file di testo è un file di computer che memorizza un documento digitato come una serie di caratteri alfanumerici, generalmente senza informazioni di formattazione visiva. Il contenuto può essere una nota o un elenco personale, una rivista o un articolo di giornale, un libro o qualsiasi altro testo che può essere riprodotto accuratamente in forma dattiloscritta. I file di testo sono simili ai file di elaborazione testi in quanto il contenuto di entrambi è principalmente testuale; differiscono per il fatto che i file di testo di solito non registrano informazioni come stile e dimensioni dei caratteri, impaginazione o altri dettagli che specificano l'aspetto di un documento finito. Alcuni sistemi operativi per computer fanno una distinzione di base tra un file di testo, che deve essere tradotto direttamente in testo leggibile dall'uomo, e un file binario, che viene interpretato direttamente dal computer.

Nella maggior parte degli schemi utilizzati per la codifica del testo, a ciascun carattere viene assegnato un valore numerico, con il testo quindi scritto come una stringa di numeri binari. Una famiglia di schemi di codifica, chiamata American Standard Code for Information Interchange (ASCII), divenne uno standard ampiamente utilizzato all'inizio della storia dell'informatica, nonostante il suo scarso supporto per lingue diverse dall'inglese. La famiglia di codici ISO 8859 ha fornito un supporto molto migliore per le lingue basate sull'alfabeto latino e alfabeti simili, ma non è stata in grado di codificare i caratteri delle lingue dell'Asia orientale come il giapponese, portando a una proliferazione di standard incompatibili.

Più recentemente, il consorzio Unicode® ha sviluppato un sistema di codifica chiamato Unicode® che ha l'obiettivo di assegnare un numero univoco a ogni personaggio utilizzato in ogni lingua sulla terra. Ciò consentirà di utilizzare un unico codice per ogni lingua e di visualizzare testi di più lingue in un unico file. La prima parte di Unicode è basata su ISO 8859, che è essa stessa basata su ASCII. L'uso di Unicode® può avere vantaggi anche nei paesi di lingua inglese, poiché il testo codificato utilizzando schemi più vecchi può mostrare lievi incoerenze quando viene spostato da un sistema all'altro.

I vantaggi dei file di testo includono dimensioni ridotte e versatilità. Kilobyte o megabyte più piccoli degli stessi dati archiviati in altri formati, possono essere scambiati rapidamente e in modo massiccio tramite e-mail o disco. La maggior parte può essere aperta su computer con diversi sistemi operativi, utilizzando un software molto semplice. Lo svantaggio principale è la mancanza di formattazione. Un file di testo può essere una cattiva scelta per rappresentare un documento che contiene immagini o che si basa su elementi di design per comunicarne il significato, ad esempio un file contenente dati tabulari, formule matematiche o poesie concrete.

I file di testo sono generalmente intesi per essere letti e modificati dagli umani, ma non tutti contengono contenuti che sono principalmente destinati al consumo umano. La maggior parte del codice di programmazione viene memorizzata in un file di testo prima di essere compilata, ovvero tradotta in un file binario leggibile dalla macchina. I file possono anche contenere tag testuali leggibili meccanicamente che forniscono informazioni di formattazione oltre al testo normale. Ad esempio, un file Hypertext Markup Language (HTML) può essere aperto come un semplice file di testo in un editor di testo o visualizzato come una pagina Web formattata dopo essere stato interpretato da un browser web. Schemi simili includono LaTeX, utilizzato per la stesura di articoli scientifici e Extensible Markup Language (XML), utilizzato per strutturare i dati.

Che cos'è un file di testo?

Questo articolo è stato utile?