Hva er en tekstfil?
En tekstfil er en datafil som lagrer et skrevet dokument som en serie alfanumeriske tegn, vanligvis uten visuell formateringsinformasjon. Innholdet kan være en personlig lapp eller liste, en journal eller avisartikkel, en bok eller annen tekst som kan gjengis nøyaktig i maskinskrevet form. Tekstfiler ligner tekstbehandlingsfiler ved at innholdet i begge hovedsakelig er tekstlig; de skiller seg ut i at tekstfiler vanligvis ikke registrerer informasjon som karakterstil og størrelse, paginering eller andre detaljer som vil spesifisere utseendet til et ferdig dokument. Noen datamaskinoperativsystemer skiller et grunnleggende skille mellom en tekstfil, som er ment å bli oversatt direkte til menneskelig lesbar tekst, og en binær fil, som tolkes direkte av datamaskinen.
I de fleste av skjemaene som brukes til å kode tekst, tildeles hvert tegn en numerisk verdi, med teksten deretter skrevet som en streng med binære tall. En familie med kodingsordninger, kalt American Standard Code for Information Interchange (ASCII), ble en mye brukt standard tidlig i historien til databehandling, til tross for at den har dårlig støtte for andre språk enn engelsk. ISO 8859-koden har gitt mye bedre støtte for språk basert på det latinske alfabetet og lignende alfabeter, men har ikke vært i stand til å kode kodene fra østasiatiske språk som japansk, noe som førte til en spredning av uforenlige standarder.
Nylig har Unicode® Consortium utviklet et kodesystem kalt Unicode® som har som mål å tilordne et unikt nummer til alle tegn som brukes på alle språk på jorden. Dette gjør at en enkelt kode kan brukes for hvert språk, og at tekster fra flere språk kan vises i en enkelt fil. Den første delen av Unicode er basert på ISO 8859, som i seg selv er basert på ASCII. Bruk av Unicode® kan ha fordeler selv i engelsktalende land, da tekst som er kodet ved bruk av eldre skjemaer kan vise til mindre uoverensstemmelser når de flyttes fra system til system.
Fordelene med tekstfiler inkluderer liten størrelse og allsidighet. Kilobyte eller megabyte mindre enn de samme dataene som er lagret i andre formater, de kan raskt og massivt utveksles via e-post eller disk. De fleste kan åpnes på datamaskiner som kjører forskjellige operativsystemer, ved å bruke veldig grunnleggende programvare. Den primære ulempen er mangelen på formatering. En tekstfil kan være et dårlig valg for å representere et dokument som inneholder bilder eller som er avhengig av designelementer for å kommunisere dens betydning - for eksempel en fil som inneholder tabelldata, matematiske formler eller konkret poesi.
Tekstfiler er generelt ment å bli lest og redigert av mennesker, men ikke alle av dem inneholder innhold som først og fremst er til konsum. De fleste programmeringskoder lagres i en tekstfil før den blir satt sammen - det vil si oversatt til en maskinlesbar binær fil. Filer kan også inneholde maskinlesbare tekstlige koder som gir formateringsinformasjon i tillegg til ren tekst. For eksempel kan en Hypertext Markup Language (HTML) -fil åpnes som en ren tekstfil i en tekstredigerer, eller vises som en formatert webside etter å ha blitt tolket av en nettleser. Lignende ordninger inkluderer LaTeX, brukt til å legge ut vitenskapelige artikler, og XML (Extensible Markup Language) som brukes til å strukturere data.