Wat is een tekstbestand?

Een tekstbestand is een computerbestand dat een getypt document opslaat als een reeks alfanumerieke tekens, meestal zonder informatie over visuele opmaak. De inhoud kan een persoonlijke notitie of lijst zijn, een tijdschrift- of krantenartikel, een boek of andere tekst die nauwkeurig in een getypte vorm kan worden weergegeven. Tekstbestanden zijn vergelijkbaar met tekstverwerkingsbestanden, omdat de inhoud van beide voornamelijk tekstueel is; Ze verschillen in die tekstbestanden, registreren meestal geen informatie zoals tekenstijl en grootte, paginering of andere details die het uiterlijk van een voltooid document zouden specificeren. Sommige computerbesturingssystemen maken een basisonderscheid tussen een tekstbestand, dat bedoeld is om rechtstreeks in de mens-leesbare tekst te worden vertaald, en een binair bestand, dat rechtstreeks door de computer wordt geïnterpreteerd.

In de meeste schema's die worden gebruikt voor het coderen van tekst, wordt aan elk teken een numerieke waarde toegewezen, met de tekst die vervolgens is geschreven als een reeks van binaire getallen. Een familie van coderingsschema's, de genoemdAmerican Standard Code for Information Interchange (ASCII), werd een veelgebruikte standaard vroeg in de geschiedenis van computergebruik, ondanks zijn slechte steun voor andere talen dan Engels. De ISO 8859 -familie van codes heeft veel betere ondersteuning geboden voor talen op basis van het Latijnse alfabet en soortgelijke alfabetten, maar is niet in staat geweest om de personages uit Oost -Aziatische talen zoals Japans te coderen, wat leidt tot een proliferatie van onverenigbare normen.

Meer recent heeft het Unicode® -consortium een ​​coderingssysteem ontwikkeld genaamd Unicode® dat het doel heeft om een ​​uniek nummer toe te wijzen aan elk personage dat in elke taal op aarde wordt gebruikt. Hierdoor kan een enkele code voor elke taal worden gebruikt en kunnen teksten uit meerdere talen in één bestand verschijnen. Het eerste deel van Unicode is gebaseerd op ISO 8859, dat zelf gebaseerd is op ASCII. Het gebruik van Unicode® kan adv hebbenAntages zelfs in Engelstalige landen, omdat tekst die wordt gecodeerd met behulp van oudere schema's kleine inconsistenties kan vertonen wanneer ze van systeem naar systeem worden verplaatst.

Voordelen van tekstbestanden omvatten klein formaat en veelzijdigheid. Kilobytes of megabytes kleiner dan dezelfde gegevens die in andere formaten zijn opgeslagen, kunnen snel en massaal worden uitgewisseld via e -mail of schijf. De meeste kunnen worden geopend op computers met verschillende besturingssystemen, met behulp van zeer basissoftware. Het primaire nadeel is het gebrek aan opmaak. Een tekstbestand kan een slechte keuze zijn voor het weergeven van een document dat afbeeldingen bevat of dat afhankelijk is van ontwerpelementen om de betekenis ervan te communiceren - een bestand met tabelgegevens, wiskundige formules of concrete poëzie, bijvoorbeeld.

tekstbestanden zijn over het algemeen bedoeld om te worden gelezen en bewerkt door mensen, maar niet allemaal bevatten ze inhoud die voornamelijk voor menselijke consumptie is. De meeste programmeercode wordt opgeslagen in een tekstbestand voordat u wordt gecompileerd - dat wil zeggen vertaald in een MacHine-leesbaar binair bestand. Bestanden kunnen ook machine-leesbare tekstuele tags bevatten die opmaakinformatie geven naast gewone tekst. Een HTML -bestand (HyperText Markup Language (HTML) kan bijvoorbeeld worden geopend als een platte tekstbestand in een teksteditor, of worden weergegeven als een opgemaakte webpagina nadat hij is geïnterpreteerd door een webbrowser. Soortgelijke schema's omvatten latex, gebruikt voor het opstellen van wetenschappelijke artikelen en uitbreidbare markup -taal (XML), gebruikt voor het structureren van gegevens.

ANDERE TALEN