Co to jest plik tekstowy?
Plik tekstowy to plik komputerowy, w którym zapisany dokument jest ciągiem znaków alfanumerycznych, zwykle bez informacji o formatowaniu wizualnym. Treść może być notatką osobistą lub listą, czasopismem lub artykułem z gazety, książką lub dowolnym innym tekstem, który może być dokładnie oddany w formie do pisania. Pliki tekstowe są podobne do plików edytorów tekstu, ponieważ ich zawartość jest przede wszystkim tekstowa; różnią się tym, że pliki tekstowe zwykle nie rejestrują informacji, takich jak styl i rozmiar znaku, paginacja lub inne szczegóły, które określałyby wygląd gotowego dokumentu. Niektóre komputerowe systemy operacyjne dokonują podstawowego rozróżnienia między plikiem tekstowym, który ma być przetłumaczony bezpośrednio na tekst czytelny dla człowieka, a plikiem binarnym, który jest interpretowany bezpośrednio przez komputer.
W większości schematów używanych do kodowania tekstu każdemu znakowi przypisywana jest wartość liczbowa, a tekst jest następnie zapisywany jako ciąg liczb binarnych. Jedna rodzina schematów kodowania, zwana American Standard Code for Information Interchange (ASCII), stała się powszechnie stosowanym standardem na początku historii komputerów, pomimo słabej obsługi języków innych niż angielski. Rodzina kodów ISO 8859 zapewnia znacznie lepszą obsługę języków opartych na alfabecie łacińskim i podobnych alfabetach, ale nie jest w stanie zakodować znaków z języków wschodnioazjatyckich, takich jak japoński, co prowadzi do rozpowszechniania niezgodnych standardów.
Niedawno konsorcjum Unicode® opracowało system kodowania o nazwie Unicode® , którego celem jest przypisanie unikalnego numeru każdemu znakowi używanemu w każdym języku na ziemi. Umożliwi to użycie jednego kodu dla każdego języka i umożliwi wyświetlanie tekstów z wielu języków w jednym pliku. Pierwsza część Unicode oparta jest na ISO 8859, która sama jest oparta na ASCII. Korzystanie z Unicode® może mieć zalety nawet w krajach anglojęzycznych, ponieważ tekst zakodowany przy użyciu starszych schematów może wyświetlać niewielkie niespójności podczas przenoszenia z systemu do systemu.
Zalety plików tekstowych obejmują niewielki rozmiar i wszechstronność. Kilobajty lub megabajty mniejsze niż te same dane przechowywane w innych formatach, można je szybko i masowo wymieniać za pośrednictwem poczty elektronicznej lub dysku. Większość można otworzyć na komputerach z różnymi systemami operacyjnymi, przy użyciu bardzo podstawowego oprogramowania. Podstawową wadą jest brak formatowania. Plik tekstowy może być kiepskim wyborem do reprezentowania dokumentu zawierającego obrazy lub opartego na elementach projektu w celu przekazania jego znaczenia - na przykład plik zawierający dane tabelaryczne, wzory matematyczne lub konkretną poezję.
Pliki tekstowe są na ogół przeznaczone do odczytu i edycji przez ludzi, ale nie wszystkie zawierają treści przeznaczone głównie do spożycia przez ludzi. Większość kodu programowego jest przechowywana w pliku tekstowym przed kompilacją - to znaczy jest tłumaczona na plik binarny do odczytu maszynowego. Pliki mogą także zawierać znaczniki tekstowe do odczytu maszynowego, które oprócz zwykłego tekstu zawierają informacje o formatowaniu. Na przykład plik HTML (Hypertext Markup Language) można otworzyć jako zwykły plik tekstowy w edytorze tekstu lub wyświetlić jako sformatowaną stronę internetową po interpretacji przez przeglądarkę internetową. Podobne schematy obejmują LaTeX, używany do tworzenia artykułów naukowych oraz Extensible Markup Language (XML), używany do strukturyzacji danych.