Skip to main content

Что такое текстовый файл?

Текстовый файл - это компьютерный файл, в котором напечатанный документ хранится в виде последовательности буквенно-цифровых символов, обычно без визуальной информации о форматировании. Контент может быть личной заметкой или списком, журнальной или газетной статьей, книгой или любым другим текстом, который может быть точно воспроизведен в машинописной форме. Текстовые файлы аналогичны текстовым файлам в том, что их содержимое в основном текстовое; они отличаются тем, что в текстовых файлах обычно не записывается такая информация, как стиль и размер символов, разбиение на страницы или другие детали, которые определяют внешний вид готового документа. Некоторые компьютерные операционные системы проводят основное различие между текстовым файлом, который предназначен для непосредственного перевода в текст, читаемый человеком, и двоичным файлом, который интерпретируется непосредственно компьютером.

В большинстве схем, используемых для кодирования текста, каждому символу присваивается числовое значение, а текст затем записывается в виде строки двоичных чисел. Одно семейство схем кодирования, называемое Американским стандартным кодом для обмена информацией (ASCII), стало широко используемым стандартом на ранних этапах истории вычислительной техники, несмотря на слабую поддержку языков, отличных от английского. Семейство кодов ISO 8859 обеспечило гораздо лучшую поддержку языков, основанных на латинском алфавите и подобных алфавитах, но не смогло кодировать символы из восточноазиатских языков, таких как японский, что привело к распространению несовместимых стандартов.

Совсем недавно Консорциум Unicode® разрабатывал систему кодирования под названием Unicode® , целью которой является присвоение уникального номера каждому символу, используемому на всех языках мира. Это позволит использовать один код для каждого языка и позволить текстам с нескольких языков отображаться в одном файле. Первая часть Unicode основана на ISO 8859, который сам основан на ASCII. Использование Unicode® может иметь преимущества даже в англоязычных странах, поскольку текст, закодированный с использованием старых схем, может отображать незначительные несоответствия при перемещении из системы в систему.

Преимущества текстовых файлов включают небольшой размер и универсальность. Килобайты или мегабайты меньше, чем те же данные, хранящиеся в других форматах, их можно быстро и массово обменять по электронной почте или на диске. Большинство из них можно открыть на компьютерах, работающих под управлением различных операционных систем, с использованием базового программного обеспечения. Основным недостатком является отсутствие форматирования. Текстовый файл может быть плохим выбором для представления документа, который содержит изображения или использует элементы дизайна для передачи его значения - например, файл, содержащий табличные данные, математические формулы или конкретные стихи.

Текстовые файлы, как правило, предназначены для чтения и редактирования людьми, но не все из них содержат контент, предназначенный главным образом для потребления человеком. Большая часть программного кода хранится в текстовом файле до компиляции, то есть переводится в машиночитаемый двоичный файл. Файлы могут также содержать машиночитаемые текстовые теги, которые дают информацию о форматировании в дополнение к простому тексту. Например, файл языка гипертекстовой разметки (HTML) можно открыть в виде простого текстового файла в текстовом редакторе или отобразить как отформатированную веб-страницу после интерпретации веб-браузером. Подобные схемы включают LaTeX, используемый для размещения научных работ, и Extensible Markup Language (XML), используемый для структурирования данных.