문자 인코딩이란 무엇입니까?

문자 인코딩은 컴퓨터 프로그래밍에서 문자, 글리프 또는 기호의 일반적으로 숫자 표현을 찾는 데 사용되는 메소드 또는 알고리즘입니다. 컴퓨터 메모리 및 컴퓨터로 읽을 수있는 미디어의 정보는 비트 또는 숫자 시퀀스로 저장되므로 컴퓨터에서 문자 인코딩을 사용하는 것이 필요합니다. 이를 위해서는 인코딩을 사용하여 디스플레이 또는 인간으로 읽을 수있는 출력에 사용되는 비 수식 문자를 컴퓨터가 조작 할 수있는 형태로 변환해야합니다. 보다 구체적인 응용 프로그램에서 웹 브라우저에서 읽는 HTML (HyperText Markup Language) 문서는 문서에 정보를 표시 할 때 브라우저에 사용할 특정 문자를 알리기 위해 사용중인 문자 유형의 인코딩 유형을 정의 할 수 있습니다. 사용 중에도 몇 가지 인코딩 체계가 있지만, 이러한 독점 및 레거시 세트 중 다수는 천천히 유니 코드 ® 인코딩 표준으로 대체되고 있습니다.

컴퓨터 초기에 메모리 공간이 제한된 경우, 구두점 및 숫자를 포함한 영어 알파벳의 기본 문자는 128 개의 다른 문자를 허용하는 7 비트 시퀀스에 저장되었습니다. 이 원래 체계에서, 각 7 비트 바이트는 영어 알파벳의 한 특성을 나타내며 순서대로 번호가 매겨졌습니다. 이 문자 인코딩은 효율적이며 결국 생산 된 대부분의 컴퓨터에서 표준화되어 사용되었습니다. 인코딩 시스템이 유니 코드 ® 인코딩 표준으로 진화했지만 개념은 동일하게 유지되었습니다. 즉, 언어의 각 단일 문자는 큰 표준 문자 세트 내의 단일 숫자와 직접 관련이 있으며, 그 숫자는 컴퓨터가 문자를 저장, 처리 및 색인하는 데 사용하는 것입니다.

다른 유형의 문자 인코딩은 다른 이유로 개발되었습니다. 영어 알파벳에 특별히 준비되어 있고 텍스트에만 사용되도록 의도 된 일부는 charact 만 맵핑되었습니다.7 비트 시퀀스에 e를 낸 다음 8 비트 바이트 또는 옥켓에 걸쳐 퍼뜨립니다. 이는 옥틴 당 1 비트를 저장하는 효과가 있었으며, 효과적으로 특성 인코딩을 압축 유형으로 사용했습니다. 다른 인코딩 체계는 캐릭터에 대한 기본 정보를 제공하려고 시도한 다음 다른 언어로 쓸 때 사용할 수있는 특수 악센트를 나타 내기 위해 추가 문자를 제공하려고 시도했지만, 단순한 일대일 인코딩 방법에 대해 크게 버려졌습니다.

.

HTML 문서에서 문자 인코딩은 인코딩이 정의되는 인코딩이 전체 문자 세트를 포함하는 것을 제외하고는 더 넓은 개념과 거의 동일합니다. 이것은 외국어뿐만 아니라 모든 캐릭터 세트에 존재하지 않는 과학 또는 수학에 특정 기호를 사용하는 문서에 중요 할 수 있습니다. 또한 인코딩 체계에 걸쳐 존재하지 않거나 다르게 매핑 될 수있는 구두점 및 기타 글리프를 사용하는 데 유용 할 수 있습니다. 비표준 문자를 제대로 정의하지 않는 문서인코딩은 읽을 수있는 정보 대신 잘못 표시되거나 무의미한 문자와 자리 표시 자로 채워질 수 있습니다.

다른 언어

이 문서가 도움이 되었나요? 피드백 감사드립니다 피드백 감사드립니다

어떻게 도와 드릴까요? 어떻게 도와 드릴까요?