문자 인코딩이란 무엇입니까?
문자 인코딩은 컴퓨터 프로그래밍에서 문자, 글리프 또는 기호의 일반적으로 숫자 표현을 찾는 데 사용되는 메소드 또는 알고리즘입니다. 컴퓨터 메모리 및 컴퓨터로 읽을 수있는 미디어의 정보는 비트 또는 숫자 시퀀스로 저장되므로 컴퓨터에서 문자 인코딩을 사용하는 것이 필요합니다. 이를 위해서는 인코딩을 사용하여 디스플레이 또는 인간으로 읽을 수있는 출력에 사용되는 비 수식 문자를 컴퓨터가 조작 할 수있는 형태로 변환해야합니다. 보다 구체적인 응용 프로그램에서 웹 브라우저에서 읽는 HTML (HyperText Markup Language) 문서는 문서에 정보를 표시 할 때 브라우저에 사용할 특정 문자를 알리기 위해 사용중인 문자 유형의 인코딩 유형을 정의 할 수 있습니다. 사용 중에도 몇 가지 인코딩 체계가 있지만, 이러한 독점 및 레거시 세트 중 다수는 천천히 유니 코드 ® 인코딩 표준으로 대체되고 있습니다.
컴퓨터 초기에 메모리 공간이 제한된 경우, 구두점 및 숫자를 포함한 영어 알파벳의 기본 문자는 128 개의 다른 문자를 허용하는 7 비트 시퀀스에 저장되었습니다. 이 원래 체계에서, 각 7 비트 바이트는 영어 알파벳의 한 특성을 나타내며 순서대로 번호가 매겨졌습니다. 이 문자 인코딩은 효율적이며 결국 생산 된 대부분의 컴퓨터에서 표준화되어 사용되었습니다. 인코딩 시스템이 유니 코드 ® 인코딩 표준으로 진화했지만 개념은 동일하게 유지되었습니다. 즉, 언어의 각 단일 문자는 큰 표준 문자 세트 내의 단일 숫자와 직접 관련이 있으며, 그 숫자는 컴퓨터가 문자를 저장, 처리 및 색인하는 데 사용하는 것입니다.
다른 유형의 문자 인코딩은 다른 이유로 개발되었습니다. 영어 알파벳에 특별히 준비되어 있고 텍스트에만 사용되도록 의도 된 일부는 charact 만 맵핑되었습니다.7 비트 시퀀스에 e를 낸 다음 8 비트 바이트 또는 옥켓에 걸쳐 퍼뜨립니다. 이는 옥틴 당 1 비트를 저장하는 효과가 있었으며, 효과적으로 특성 인코딩을 압축 유형으로 사용했습니다. 다른 인코딩 체계는 캐릭터에 대한 기본 정보를 제공하려고 시도한 다음 다른 언어로 쓸 때 사용할 수있는 특수 악센트를 나타 내기 위해 추가 문자를 제공하려고 시도했지만, 단순한 일대일 인코딩 방법에 대해 크게 버려졌습니다.
.HTML 문서에서 문자 인코딩은 인코딩이 정의되는 인코딩이 전체 문자 세트를 포함하는 것을 제외하고는 더 넓은 개념과 거의 동일합니다. 이것은 외국어뿐만 아니라 모든 캐릭터 세트에 존재하지 않는 과학 또는 수학에 특정 기호를 사용하는 문서에 중요 할 수 있습니다. 또한 인코딩 체계에 걸쳐 존재하지 않거나 다르게 매핑 될 수있는 구두점 및 기타 글리프를 사용하는 데 유용 할 수 있습니다. 비표준 문자를 제대로 정의하지 않는 문서인코딩은 읽을 수있는 정보 대신 잘못 표시되거나 무의미한 문자와 자리 표시 자로 채워질 수 있습니다.