Hvad er et Unicode®-skrifttype?
Et Unicode®-skrifttype er den grafiske information, der kræves for at få vist de tegn, der findes i Unicode® universal tegnsæt (UCS). Der er mere end 1 million tegn i UCS, der hver kaldes et kodepunkt, og de revideres og udvides løbende. Af denne grund vælger mange Unicode®-skrifttyper kun at give grafiske data for en undergruppe af de tegn, der kunne repræsenteres, såsom kun vestlige engelske bogstaver og tal, selvom der er nogle skrifttyper, der forsøger at give visningsoplysninger for så mange tegn som muligt. I sidste ende håndteres forbindelsen mellem et Unicode®-skrifttype og UCS af softwaren ved hjælp af tegnene, fordi der ikke er nogen reel definition for, hvordan skrifttyperne skal opføre sig på et programmeringsniveau.
Brug af et Unicode®-skrifttype involverer at udlevere de to elementer, der udgør en komplet skrifttype. Den første er UCS, som er en definition af hvilke tegn, der kortlægger til hvilke specifikke tal. Dette betyder, at i UCS, det engelske nummer 1 ville blive repræsenteret i sættet med et specifikt indeksnummer. Dette nummer kan derefter bruges til at bestemme indekset i skrifttypen for at finde de grafiske data, så tegnet kan gengives på en skærm eller udskrives på papir. Unicode®-standarderne handler kun med den underliggende UCS og ikke skrifttyperne eller implementeringen af forholdet mellem de to, så dette kan variere fra program til program.
Oplysningerne i et Unicode®-skrifttype kan være næsten alt, hvad der på en eller anden måde udfører rollen som visning eller repræsentation af UCS-tegnet. Den grafiske repræsentation af et UCS-tegn er kendt som en glyph. Glyfene i et skrifttype kan være billeder, eller de kan være vektordata, så tegnene kan tegnes og skaleres til enhver nødvendig størrelse. Der er ingen definition af, hvordan Unicode®-skrifttypen skal implementeres, så det kan også indeholde information til gengivelse af bogstaver i tre dimensioner (3D) eller endda lydsignaturer i stedet for visuelle data.
Der er nogle typiske metoder til at implementere komplekse tegn i et Unicode®-skrifttype, især på ikke-vestlige sprog, hvor der kan være titusinder af individuelle tegn. En måde er at give information om, hvordan man samler en enkelt glyph fra flere elementer, der hver især kan bruges i mere end én karakter. Dette kan give en skrifttype mulighed for at indeholde mindre gentagne grafiske data og i stedet erstatte dem med et lagdelingssystem for at skabe de nødvendige unikke billeder.