Hva er et Unicode® -skrift?
Et Unicode® -skrift er den grafiske informasjonen som kreves for å vise tegnene som er til stede i Unicode® Universal Character Set (UCS). Det er mer enn 1 million tegn i UC -ene, hver kalt et kodepunkt, og de blir kontinuerlig revidert og utvidet. Av denne grunn velger mange Unicode® -skrifttyper å gi bare grafiske data for en delmengde av tegnene som kan være representert, for eksempel bare vestlige engelske bokstaver og tall, selv om det er noen skrifttyper som prøver å gi visningsinformasjon for så mange tegn som mulig. Til syvende og sist håndteres forbindelsen mellom et Unicode® -skrifttype og UCS av programvaren ved hjelp av tegnene, fordi det ikke er noen reell definisjon for hvordan skriftene skal oppføre seg på et programmeringsnivå.
Bruke en Unicode® -skrift innebærer å levere de to elementene som lager en fullstendig font. Den første er UCS, som er en definisjon av hvilke tegn som kartlegger hvilke spesifikke tall. Dette betyrat i UCS ville det engelske nummer 1 bli representert i settet med et spesifikt indeksnummer. Dette nummeret kan deretter brukes til å bestemme indeksen i skrifttypen for å finne de grafiske dataene slik at tegnet kan gjengis på en skjerm eller skrives ut til papir. Unicode® -standardene omhandler bare de underliggende UC -ene og ikke skrifttypene eller implementeringen av forholdet mellom de to, så dette kan variere fra program til program.
Informasjonen i et Unicode® -skrifttype kan være nesten alt som på noen måte oppfyller rollen som å vise eller representere UCS -karakteren. Den grafiske representasjonen av en UCS -karakter er kjent som en glyf. Glyfene i et skrifttype kan være bilder, eller de kan være vektortata slik at tegnene kan trekkes og skaleres til alle størrelser som er nødvendige. Det er ingen definisjon for hvordan Unicode® -skrifttypen må implementeres, så det kan også væreha informasjon for å gjengi bokstaver i tre dimensjoner (3D), eller til og med lydsignaturer i stedet for visuelle data.
Det er noen typiske metoder for å implementere komplekse tegn i et Unicode®-skrifttype, spesielt på ikke-vestlige språk der det kan være titusenvis av individuelle karakterer. En måte er å gi informasjon om hvordan du kan kompilere en enkelt glyf fra flere elementer som hver kan brukes i mer enn ett tegn. Dette kan tillate et skrifttype å inneholde mindre repeterende grafiske data, og i stedet erstatte den med et system med lagdeling for å lage de unike bildene som er nødvendige.