|

Unicode is een internationale standaard voor de identificatie van grafische tekens en symbolen, vergelijkbaar met de ASCII-tabel, maar meer uitgebreid. De standaard voorziet alle tekens en symbolen ('karakters') van alle geschreven talen van een nummer. De standaard wordt onderhouden door het Unicode Consortium.

In tegenstelling tot ASCII (alleen Engels) of Latin-1 (alleen West-Europese talen) ondersteunt Unicode alle gebruikte schriften (zoals het Griekse alfabet en Chinese karakters). Unicode zegt niets over hoe een teken wordt geschreven (dat is aan de letterontwerper). De standaard bevat momenteel ongeveer 100.000 gestandaardiseerde karakters en ongeveer 900.000 gereserveerde karakters.

Unicode stelt geen beperkingen in het aantal talen dat gebruikt kan worden in één enkel document. Naast de letters bevat Unicode ook alle symbolen, zoals: kruisen, wiskundige tekens, muntsymbolen enzovoort. Unicode bevat geen symbolen die niet in een schrift worden gebruikt, zoals verkeersborden. Enkele symbolen in Unicode hebben alleen een betekenis in druk- of zettechnische zin, zoals: de niet-afbrekende spatie (NBSP).