VERON afdeling Friese Wouden
Afdelingsblad 'CQ Friese Wouden'
Een consortium van Amerikaanse computerbedrijven heeft een
nieuwe set computercodes ontwikkeld waarmee alle getallen, cijfers, karakters en
symbolen van de belangrijkste talen ter wereld kunnen worden weergegeven en de
meeste van de kleinere talen. Het systeem heet Unicode en het consortium, waarin
IBM, Apple, Sun Microsystems en Micrsoft deelnemen, draagt dezelfde naam.
Vrijwel elk pc in het Westen gebruikt ASCII-karakters
(American Standard Code for Information Interchange). Het is in 1967 algemeen
ingevoerd en omvatte toen 128 karakters. In de loop der jaren is het uitgebreid
tot 256 karakters. Elk ASCII-karakter wordt in de computer omgezet in een
digitaal getal van 8 nullen of enen (bits). Er zijn dan dus 2 tot de achtste
macht ofwel 256 mogelijkheden.
Unicode werkt op basis van getallen van 16 bits, waardoor het
aantal mogelijkheden op een totaal van 65.536 komt (2 tot de zestiende macht).
Een handicap van ASCII is dat bijvoorbeeld het gebruik van letters met accenten
niet is gestandaardiseerd. Chinees, Japans of Hebreews kan al helemaal niet
worden geschreven in ASCII.
De ruim 65.000 codes die met Unicode zijn te maken, lossen dit
probleem op: 6.000 is voldoende voor alle alfabetten in Europa, het
Midden-Oosten en het Indiase subcontinent. Voor chinese, Japanse en Koreaans
karakters zijn 18.000 codes nodig. In december is de eerste versie van Unicode
(1.0) uitgegeven, met 27.000 codes, inclusief wiskundige en wetenschappelijke
symbolen.
Ruim de helft van de mogelijkheden is nog onbenut, waardoor er
nog voldoende ruimte is voor rune-tekens, hieroglyfen en spijkerschrift, mocht
daar vraag naar zijn. Unicode hoopt met zijn nieuwe set karakters orde te
scheppen in de internationale chaos. De eerste 128 codes van ASCII (het Latijnse
alfabet, leestekens en getallen) is gestandaardiseerd in het Westen, de
uitbreiding tot 256 karakters (onder meer letters met accenten en in de
wetenschap veel gebruikte Griekse letters) niet. De International Standards
Organization heeft ooit een systeem op basis van 8 bits ontworpen voor het
Latijnse alfabet, het Grieks, het Hebreeuws, het Arabisch en het Cyrillisch,
maar dat systeem wordt niet uniform gebruikt. China, Japan en Korea hebben elk
een eigen nationale standaard ontwikkeld, maar die standaards zijn totaal
incompatibel, zelfs in het geval dat twee talen dezelfde karakters gebruiken.
De nieuwe code gaat wel ten koste van snelheid en opslagruimte.
Doordat elk nieuw Unicode-symbool twee keer zoveel bits in beslag neemt als een
ASCII-karakter, duurt het ook twee keer zo lang voor een tekst per modem is
verzonden. Verder kan een schijf maar half zoveel tekst bevatten. Unicode denkt
echter dat de introductie van het nieuwe systeem pijnloos kan verlopen door
snelle verbeteringen in verwerkingssnelheid en opslagcapaciteit.