VERON A63
Friese Wouden
____________





Up
Bijeenkomst
Silent Key
Gouden speld
Overwikkelen
Voor U gelezen

 

VERON afdeling Friese Wouden
Afdelingsblad 'CQ Friese Wouden'

Voor U gelezen

Een consortium van Amerikaanse computerbedrijven heeft een nieuwe set computercodes ontwikkeld waarmee alle getallen, cijfers, karakters en symbolen van de belangrijkste talen ter wereld kunnen worden weergegeven en de meeste van de kleinere talen. Het systeem heet Unicode en het consortium, waarin IBM, Apple, Sun Microsystems en Micrsoft deelnemen, draagt dezelfde naam.

Vrijwel elk pc in het Westen gebruikt ASCII-karakters (American Standard Code for Information Interchange). Het is in 1967 algemeen ingevoerd en omvatte toen 128 karakters. In de loop der jaren is het uitgebreid tot 256 karakters. Elk ASCII-karakter wordt in de computer omgezet in een digitaal getal van 8 nullen of enen (bits). Er zijn dan dus 2 tot de achtste macht ofwel 256 mogelijkheden.

Unicode werkt op basis van getallen van 16 bits, waardoor het aantal mogelijkheden op een totaal van 65.536 komt (2 tot de zestiende macht). Een handicap van ASCII is dat bijvoorbeeld het gebruik van letters met accenten niet is gestandaardiseerd. Chinees, Japans of Hebreews kan al helemaal niet worden geschreven in ASCII.

De ruim 65.000 codes die met Unicode zijn te maken, lossen dit probleem op: 6.000 is voldoende voor alle alfabetten in Europa, het Midden-Oosten en het Indiase subcontinent. Voor chinese, Japanse en Koreaans karakters zijn 18.000 codes nodig. In december is de eerste versie van Unicode (1.0) uitgegeven, met 27.000 codes, inclusief wiskundige en wetenschappelijke symbolen.

Ruim de helft van de mogelijkheden is nog onbenut, waardoor er nog voldoende ruimte is voor rune-tekens, hieroglyfen en spijkerschrift, mocht daar vraag naar zijn. Unicode hoopt met zijn nieuwe set karakters orde te scheppen in de internationale chaos. De eerste 128 codes van ASCII (het Latijnse alfabet, leestekens en getallen) is gestandaardiseerd in het Westen, de uitbreiding tot 256 karakters (onder meer letters met accenten en in de wetenschap veel gebruikte Griekse letters) niet. De International Standards Organization heeft ooit een systeem op basis van 8 bits ontworpen voor het Latijnse alfabet, het Grieks, het Hebreeuws, het Arabisch en het Cyrillisch, maar dat systeem wordt niet uniform gebruikt. China, Japan en Korea hebben elk een eigen nationale standaard ontwikkeld, maar die standaards zijn totaal incompatibel, zelfs in het geval dat twee talen dezelfde karakters gebruiken.

De nieuwe code gaat wel ten koste van snelheid en opslagruimte. Doordat elk nieuw Unicode-symbool twee keer zoveel bits in beslag neemt als een ASCII-karakter, duurt het ook twee keer zo lang voor een tekst per modem is verzonden. Verder kan een schijf maar half zoveel tekst bevatten. Unicode denkt echter dat de introductie van het nieuwe systeem pijnloos kan verlopen door snelle verbeteringen in verwerkingssnelheid en opslagcapaciteit.