Egy karakter leírásához nyolc bit szükséges. A karakter (betűhely) egy leütés: 1 betű, egy szám, egy írásjel, 1 szóköz összefoglaló neve. Ezt tekintjük az információ egységének. (Vigyázz! Ne keverd össze az információmennyiség mértékegységével, a bittel!) Az információ legkisebb, önállóan még értelmezhető részét elemi adatnak nevezzük. A számítógép által feldolgozott elemi adatokat három csoportba soroljuk:
1. számok
2. szöveges információk
3. logikai típusú adatok (igaz, hamis értékű)
A számítógépekben az információ kódolására kódrendszert alkalmaznak. A kódolás során egy jelkészlet elemeit megfeleltetik egy másik jelkészlet elemeinek. Karakterek esetében például minden karakternek megfeleltetnek egy számot, a számítógép ezt a számot tárolja. A karakterek tárolásához sokféle kódrendszer alakítható ki. A két legelterjedtebb kódkészlet az ASCII és az UNICODE.
ASCII KÓDTÁBLA
American Standard Code for Information Interchange = ASCCII (kiejtve: eszki)
Szöveges adatokhoz használt, nemzetközileg egységes, szabványos 1 bájtos (8 bites) karekterkódolási séma. Eredetileg 7 bites volt és 128 karaktert (27) tartalmazott. Ez nem volt elegendő a nemzeti karakterek – pl.: a magyar ékezetes magánhangzók) ábrázolásához, ezért 8 bitesre bővítették, így ma 256 jelet tartalmaz. (0-255 között). A magyar ékezetes karaktereket a 852-es kódlap tartalmazza.
UNICODE KÓDTÁBLA
Nemzetközileg egységes 16 bites karakterkódolási szabvány. Valamennyi nép valamennyi jelét tartalmazza. (65536 lehetséges jel)