informatika.bilíčka.sk

Textová informácia

Pomocou počítača spracovávame rôzne typy informácií (obrazové, zvukové, textové). Textové informácie tvoria veľký podiel všetkej spracovávanej informácie. SMS správy, chat, email, webové stránky... sú všetko textová informácia.

Reprezentácia textovej informácie v počítači

Vieme, že počítač uchováva a spracúva informácie reprezentované v binárnej podobe (zapísané pomocou jednotiek a núl). Ak si teda chceme pri práci pomôcť počítačom, informácia, ktorú mu zadávame, musí byť takto zapísateľná. Ako však zapísať text (napríklad nákupný zoznam alebo email) len pomocou 0 a 1?

Prevod (preklad) informácie do číselnej podoby (takej, ktorej "rozumie" počítač) nazývame digitalizácia. Vo všeobecnosti pozostáva z dvoch fáz:

Ako tento postup použiť pri digitalizácii textu? Začnime vzorkovaním. Aké malé časti sa v texte vyskytujú a opakujú sa? (Alebo: z akých malých častí vieme vyskladať (hocijaký) text?) Z písmen! Pokračujme kvantovním - každému písmenu priradíme nejaké číslo, napríklad "a" bude 1, "b" bude 2... písmen poznáme určite menej ako čísel (tých je nekonečno), takže nebude problém každému písmenu priradiť unikátne číslo. Následne by sme vedeli digitalizovať hocijaký text (aj nezmyselný), napríklad text "ababa" by bol "1 2 1 2 1", čo sa dá zapísať v binárnej sústave ako "01 10 01 10 01".

Takýto postup sa naozaj používa aj v praxi. Existujú rôzne kódovania ("slovníky"), ktoré jednotlivým znakom prideľujú čísla. Pri spracovaní textovej informácie je veľmi dôležité vedieť aké kódovanie sa použilo pri kódovaní, inak by sme neboli schopní informáciu z číselnej podoby znova "preložiť" do pre nás čitateľnej podoby. Pozrime sa na príklady kódovania textu.

ASCII

ascii

https://cdn-images-1.medium.com/max/1600/1*DdgD00dAdXggzMdWDt7GSA.png

ANSI (Windows-1252) (o tomto sme na hodne asi nehovorili, ale prečítajte si...)

Unicode

Programy na prácu s textom

spracovanie textu v počítači nám uľahčujú rôzne programy, sú to najmä:

Schoolwork - homework