Zvuk

Okrem grafickej informácie pomocou počítačov bežne spracúvame aj zvuk, či už to "osamotený" ako jednoduchú skladbu (tak to máte napríklad na Spotify) alebo v spojení s vizuálnou informáciou ako video. V tejto kapitole sa pozrieme v teoretickom okienku na to, ako zvuk vôbec "dostať" do počítača, ako ho uchovať a následne skúsime aké sú možnosti na spracovanie a úpravu zvuku pomocou softvéru.

Hardvér - rýchlokurz

Na záznam zvuku používame hardvér - zariadenia známe ako mikrofóny, ktoré menia svoj elektrický odpor na základe aktuálnej zmeny tlaku vzduchu. Počítač vie tieto zmeny detegovať a odmerať ich aktuálnu hodnotu. Na reprodukciu zvuku (prehrávanie) používame zariadenia známe ako reproduktory, ktoré zas naopak (od mikrofónov) menia elektrickú energiu na akustickú tak, že elektrický prúd v nich spôsobuje pohyb membrány, ktorá vytvára tlakové vlny. Ale toto všetko už dávno poznáte z fyziky, nás zajíma, čo vie vlastne počítač zaznamenať, ako si zapamätá čo zaznamenal a ako to zaznamenané môžeme upraviť...

source: https://www.soundguys.com/wp-content/uploads/2020/03/Loudspeaker-Components.jpg

Digitalizácia zvuku

Tak, ako pri spracovaní grafickej informácie, aj spracovanie zvuku zvyčajne začína jeho digitalizáciou (zvuk v jeho analógovej forme zaznamenáme mikrofónom a následne ho transformujeme na digitálnu podobu, aby sme s ním mohli ďalej pracovať v počítači). Digitalizácia vo všeobecnosti znamená, že si danú informáciu (tentokrát zvuk) musíme nejak zapamätať (zapísať) len pomocou čísel (pretože v počítači v konečnom dôsledku uchovávame na disku len čísla v binárnej podobe - len nuly a jednotky). V prípade grafickej informácie digitalizáciu zabezpečoval fotoaparát alebo skener, mal svoje rozlíšenie, niečo ako "presnosť", ktorou vedel zaznamenať grafickú informáciu. Fotoaparát vytvoril snímok, ktorý pozostával z maličkých bodov - pixelov, o ktorých si počítač následne zapamätal už len čísla - ich farbu, a to pomocou jedného z farebných modelov, napríklad modelu RGB. Snímanú grafickú informáciu sme teda v procese digitalizácie najprv rozdelili (na pixely) a potom očíslovali vzniknuté malé časti (každému pixelu sme priradili číslo, na základe farby, ktorú má reprezentovať). Niečo podobné potrebujeme spraviť aj v prípade zvuku...

Najprv sa pozrime, ako vyzerá zvuk v analógovej podobe, teda ako ho vnímame napríklad uchom alebo mikrofónom. Zvuk je mechanické vlnenie, pre nás zvyčajne sa šíriace vzduchom, jeho priebeh teda môžeme zapísať aj takto - ako zmenu tlaku (vzduchu) v čase.

V rôznom čase má zvuk "dopadajúci" na mikrofón rôzny tlak, čo je vidieť aj v grafe vyššie. Jedná sa o takzvaný spojitý signál (v grafe je reprezentovaný jednou spojenou čiarou). Takéto čosi (spojitý signál) ale nevieme v počítači uchovať - môže totižto nadobúdať ľubovoľné hodnoty (aj ľubovoľne presné), čo je problém, keďže v počítači nemáme ľubovoľne veľkú pamäť. Napríklad: tlak v grafe v čase 0.524 môže byť 50.142346345... a desatinných miest môže byť toľko, že sa nám do počítača proste nezmestia, musíme teda pristúpiť k nejakému zaokrúhľovaniu a napriek tomu, že nameraná hodnota tlaku je veľmi presná (má napríklad sto desatinných miest), uchováme si ju zaokrúhlenú na 5 desatinných miest. Podobný problém nastáva "v opačnej osi grafu". Z priebehu spojitého signálu (v grafe), môžeme prečítať, akú mal tlak hodnotu v čase 0.1 aj v čase 0.2, ale aj v čase presne medzi nimi, teda v čase 0.15. Vieme tiež aká bola presná hodnota tlaku medzi časom 0.1 a 0.15, teda v čase 0.125, ... a tak ďalej. Problémom je, že ani toto si nevieme v konečnej pamäti počítača zapamätať donekonečna, niekde musíme prestať, pretože hodnôt medzi časom 0.1 a časom 0.2 by mohlo byť nekonečno, čo znova, nemáme v počítači kam zapísať.

Stratili ste sa? Nevadí, prečítajte si to ešte raz a pomalšie o pár hodín (: Pozrime sa teraz na to, ako počítač zaznamenáva signál v praxi. Robí to tak, že si v pravidelných intervaloch prečíta aktuálne meranú hodnotu tlaku. Frekvencia, v ktorej si počítač odmeria hodnoty zaznamenávané mikrofónom sa nazýva vzorkovacia frekvencia. Frekvencia sa udáva v HERZOCH (značka Hz) a hovorí, koľkokrát za sekundu si počítač odmeral aktuálnu hodnotu meranú mikrofónom. Na záznam zvuku sa bežne používajú vzorkovacie frekvencie medzi 8000 a 48000.

Počítač teda v pravidelných intervaloch (v obrázku nižšie je interval viditeľný ako pravidelný rozostup medzi červenými čiarami) meria hodnoty zaznamenané mikrofónom (červené kruhy) a o aktuálne zaznamenávanom zvuku si ukladá len túto informáciu, teda veľa zo snímaného zvuku počítač ignoruje. To ale nie je problém, nakoľko ani naše ľudské ucho nedokáže vnímať zvuk frekvenciou vyššou ako 20KHz (20000Hz), bežne sa teda zvuk vzorkuje dvojnásobnou frekvenciou ako je schopné vnímať ucho (44100Hz).

Každému "krúžku" v grafe prislúcha presná nameraná hodnota. Toto môžete vidieť aj na obrázku nižšie. Počítač si o zaznamenanom zvuku zapamätá aká bola nameraná hodnota v akom presnom čase a hodnôt bude presne (vzorkovacia_frekvencia krát dĺžka_záznamu_v_sekundách).

Posledným "problémom" je, aký presný rozsah hodnôt povolíme pre zápis jednej vzorky. Teda, aké veľké (alebo inak, aké presné) číslo si môže počítač zapamätať o jednom meraní zvuku v jednom čase. V obrázku vyššie je zrejme o každej vzorke (štvorčeku) zapamätaných 8 bitov informácie. Túto hodnotu nazývame rozlíšenie vzorky. Čím vyššie rozlíšenie vzorky, tým viac bitov je vyhradených na jej zapamätanie a tým presnejšie je meranie. Rozlíšenie vzorky vo zvuku je čosi ako bitová hĺbka grafickej informácie (pri obrázkoch je bitová hĺbka číslo, ktoré určuje, koľko bitov použijeme na zakódovanie farby jedného pixelu, čím vyššia je bitová hĺbka, tým viac farieb vieme zakódovať) - podobne to platí o zvuku, čím vyššie rozlíšenie vzorky, tým viac rôznych zvukov vieme zakódovať. Bežné rozlíšenia zvukovej vzorky sú 8 a 16 bitov.

Formáty, kompresia

coming soon

Formát MIDI

coming soon

Ďalšie informácie

detailné a košaté nájdete napríklad v diplomovej práci matfyzáka Pavla Adama
na tejto stránke je to v podobnom rozsahu ako tu na inf.bilicka.sk, len inými slovami

Praktická časť - úloha

Zvuk môžeme v počítači upravovať, vhodným programom na rôzne úkony je open-source a free program Audacity, funguje na Windows-e, Mac-och aj Linux-och. V škole ho máme nainštalovaný, doma si ho môžeš stiahnuť.

Vašou úlohou je vyskúšať si prácu v Audacity:

stiahni si zvuk1 a zvuk2
otvor si na počítači program Audacity
importuj do programu Audacity stiahnuté zvuky
Môžeš si stiahnuť aj viac zvukových nahrávok, napríklad na stránke Pixabay

Pracuj so stiahnutým súborom "Dlouhy_siroky_a_bystrozraky.mp3".

nahraď úvodnú melódiu inou
do nahrávky pridaj aspoň tri efekty
pridaj do nahrávky ďalšiu hudobnú ukážku na vhodné miesto
uprav dĺžku nahrávky, aby nepresahovala 4 minúty
výslednú zvukovú stopu exportuj vo formáte mp3, stereo, vzorkovacia frekvencia 44100Hz v štandardnej kvalite 170-210kbps
výsledný zvuk odovzdaj do pridelenej úlohy v Edupage