Emërtoni pajisjet për transmetimin e informacionit të zërit. Si është koduar audio

TingullËshtë një valë zanore që ndryshon vazhdimisht në amplitudë dhe frekuencë. Në këtë rast, amplituda përcakton fortësinë e zërit, dhe frekuenca përcakton tonin e tij. Sa më e madhe të jetë amplituda e dridhjeve të zërit, aq më e fortë është. Dhe frekuenca e kërcitjes së mushkonjave është më e madhe se frekuenca e sinjalit të makinës. Frekuenca matet në Herc. 1Hz është një cikël për sekondë.

Kodimi i zërit.

Një kompjuter është një pajisje e fuqishme për përpunimin e llojeve të ndryshme të informacionit, duke përfshirë zërin. Por audio analoge nuk është e përshtatshme për përpunim në kompjuter, duhet të jetë konvertohet në dixhital. Për këtë, përdoren pajisje speciale - konvertuesit analog në dixhital ose ADC. Në një kompjuter, roli i ADC kryhet nga kartë zëri. Si e shndërron një ADC një sinjal nga analog në dixhital? Le ta kuptojmë.

Supozoni se kemi një burim tingulli me një frekuencë 440 Hz le të jetë një kitarë. Së pari, tingulli duhet të shndërrohet në një sinjal elektrik. Ne përdorim një mikrofon për këtë. Në daljen e mikrofonit, do të marrim një sinjal elektrik me një frekuencë 440 Hz. Grafikisht, duket kështu:

Detyra tjetër është shndërrimi i këtij sinjali në një formë dixhitale, domethënë në një sekuencë numrash. Për këtë përdoret diskretimi i kohës- sinjali analog audio ndahet në seksione të veçanta kohore të vogla dhe për secilin seksion të tillë vendoset një vlerë e caktuar e intensitetit të zërit, e cila varet nga amplituda. Me fjalë të tjera, pas disa intervaleve kohore, ne matim nivelin e sinjalit analog. Numri i matjeve të tilla për sekondë quhet shpejtësia e kampionimit. Shkalla e marrjes së mostrave matet në Hertz. Prandaj, nëse matim sinjalin tonë 100 herë në sekondë, atëherë frekuenca e kampionimit do të jetë 100 Hz.

Këtu janë shembuj të disa prej normave të mostrës audio të përdorura:

8000 Hz - telefon, mjaftueshëm për të folur;
11,025 Hz;
16,000 Hz;
22 050 Hz - radio;
32,000 Hz;
44 100 Hz - përdoret në CD Audio;
48,000 Hz - DVD, DAT;
96,000 Hz - DVD-Audio (MLP 5.1);
192,000 Hz - DVD-Audio (MLP 2.0);
2,822,400 Hz - SACD, një proces modulimi me një bit delta-sigma i njohur si DSD - Direct Stream Digital, i zhvilluar bashkërisht nga Sony dhe Philips;
5,644,800 Hz - Shpejtësia e dyfishtë e mostrës DSD, një bit Direct Stream Digital me dyfishin e shpejtësisë së mostrës së SACD. Përdoret në disa regjistrues profesional DSD.

Kartat moderne të zërit janë të afta të dixhitalizojnë tingullin me një shpejtësi kampionimi prej 96 kHz dhe madje 192 kHz.

Si rezultat, sinjali ynë analog do të kthehet në dixhital dhe grafiku nuk do të jetë më i qetë, por i shkallëzuar, diskret:

Thellësia e kodimit të audiosështë numri i niveleve të mundshme të sinjalit. Me fjalë të tjera, thellësia e kodimit është saktësia e matjes së sinjalit. Thellësia e kodimit matet në bit. Për shembull, nëse numri i niveleve të mundshme të sinjalit është 255 , pastaj thellësia e kodimit të një tingulli të tillë 8 bit. 16 bit tingulli tashmë ju lejon të punoni me të 65536 nivelet e sinjalit. Kartat moderne të zërit ofrojnë thellësia e kodimit 16 dhe madje 24 bit, dhe kjo është mundësia e kodimit 65536 dhe 16 777 216 nivele të ndryshme vëllimi përkatësisht.

Duke ditur thellësia e kodimit, mund është e lehtë të dihet numri i niveleve të sinjalit audio dixhital. Për këtë përdorim formulën:

N=2 i ,

ku N është numri i niveleve të sinjalit dhe i është thellësia e kodimit.

Për shembull, ne e dimë se thellësia e kodimit audio është 16 bit. Kjo do të thotë se numri i niveleve të sinjalit dixhital është 2 16 = 65536.

Për të përcaktuar thellësinë e kodimit nëse dihet numri i niveleve të mundshme, përdoret e njëjta formulë. Për shembull, nëse dihet se sinjali ka 256 nivele sinjali, atëherë thellësia e kodimit do të jetë 8 bit, pasi 2 8 = 256.

Siç është e qartë nga figura e mësipërme, aq më shpesh matim nivelin e sinjalit, d.m.th. sa më i lartë të jetë shkalla e marrjes së mostrave dhe aq më saktë do ta matim atë, aq më shumë grafiku i sinjalit dixhital do të jetë i ngjashëm me grafikun analog, përkatësisht, aq më i lartë është cilësia e zërit dixhital. Dhe aq më i madh do të jetë skedari.

Përveç kësaj, ne kemi konsideruar tingull monofonik (një kanal). nëse tingulli stereofonike, atëherë madhësia e skedarit rritet me 2 herë, pasi përmban 2 kanale.

Konsideroni një detyrë shembull.

Sa është vëllimi i një skedari audio monofonik që përmban audio, nëse kohëzgjatja e audios është 1 minutë, thellësia e kodimit është 8 bit dhe shkalla e kampionimit është 22050 Hz?

Duke ditur frekuencën e marrjes së mostrave dhe kohëzgjatjen e zërit, është e lehtë të vendosni numrin e matjeve të nivelit të sinjalit gjatë gjithë kohës. Nëse shpejtësia e marrjes së mostrave është 22050 Hz, atëherë 22050 matje bëhen në 1 sekondë dhe do të ketë 22050 * 60 = 1 323 000 matje të tilla në minutë.

Një matje kërkon 8 bit memorie, kështu që 1,323,000 matje do të kërkojnë 1,323,000*8 = 10,584,000 bit memorie. Duke pjesëtuar numrin që rezulton me 8, marrim madhësinë e skedarit në bajt - 10584000/8=1 323 000 bajte. Më tej, duke e ndarë numrin që rezulton me 1024, marrim madhësinë e skedarit në kilobajt - 1,291.9921875 KB. Dhe duke e ndarë përsëri numrin që rezulton me 1024 dhe duke rrumbullakosur në të qindtat, marrim madhësinë e skedarit në megabajt - 1 291.9921875/1024=1.26 MB.

Përgjigje: 1.26 MB.

Tingulli është një valë që përhapet në çdo mjedis (ajër) dhe ka karakteristika të vazhdueshme të frekuencës dhe intensitetit. Vala, duke arritur në organet e dëgjimit, shkakton dridhje, të cilat më pas shndërrohen nga truri në një sinjal zanor. Kodimi i informacionit të shëndoshë zbatohet në të njëjtin parim.

Dy forma prezantimi

Në botë, të gjitha informacionet e shëndosha paraqiten në dy forma:

Analog - një linjë e vazhdueshme e lëmuar me amplitudë dhe frekuencë të ndryshme lëkundjeje.
Diskret - një segment i thyer që ka "hapa" me lartësi të ndryshme.

Forma analoge e regjistrimit përdoret në pajisjet e vjetra - magnetofon, kasetofon, gramafonë. Këtu, valët regjistrohen në bartës në formën e një piste, dhe gjilpëra ose pajisja e transformimit të zërit, "e bezdisur" nga këto gjurmë, riprodhon tingullin.

Tani pothuajse të gjitha pajisjet përdorin sistemin binar të numrave për të riprodhuar sinjale zanore. CD-të, kartat flash, disqet e ngurtë - të gjitha ato ruajnë informacionin në kod binar. Parimi i leximit dhe shkrimit është ndryshuar rrënjësisht.

Kampionimi i audios

Në mënyrë që pajisjet elektronike të riprodhojnë tingullin, është e nevojshme ta regjistroni atë në një formë të kuptueshme për një makinë, ta shndërroni atë në një sekuencë të caktuar simbolesh 1 dhe 0. Ky proces konvertimi quhet kampionim. Vetë parimi i kodimit është si më poshtë:

Një vijë e lëmuar ndahet në segmente të shumta të vogla kohore në mënyrë të tillë që një vijë e caktuar e drejtë e vogël e pakrahasueshme fillon të korrespondojë me çdo seksion.
Secilit segment i është caktuar një vlerë e caktuar amplitude, e cila mund të përfaqësohet si një trekëndësh kënddrejtë: këmbët përcaktojnë dridhjet e zërit për makinën, dhe hipotenuza përfaqëson formën analoge të regjistrimit.
Secilit trekëndësh të tillë i caktohet një numër specifik, i cili korrespondon me nivelin e volumit.

Në praktikë, një informacion i tillë paraqitet në formën e një histogrami: lartësia e secilës shirit korrespondon me amplituda e valës, dhe frekuenca e marrjes së mostrave, domethënë madhësia e intervaleve kohore, përfaqësohet nga gjerësia.

Prandaj, sa më të ngushta të jenë shiritat, aq më shumë prej tyre do të nevojiten për të regjistruar informacionin, aq më e lartë do të jetë cilësia e sinjalit të riprodhuar, por skedari gjithashtu do të peshojë më shumë. Cilësia muzikë bashkëkohore, zëri varet nga shpejtësia e biteve - numri i biteve që ndahen për të koduar një sekondë zëri. Kështu, sa më e lartë të jetë vlera e shpejtësisë së biteve, aq më e mirë është cilësia e zërit.

Kodimi i informacionit audio shkurtimisht.

1. Informacion i përgjithshëm

Kompleksiteti: bazë.

Koha e përafërt e vendimit (për ata që do të bëjnë pjesën 2): 2 minuta

Tema: Krijimi dhe përpunimi i informacionit grafik dhe multimedial

Nëntema: Audio dixhitale

Çfarë kontrollohet: Aftësia për të vlerësuar karakteristikat sasiore të procesit të regjistrimit të zërit.

Informacion i shkurtër teorik: Meqenëse ky lloj caktimi është i ri në KIM USE, ne do të japim (deri më tani pa arsyetim, arsyetimi më poshtë) modeli matematik procesi i regjistrimit:

N=kFL T* (1)

N– madhësia e skedarit (në bit) që përmban regjistrimin e zërit;
k- numri i kanaleve të regjistrimit (për shembull, 1 - mono, 2 - stereo, 4 - katër, etj.);
F– frekuenca e kampionimit (në herc), d.m.th. numri i vlerave të amplitudës së zërit të regjistruar në një sekondë;
L– leje, d.m.th. numrin e biteve të përdorura për të ruajtur çdo vlerë të matur;
T– kohëzgjatja e fragmentit të zërit (në sekonda).

Si mund të duket një detyrë? Për shembull, si kjo: Janë vendosur vlerat e të gjithë parametrave të kërkuar të procesit të regjistrimit të zërit, përveç njërit. Kërkohet të vlerësohet vlera e parametrit të mbetur, për shembull, madhësia e skedarit ose kohëzgjatja e fragmentit të zërit.

Shembull i gjendjes:

Opsionet e përgjigjes:

1) 0,2 MB

2. Shembull i detyrës

2.1. Detyrë.

Detyra 2012-A8-1.

Audioja me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 16 kHz dhe rezolucion 24-bit. Regjistrimi zgjat 1 minutë, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

1) 0,2 MB 2) 2 MB 3) 3 MB 4) 4 MB

2.2. Zgjidhje.

Ne i sjellim të dhënat fillestare në dimensionin bit-sekonda-herz dhe kryejmë llogaritjet sipas formulës (1):

E dhënë:

k= 1, sepse regjistrim zëri me një kanal (mono);

F= 16 kHz = 16,000 Hz;

T= 1 min = 60 s.

GjejN

Zëvendësoni vlerën e parametrave të njohur në formulën (1)

N=1*16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 *5625 (bit)=

= 2 12 *5625 bit = (2 12 *5625)/2 3 bajte = 2 9 *5625 bajte =

= (2 9 *5625)/ 2 20 MB = 5625/2 11 MB = 5625/2048 MB.

Numri 5625/2048 është midis numrave 2 dhe 3. Për më tepër, është më afër 3 sesa 2, sepse 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

Përgjigja e saktë: №3 (3 MB)

Koment. Një ide tjetër zgjidhjeje është dhënë në paragrafin 3.3

3. Këshilla për mësuesit dhe nxënësit

3.1 Cilat njohuri/aftësi/aftësi i nevojiten studentit për të zgjidhur këtë problem?

1) Formula (1) nuk duhet të "memorizohet". Studenti që përfaqëson thelbin e procesit audio dixhital duhet të jetë në gjendje ta formulojë atë në mënyrë të pavarur.

2) Është e nevojshme të jeni në gjendje të shkruani vlerat e parametrave në dimensionin e kërkuar, si dhe aftësitë elementare aritmetike, përfshirë. duke vepruar me fuqi dyshe.

A. Studentë të fortë.

1. Me shumë mundësi, ata do ta zgjidhin këtë problem gjithsesi.

2. Mund t'u jepni detyrë nxënësve të kontrollojnë formulën (1) në praktikë, duke regjistruar zërin nga mikrofoni në një skedar. Duhet të theksohet se është i vlefshëm vetëm nëse informacioni i regjistruar nuk është i ngjeshur (format WAV (PCM) pa komprimim). Nëse përdoren formatet audio me kompresim (WMA, MP3), atëherë vëllimi i skedarit që rezulton, për arsye të dukshme, do të jetë dukshëm më i vogël se ai i llogaritur. Për të eksperimentuar me audio dixhitale, mund të përdorni redaktuesin audio falas Audacity (http://audacity.sourceforge.net/).

3. Këshillohet të theksohet përbashkësia konceptuale e paraqitjes rasterike të tingullit dhe imazhit, të cilat janë varietete të të njëjtit proces të paraqitjes së përafërt të një sinjali të vazhdueshëm - një sekuencë sinjalesh të shkurtra diskrete, d.m.th. dixhitalizimi i bazuar në kampionim. Në rastin e një imazhi raster, kryhet diskretimi dydimensional i shkëlqimit në hapësirë, në rastin e zërit, diskretizim njëdimensional në kohë. Në të dyja rastet, rritja e shkallës së kampionimit (numri i pikselëve ose mostrave audio) dhe/ose rritja e numrit të biteve për të përfaqësuar një kampion (thellësia e bitit të ngjyrës ose audios) çon në një rritje të cilësisë së dixhitalizimit, ndërkohë që rrit madhësinë e skedarit me përfaqësim dixhital. Prandaj nevoja për kompresim të të dhënave.

4. Këshillohet të përmenden mënyra alternative të dixhitalizimit të zërit – regjistrimi i “pjesëve” të instrumenteve në formatin MIDI. Këtu është e përshtatshme për të nxjerrë një analogji me paraqitjen raster dhe vektor të imazheve.

B. Studentë jo aq të fortë.

1. Është e nevojshme të sigurohet asimilimi i relacionit (1). Rekomandohet të jepni detyra si "Si do të ndryshojë madhësia e skedarit nëse koha e regjistrimit të zërit rritet/zvogëlohet në fq dikur? ",

"Sa herë mund të rrisni / ulni kohëzgjatjen e regjistrimit nëse madhësia maksimale e skedarit rritet / zvogëlohet në fq dikur? ”, “Si do të ndryshojë madhësia e skedarit nëse rritet / zvogëlohet numri i biteve për të shkruar një vlerë fq një herë?" etj.

2. Është e nevojshme të sigurohet që studentët të operojnë lirshëm me dimensione, ata e dinë se ka 23 bit në MB 2, etj.

3. Është e nevojshme të sigurohet që nxënësit të kenë njohuri të mjaftueshme aritmetike, të flasin rrjedhshëm numërimin gojor me fuqitë dy (shumëzimi, pjesëtimi, përzgjedhja e faktorëve që përfaqësojnë 2 n).

4. Dilni me qasjet tuaja dhe provoni ato.

3.3. Truk i dobishëm.

Në probleme të tilla, shpesh lindin fuqitë e dy. Shumëzimi dhe pjesëtimi i fuqive është më i lehtë se sa numrat arbitrarë: shumëzimi dhe pjesëtimi i fuqive reduktohet në mbledhjen dhe zbritjen e eksponentëve.

Vini re se numrat 1000 dhe 1024 ndryshojnë me më pak se 3%, numrat 60 dhe 64 ndryshojnë me më pak se 7%. Prandaj, ju mund ta bëni këtë. Kryeni llogaritjet duke zëvendësuar 1000 me 1024 = 2 10 dhe 60 me 64 = 2 6, duke përfituar nga operacionet e fuqisë. Përgjigja më e afërt me numrin e marrë do të jetë ajo e dëshiruar. Më pas mund ta kontrolloni veten duke bërë llogaritjet e sakta. Por mund të merret parasysh se gabimi total i llogaritjes në përafrimin tonë nuk kalon 10%. Në të vërtetë, 60*1000 = 60000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

Kështu, rezultati i saktë i shumëzimeve sipas formulës (1) është pak më shumë se 90% e rezultatit të përafërt të marrë. Nëse marrja parasysh e gabimit nuk e ndryshon rezultatin, nuk ka dyshim në përgjigje.

Shembull. (ege.yandex.ru, opsioni 1).

Audioja me dy kanale (stereo) regjistrohet në një frekuencë kampionimi prej 16 kHz dhe rezolucion 32-bit. Regjistrimi zgjat 12 minuta, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

1) 30 MB 2) 60 MB 3) 75 MB 4) 90 MB

Zgjidhje. Madhësia e rekordit në bit është

2*16*1000*32*12*60

Duke marrë parasysh zëvendësimin e 1000 me 1024=2 10 dhe 60 me 64=2 6 marrim:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

Siç e dini, 1 MB = 2 20 byte = 2 23 bit. Pra 3*2 28 bit = 3*32 = 96 MB. Duke e ulur këtë numër me 10%, marrim 86.4 MB. Në të dyja rastet, vlera më e afërt është 90 MB.

Përgjigje e saktë: 4

1. Lexoni gjendjen e problemit. Shprehni parametrin e panjohur në terma të të njohurve. Kushtojini vëmendje të veçantë dimensionit të parametrave të njohur. Duhet të jetë - bit-sekonda-herc (kujtoni se 1 Hz = s -1). Nëse është e nevojshme, sillni vlerat e parametrave në dimensionin e dëshiruar, ashtu siç bëhet në problemet e fizikës.

2. Kryeni llogaritjet, duke u përpjekur të zgjidhni fuqitë e dy.

3. Ju lutemi vini re se në kusht kërkohet të zgjidhni përgjigjen më të përshtatshme, prandaj nuk kërkohet saktësi e lartë e llogaritjeve në numra dhjetorë. Sapo u bë e qartë se cila nga opsionet e përgjigjes është më afër vlerës së llogaritur, llogaritjet duhet të ndërpriten. Nëse mospërputhja me të gjitha opsionet e përgjigjeve është shumë e madhe (nga disa herë ose me një renditje të madhësisë), atëherë llogaritjet duhet të rishikohen.

4. Detyrat për zgjidhje të pavarur

4.1. Klonet e detyrës 2012-A8-1.

Më poshtë janë katër opsione të tjera për detyrën 2012-A8-1.

A) Tingulli me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 32 kHz dhe rezolucion 24-bit. Regjistrimi zgjat 15 sekonda, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

B) Tingulli me dy kanale (stereo) regjistrohet me një frekuencë kampionimi prej 32 kHz dhe rezolucion 24-bit. Regjistrimi zgjat 30 sekonda, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

1) 1,5 MB 2) 3 MB 3) 6 MB 4) 12 MB

C) Audioja me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 16 kHz dhe rezolucion 32-bit. Regjistrimi zgjat 2 minuta, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

D) Tingulli me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 16 kHz dhe rezolucion 32-bit. Regjistrimi zgjat 4 minuta, rezultatet e tij shkruhen në një skedar, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër madhësisë së skedarit që rezulton?

1) 2 MB 2) 4 MB 3) 8 MB 4) 16 MB

Përgjigjet e sakta:

Përgjigje: 1; B:3; NE 3; D: 4.

4.2. Problemi 2012-A8-2 (e kundërt nga ai i mëparshmi).

A) Audioja me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 16 kHz dhe rezolucion 24-bit. Rezultatet shkruhen në një skedar, madhësia e të cilit nuk mund të kalojë 8 MB, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër gjatësisë maksimale të mundshme të një klipi audio të regjistruar?

B) Tingulli me dy kanale (stereo) regjistrohet me një frekuencë kampionimi prej 16 kHz dhe rezolucion 24-bit. Rezultatet shkruhen në një skedar, madhësia e të cilit nuk mund të kalojë 8 MB, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër gjatësisë maksimale të mundshme të një klipi audio të regjistruar?

1) 1 minutë 2) 30 sekonda 3) 3 minuta 4) 90 sekonda

C) Tingulli me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 48 kHz dhe rezolucion 8-bit. Rezultatet shkruhen në një skedar, madhësia e të cilit nuk mund të kalojë 2.5 MB, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër gjatësisë maksimale të mundshme të një klipi audio të regjistruar?

1) 1 minutë 2) 30 sekonda 3) 3 minuta 4) 90 sekonda

D) Tingulli me një kanal (mono) regjistrohet në një frekuencë kampionimi prej 48 kHz dhe rezolucion 16-bit. Rezultatet shkruhen në një skedar, madhësia e të cilit nuk mund të kalojë 5 MB, kompresimi i të dhënave nuk kryhet. Cila nga vlerat e mëposhtme është më afër gjatësisë maksimale të mundshme të një klipi audio të regjistruar?

1) 1 minutë 2) 30 sekonda 3) 3 minuta 4) 90 sekonda

Përgjigjet e sakta:

A:3; B: 4; NË 1; G: 1.

5.Shtesë. Disa informacione rreth regjistrimit audio dixhital.

Përhapja e zërit në ajër mund të konsiderohet si përhapja e luhatjeve të presionit. Mikrofoni konverton luhatjet e presionit në dridhje rryme elektrike. Ky është një sinjal i vazhdueshëm analog. Karta e zërit siguron marrjen e mostrave të sinjalit të hyrjes nga mikrofoni. Kjo bëhet si më poshtë - një sinjal i vazhdueshëm zëvendësohet nga një sekuencë vlerash të matura me një saktësi të caktuar.

Grafiku i sinjalit analog:

Paraqitja diskrete e të njëjtit sinjal (41 vlera të matura):

Paraqitja diskrete e të njëjtit sinjal (161 vlera të matura, shpejtësi më e lartë e kampionimit):

Mund të shihet se sa më e lartë të jetë frekuenca e marrjes së mostrave, aq më e lartë është cilësia e sinjalit të përafërt (diskret). Përveç shkallës së kampionimit, cilësia e sinjalit të dixhitalizuar ndikohet nga numri i biteve të alokuara për të regjistruar çdo vlerë sinjali. Sa më shumë bit të ndahen për secilën vlerë, aq më saktë sinjali mund të dixhitalizohet.

Një shembull i një paraqitjeje 2-bitësh të të njëjtit sinjal (dy bit mund të numërojnë vetëm 4 nivele të mundshme sinjali):

Tani mund të shkruani varësinë për madhësinë e skedarit me zë të dixhitalizuar

madhësia_skedarit = (numri_i_vlerave_të kapura_për_1_sekondë)*

*(numri_i_shifrave_binare_te_record_single_value)*

*(numri_e_rekordeve_sekonda).

Duke marrë parasysh mundësinë e regjistrimit të njëkohshëm të zërit nga disa mikrofona (stereo, regjistrim me katër, etj.), i cili bëhet për të rritur realizmin gjatë riprodhimit, marrim formulën (1).

Kur luani audio, vlerat dixhitale konvertohen në vlera analoge. Dridhjet elektrike të transmetuara tek altoparlantët shndërrohen prej tyre sërish në luhatje të presionit të ajrit.

Çfarë është diskretizimi, çdo profesionist në fushën e fotografisë dixhitale e di sot. Megjithatë, shumë njerëz që sapo kanë filluar të njihen me këtë zonë nuk i dinë veçoritë kryesore të saj, si rezultat i të cilave mund të bëjnë gabime të caktuara.

Çfarë është kjo?

Çfarë është Diskretizimi? Ky është një efekt i padëshirueshëm që bën që cilësia e fotografisë të përkeqësohet ndjeshëm. Ky fenomen mund të shoqërohet me çdo pajisje ose proces në të cilin informacioni ndahet në disa mostra të veçanta. Në këtë rast, diskretimi mund të konsiderohet si një lloj nëse ekziston një marrëdhënie e caktuar midis shpeshtësisë së një dukurie të caktuar dhe një strukture të caktuar periodike në të dhëna.

Syri i njeriut vazhdimisht përpiqet të perceptojë një raport të caktuar si një model ndërhyrjeje që mund të errësojë kuptimin e vërtetë të këtij apo atij imazhi. Duke marrë parasysh shembuj se çfarë është diskretimi, ia vlen të theksohet moire, e cila nuk është një efekt plotësisht i saktë i tij, por në të njëjtën kohë mund të tregojë se si një person mashtrohet kur dy modele fillojnë të ndërveprojnë me njëri-tjetrin, duke formuar një të tretën.

Çfarë është moire?

Moire është një model valëzues i pakuptueshëm që fillimisht nuk ishte i pranishëm në këtë temë. Ky efekt më së shpeshti shfaqet në imazhe të ndryshme që merren duke përdorur pajisje dixhitale. Dhe problemi këtu është se modeli i objektit mbivendoset në modelin e vendosjes së pikselit në matricë, si rezultat i të cilit shfaqet një i tretë, i cili quhet moiré.

Në shumicën dërrmuese të rasteve, ky efekt ndodh në imazhe të detajuara, me kontrast të lartë që nuk përputhen me rezolucionin vendas të sensorëve. Në veçanti, shpesh mund të gjendet në rast se hiqen objekte të tilla si flokët ose pëlhura, si dhe skena që përmbajnë një numër të madh detajesh të përsëritura. Shpesh, moire nuk gjendet në natyrë, pasi ndodh në imazhet që merren duke përdorur një aparat fotografik dixhital ose më pas skanohen gabimisht.

Shumë shpesh, në kamerat moderne dixhitale, për të zvogëluar këtë efekt, përdoret një filtër optik i specializuar me kalim të ulët, kështu që nëse do të jeni vërtet një fotograf profesionist, atëherë në këtë rast duhet të mendoni patjetër për një model me këtë funksion që mund të sigurojë cilësinë e duhur jashtë.varësisht nga kushtet dytësore.

Diskretizimi në kamerat moderne

Në pajisjet moderne dixhitale, efekti i kampionimit shkaktohet nga fakti se informacioni ndahet në disa mostra në një interval të rregullt. Në veçanti, një nga modelet në këtë rast do të jetë rregullimi i pikselëve në matricë, modeli i dytë do të jetë çdo element në imazh që mund të përsëritet në një zonë të madhe ose që ndryshon pas një numri të caktuar pikselësh në tërthor. ose drejtimin gjatësor.

Për ata që nuk e kuptojnë se çfarë është diskretimi dhe kur ndodh, mund të jepet një shembull specifik. Kur nuk ka pikselë të mjaftueshëm në dispozicion për të përcjellë informacion të besueshëm nga imazhi, atëherë në këtë rast ai nuk është bërë në cilësinë më të mirë. Në versionin standard, do të mjaftonte thjesht të zgjidhnim një rezolucion më të lartë, duke siguruar kështu që të sigurohet numri i kërkuar i pikselëve për të përcjellë detajet në imazh me një saktësi të caktuar, dhe nëse numri i pikselëve do të ishte i pamjaftueshëm, atëherë thjesht mund të shikoni një numër të vogël elementësh të imazhit.

Megjithatë, në realitet kjo nuk është plotësisht e vërtetë. Teoria e kampionimit thotë se në realitet situata është shumë më negative dhe nëse nuk kemi pikselë të mjaftueshëm për të bërë një fotografi të caktuar, atëherë cilësia e figurës do të përkeqësohet vazhdimisht.

Sa piksele ju duhen?

Le të marrim si shembull një situatë ku ka vetëm 20 vija bardh e zi në foto, secila prej të cilave është 5 piksel e gjerë. Në këtë rast, nëse ofrohet të paktën një piksel në secilën rresht, mund të regjistrohet një fotografi. Natyrisht, nëse pikselët nuk bien qartë në qendër të secilës rresht, atëherë në këtë rast çdo piksel do të rezultojë të jetë gri, jo i bardhë ose i zi, dhe hija e tij do të varet drejtpërdrejt nga mënyra se si ndodhet piksel në lidhje me linjat .

Nëse numri i pikselëve në imazh zvogëlohet, atëherë në këtë rast disa prej tyre do të fillojnë të shfaqen midis rreshtave, si rezultat i së cilës modeli i mësipërm do të shfaqet në imazh, i cili do të ndryshojë vazhdimisht në varësi të raportit të intervalit. ndërmjet vijave dhe numrit të pikselëve. Sigurisht, një imazh i tillë nuk do të jetë më një riprodhim i saktë i origjinalit, pasi struktura e rregullt e linjave tashmë do të prishet dukshëm. Është ky fenomen që zakonisht quhet “diskretizim i të dhënave” në qarqet profesionale.

Çfarë duhet bërë?

Për të zgjidhur këtë problem, duhet ta zbusni pak imazhin përpara se të zvogëloni numrin e pikselëve. Kështu, ju mund të shpëtoni plotësisht nga skajet e mprehta në secilën rresht, dhe pikselët mund të marrin vlera të ndërmjetme. Me fjalë të tjera, fotografia bëhet më e butë, por përshtypja e përgjithshme e figurës ruhet.

Si ndikon kjo në imazh?

Natyrisht, strukturat e përsëritura dhe të rregullta të linjës janë mjaft të rralla në imazhet e objekteve të ndryshme natyrore - prania e tyre shpesh kufizohet në imazhe të strukturave të ndryshme artificiale, si ndërtesa, etj. Sidoqoftë, në çdo rast, thellësia e marrjes së mostrave mund të jetë mbresëlënëse, kështu që ky efekt duhet të shmanget gjithmonë kur shkrepni ndonjë objekt.

Në të njëjtën kohë, vlen të përmendet fakti se cilësia e imazheve mund të jetë krejtësisht e ndryshme edhe nëse ato kanë të njëjtin numër pikselësh. Në fund të fundit, ndër të tjera, ndryshimi midis imazheve mund të qëndrojë edhe në mënyrën se si ato janë marrë. Për shembull, në një rast një imazh mund të zbutet pak duke e kaluar atë përmes një filtri me kalim të ulët për të marrë vlerat e ndërmjetme të pikselit përpara se të zvogëlohet në madhësi, ndërsa në një imazh tjetër thjesht mund të zvogëlohet në madhësi pa bërë ndonjë ndryshim shtesë. për të. dhe duke mos marrë vlera të ndërmjetme në kufijtë e objekteve, ku ka ndryshime shumë të mprehta në shkëlqim.

Si të kontrolloni?

Për të kuptuar se si funksionon, thjesht bëni një fotografi dhe më pas bëni një kopje të saj. Filtro origjinalin kur ndryshoni madhësinë duke përdorur të ashtuquajturin opsion filtrimi bikubik, i cili është i disponueshëm në standardin Adobe Photoshop. Kështu, fotografia do të zbutet. Pavarësisht reduktimit të dukshëm të pikselëve, kalimet midis tonaliteteve janë përfundimisht të qetë dhe të përshtatshme për sasinë e pikselëve në dispozicion.

Pas kësaj, ne zvogëlojmë kopjen e imazhit që kemi bërë më parë, të themi, në 30% të madhësisë origjinale, duke përdorur opsionin "pika e fqinjit më të afërt" në të njëjtin program. Është ky operacion që në fund do t'ju japë efektin e kampionimit që do të jetë aty.

Kampionimi i audios

Mostra e audios po filtrohet përpara se të ruhet në një skedar audio. Me fjalë të tjera, skedari përfundimtar nuk do të ketë një kopje të saktë valë zanore, por vetëm e përafërt. Nga njëra anë, marrja e mostrave audio siguron një ulje të caktuar të volumit të skedarit të ruajtur, por nga ana tjetër, ka shumë dridhje të zërit që nuk duhet të ruhen në hard disk.

Ky filtrim i zërit quhet "shkalla e kampionimit". Në të njëjtën kohë, vlen të përmendet se në fakt vetëm në natyrë ka tingull pa këtë efekt, megjithëse pak njerëz dinë për të. Marrja e mostrave është vendosja e një rrjeti të caktuar në valën e zërit, si dhe regjistrimi i vetëm disa elementeve kryesore.

Regjistrimi i të gjithë valës së zërit do të ishte mjaft i vështirë. Është për këtë arsye që shpesh mund të takojmë një situatë të tillë kur është bërë një regjistrim tingulli me dy kanale me një frekuencë kampionimi prej 44.1 kHz. Kjo e fundit zgjidhet më shpesh, pasi ky është parametri më optimal.

Në parim, kur merrni parasysh përpunimin e zërit, duhet t'i kushtoni vëmendje të veçantë parametrave të tillë si thellësia e kodimit dhe shkalla e marrjes së mostrave, sepse sa më të lartë të jenë këta tregues, aq më shumë do të korrespondojë me analogun.

Nuk ka standarde për kodimin e informacionit audio në kodin binar. Ekzistojnë standarde të veçanta të korporatës. Mënyrat e punës me zë dhe video quhen multimediale teknologjive.

Ekzistojnë dy mënyra kryesore për kodimin e audios.

Metoda FM (Frekuenca Modulimi) është metoda e modulimit të frekuencës. Ai përdor zbërthimin e një tingulli kompleks në një sekuencë sinjalesh të thjeshta harmonike të frekuencave të ndryshme. Një sinjal harmonik është një sinusoid i rregullt, i cili mund të përshkruhet nga një grup parametrash numerikë - amplituda, faza dhe frekuenca.

Konvertimi i audios në formë dixhitale ose dixhitalizimi tingulli është si më poshtë. Në natyrë, sinjalet audio janë analoge, domethënë të vazhdueshme. Në një kompjuter, një sinjal i vazhdueshëm zanor zëvendësohet nga një diskret, dhe vlera e parametrave që përcaktojnë karakteristikat e zërit përcaktohen vetëm në pika të caktuara fikse në kohë. Numri i mostrave të sinjalit për njësi të kohës quhet norma e mostrës, e cila merret e barabartë me 8, 11, 22 dhe 44 kHz. Për shembull, një normë kampionimi prej 22 kilohertz do të thotë që një sekondë e zërit të vazhdueshëm zëvendësohet nga një grup prej njëzet e dy mijë mostrave individuale të sinjalit. Sa më e lartë të jetë shkalla e marrjes së mostrave, aq më e mirë është cilësia e zërit të dixhitalizuar.

Cilësia e dixhitalizimit audio përcaktohet gjithashtu nga numri i biteve të memories të përdorura për të regjistruar amplituda, fazën dhe frekuencën për një vlerë diskrete kohore. Ky parametër quhet konvertim bitvaniya. Aktualisht, thellësia e bitit është 8 bit 16 ose 24 bit.

Konvertuesit analog në dixhital (ADC) kryejnë zbërthimin e sinjaleve analoge në seri harmonike, të cilat janë të koduara si sinjale dixhitale diskrete. Kryhet transformimi i anasjelltë për riprodhimin e zërit të koduar me një kod numerik Konvertuesit dixhital në analog (DAC). Me transformime të tilla, humbja e informacionit që lidhet me metodën e kodimit është e pashmangshme, kështu që cilësia e regjistrimit të zërit zakonisht nuk është plotësisht e kënaqshme dhe korrespondon me cilësinë e zërit të instrumenteve muzikore elektrike më të thjeshta me një ngjyrë karakteristike të muzikës elektronike. Në të njëjtën kohë, kjo metodë kodimi ofron kod shumë kompakt, dhe për këtë arsye gjeti aplikim edhe në ato vite kur burimet e teknologjisë kompjuterike ishin qartësisht të pamjaftueshme.

Metoda e valës së tabelës (valë- tabela) sintezë i përshtatet më mirë gjendjes së artit. E thënë thjesht, mund të themi se diku në tabelat e përgatitura paraprakisht, ruhen mostrat e zërit për shumë instrumente të ndryshme muzikore (edhe pse jo vetëm për to). Në inxhinieri, mostra të tilla quhen mostrat . Kodet numerike shprehin llojin e instrumentit, numrin e modelit të tij, lartësinë, kohëzgjatjen dhe intensitetin e zërit, dinamikën e ndryshimit të tij, disa parametra të mjedisit në të cilin shfaqet zëri, si dhe parametra të tjerë që karakterizojnë veçoritë e zërit. . Meqenëse tingujt "realë" përdoren si mostra, cilësia e tingullit të marrë si rezultat i sintezës është shumë e lartë dhe i afrohet cilësisë së tingullit të instrumenteve reale muzikore.

Në vijim formatet e kodimit audio .

Formati WAV(nga WAVeform-audio - forma valore e audios) kodimi audio. Mund të merrni një regjistrim zanor në këtë format nga një mikrofon, luajtës, magnetofon, TV dhe pajisje të tjera audio të përdorura zakonisht të lidhura me një kompjuter. Megjithatë, formati WAV kërkon shumë memorie. Pra, kur regjistroni tingull stereo me një frekuencë kampionimi prej 44 kilohertz dhe një thellësi pak prej 16 bit - parametra që japin cilësi të mirë zëri, një minutë regjistrim kërkon rreth dhjetë milionë bajt memorie.

Formati i thirrur MIDI(Musical Instruments Digital Interface - ndërfaqe dixhitale e instrumenteve muzikore). Në fakt, ky format është një grup udhëzimesh, komandash të të ashtuquajturit muzikor sintetizues- një pajisje që imiton tingujt e instrumenteve të vërteta muzikore. Komandat e sintetizatorit janë në fakt tregues të lartësisë së notës, kohëzgjatjes së tingullit të saj, llojit të instrumentit muzikor që simulohet, etj. Kështu, sekuenca e komandave të sintetizuesit është diçka si një shënim muzikor i një melodie muzikore. . Mund të merrni vetëm regjistrim zëri në format MIDI nga instrumente muzikore elektronike të veçanta që mbështesin ndërfaqen MIDI. Formati MIDI ofron zë me cilësi të lartë dhe kërkon shumë më pak memorie sesa formati WAV.