Звук – это звуковая волна, у которой непрерывно меняется амплитуда и частота. При этом амплитуда определяет громкость звука, а частота — его тон. Чем больше амплитуда звуковых колебаний, тем он громче. А частота писка комара больше частоты сигнала автомобиля. Частоту измеряют в Герцах . 1Гц — это одно колебание в секунду .

Кодирование звука.

Компьютер является мощнейшим устройством для обработки различных типов информации, в том числе и звуковой. Но аналоговый звук непригоден для обработки на компьютере, его необходимо преобразовать в цифровой . Для этого используются специальные устройства — аналого-цифровые преобразователи или АЦП . В компьютере роль АЦП выполняет звуковая карта . Каким же образом АЦП преобразует сигнал из аналогового в цифровой вид? Давайте разберемся.

Пусть у нас есть источник звука с частотой 440Гц , пусть это будет гитара. Сначала звук нужно превратить в электрический сигнал. Для этого используем микрофон. На выходе микрофона мы получим электрический сигнал с частотой 440Гц . Графически он выглядит таким образом:

Следующая задача — преобразовать этот сигнал в цифровой вид, то есть в последовательность цифр. Для этого используется временная дискретизация — аналоговый звуковой сигнал разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина интенсивности звука, которая зависит от амплитуды. Другими словами через какие-то промежутки времени мы измеряем уровень аналогового сигнала. Количество таких измерений за одну секунду называется частотой дискретизации. Частота дискретизации измеряется в Герцах . Соответственно, если мы будет измерять наш сигнал 100 раз в секунду, то частота дискретизации будет равна 100Гц.

Вот примеры некоторых используемых частот дискретизации звука:

  • 8 000 Гц - телефон, достаточно для речи;
  • 11 025 Гц;
  • 16 000 Гц;
  • 22 050 Гц - радио;
  • 32 000 Гц;
  • 44 100 Гц - используется в Audio CD;
  • 48 000 Гц - DVD, DAT;
  • 96 000 Гц - DVD-Audio (MLP 5.1);
  • 192 000 Гц - DVD-Audio (MLP 2.0);
  • 2 822 400 Гц - SACD, процесс однобитной дельта-сигма модуляции, известный как DSD - Direct Stream Digital, совместно разработан компаниями Sony и Philips;
  • 5,644,800 Гц - DSD с удвоенной частотой дискретизации, однобитный Direct Stream Digital с частотой дискретизации вдвое больше, чем у SACD. Используется в некоторых профессиональных устройствах записи DSD.

Современные звуковые карты способны оцифровывать звук с частотой дискретизации 96Кгц и даже 192 кГц.

В итоге наш аналоговый сигнал превратится в цифровой, а график станет уже не гладким, а ступенчатым, дискретным:

Глубина кодирования звука — это количество возможных уровней сигнала. Другими словами глубина кодирования это точность измерения сигнала. Глубина кодирования измеряется в битах . Например, если количество возможных уровней сигнала равно 255 , то глубина кодирования такого звука 8 бит . 16-битный звук уже позволяет работать с 65536 уровнями сигнала. Современные звуковые карты обеспечивают глубину кодирования в 16 и даже 24 бита , а это возможность кодирования 65536 и 16 777 216 различных уровней громкости соответственно .

Зная глубину кодирования , можно легко узнать количество уровней сигнала цифрового звука. Для этого используем формулу:

N=2 i ,

где N — количество уровней сигнала, а i — глубина кодирования.

Например, мы знаем, что глубина кодирования звука 16 бит. Значит количество уровней цифрового сигнала равно 2 16 =65536.

Чтобы определить глубину кодирования если известно количество возможных уровней применяют эту же формулу. Например, если известно, что сигнал имеет 256 уровней сигнала, то глубина кодирования составит 8 бит, так как 2 8 =256.

Как понятно из данного вышеприведенного рисунка, чем чаще мы будем измерять уровень сигнала, т.е. чем выше частота дискретизации и чем точнее мы будем его измерять , тем более график цифрового сигнала будет похож на аналоговый график, соответственно, тем выше качество цифрового звука мы получим . И тем больший объем будет иметь файл .

Кроме того, мы рассматривали монофонический (одноканальный) звук , если же звук стереофонический , то размер файла увеличивается в 2 раза, так как он содержит 2 канала .

Рассмотрим пример задачи.

Какой объем будет иметь звуковой монофонический файл содержащий звук, если длительность звука 1 минута, глубина кодирования 8 бит, а частота дискретизации 22050Гц?

Зная частоту дискретизации и длительность звука легко установить количество измерений уровня сигнала за все время. Если частота дискретизации 22050Гц — значит за 1 секунду происходит 22050 измерений, а за минуту таких измерений будет 22050*60=1 323 000.

На одно измерение требуется 8 бит памяти, следовательно на 1 323 000 измерений потребуется 1 323 000*8 = 10 584 000 бит памяти. Разделив полученное число на 8 получим объем файла в байтах — 10584000/8=1 323 000 байт. Далее, разделив полученное число на 1024 получим объем файла в килобайтах — 1 291,9921875 Кбайт. А разделив полученное число еще раз на 1024 и округлив до сотых получим размер файла в мегабайтах — 1 291,9921875/1024=1,26Мбайт.

Ответ: 1,26Мбайт.

Звук – волна, распространяющая в какой либо среде (воздухе) и обладающая непрерывными характеристиками частоты и интенсивности. Волна, дойдя до органов слуха, вызывает колебания, которые затем преобразуются мозгом в звуковой сигнал. На этом же принципе реализовано кодирование звуковой информации.

Две формы представления

В мире вся звуковая информация представлена в двух формах:

  1. Аналоговой – непрерывная плавная линия с различной амплитудой колебаний и частотой.
  2. Дискретной – ломаный отрезок, который имеет «ступеньки» различной высоты.

Аналоговая форма записи используется в старых устройствах – магнитофонах, кассетных плеерах, патефонах. Здесь волны записываются на носитель в виде дорожки, а игла или звукопреобразующее устройство, «раздражаясь» от этих дорожек, воспроизводит звук.

Сейчас практически все устройства используют двоичную систему счисления для воспроизведения звуковых сигналов. Компакт диски, флеш-карты, жесткие диски – все они хранят информацию в двоичном коде. Принцип чтения и записи при этом кардинально меняется.

Дискретизация звука

Чтобы электронные устройства могли воспроизводить звук, необходимо записать его в понятном для машины виде, преобразовать в определенную последовательность символов 1 и 0. Этот процесс преобразования называется дискретизацией. Сам принцип кодирования состоит в следующем:

  1. Плавная линия разбивается на многочисленные маленькие временные отрезки так, что каждому участку начинает соответствовать определенная несоизмеримо малая прямая.
  2. Каждому отрезку присваивается определенная величина амплитуды, которую можно представить в виде прямоугольного треугольника: катеты определяют колебания звука для машины, а гипотенуза представляет аналоговую форму записи.
  3. Каждому такому треугольника присваивается определенный номер, который соответствует уровню громкости.

На практике подобная информация представляется в виде гистограммы: высота каждого столбика соответствует амплитуде волны, а частота дискретизации, то есть размер временных отрезков, представлена шириной.

Соответственно, чем уже столбики, тем большее их количество понадобиться для записи информации, тем выше будет качество воспроизводимого сигнала, но и файл будет весить больше. Качество современной музыки, звука зависит от битрейта – количества бит, которое выделено для кодирования одной секунды звука. Таким образом, чем выше значение битрейта, тем лучше качество звука.

Кодирование звуковой информации кратко.

1. Общие сведения

Сложность: базовая.

Примерное время решения (для тех, кто будет выполнять часть 2): 2 минуты

Тема: Создание и обработка графической и мультимедийной информации

Подтема: Цифровая звукозапись

Что проверяется: Умение оценивать количественные характеристики процесса записи звука.

Краткие теоретические сведения: Поскольку данный тип задания является новым в КИМ ЕГЭ, приведем (пока без обоснования, обоснование ниже) математическую модель процесса звукозаписи:

N = k * F * L * T (1)

  • N – размер файла (в битах) , содержащего запись звука;
  • k - количество каналов записи (например, 1 – моно, 2 – стерео, 4 – квадро и т.д.);
  • F – частота дискретизации (в герцах), т.е. количество значений амплитуды звука фиксируемых за одну секунду;
  • L – разрешение, т.е. число бит, используемых для хранения каждого измеренного значения;
  • T – продолжительность звукового фрагмента (в секундах).

Как может выглядеть задание? Например, так: Заданы значения всех требуемых параметров процесса звукозаписи, кроме одного. Требуется оценить значение оставшегося параметра, например, размер файла или продолжительность звукового фрагмента.


Пример условия:

Варианты ответов:

1) 0,2 Мбайт

2. Пример задания

2.1. Условие задачи.

Задача 2012-А8-1.

Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

1) 0,2 Мбайт 2) 2 Мбайт 3) 3 Мбайт 4) 4 Мбайт

2.2. Решение.

Приводим исходные данные к размерности биты-секунды-герцы и проводим расчеты по формуле (1):

Дано:

k = 1, т.к. одноканальная (моно) звукозапись;

F = 16 кГц = 16 000 Гц;

T = 1 мин = 60 с.

Найти N

Подставляем значение известных параметров в формулу (1)

N = 1 *16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 *5625 (бит)=

= 2 12 *5625 бит = (2 12 *5625)/2 3 байт = 2 9 *5625 байт =

= (2 9 *5625)/ 2 20 Мбайт = 5625/2 11 Мбайт = 5625/2048 Мбайт.

Число 5625/2048 находится между числами 2 и 3. При этом оно ближе к 3, чем к 2, т.к. 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

Правильный вариант ответа: №3 (3 Мбайт)

Замечание. Другая идея решения приведена в п.3.3

3. Советы учителям и ученикам

3.1 Какие знания/умения/навыки нужны ученику, чтобы решить эту задачу

1) Не следует «зазубривать» формулу (1). Ученик, представляющий суть процесса цифровой звукозаписи, должен быть способен самостоятельно её сформулировать.

2) Необходимо умение записывать значения параметров в требуемой размерности, а также элементарные арифметические навыки, в т.ч. оперирование со степенями двойки.

А. Сильные ученики .

1. Скорее всего, они и так решат эту задачу.

2. Можно дать задание ученикам проверить формулу (1) на практике, записывая в файл звук с микрофона. При этом следует учесть, что она справедлива только в том случае, если записываемая информация не подвергается сжатию (формат WAV (PCM) без сжатия). Если используются аудиоформаты со сжатием (WMA, MP3), то объем получившегося файла будет по понятным причинам существенно меньше расчетного. Для экспериментов с цифровой звукозаписью можно использовать свободно распространяемый аудиоредактор Audacity (http://audacity.sourceforge.net/).

3. Целесообразно подчеркнуть концептуальную общность растрового представления звука и изображения, являющихся разновидностями одного и того же процесса приближенного представления непрерывного сигнала последовательность коротких дискретных сигналов, т.е. оцифровывания на основе дискретизации. В случае растрового изображения производится двумерная дискретизизация яркости в пространстве, в случае звука – одномерная дискретизация по времени. И в том, и в другом случае повышение частоты дискретизации (количества пикселей или звуковых отсчетов) и/или увеличение количества битов для представления одного отсчета (разрядность цвета или звука) ведет к повышению качества оцифровки, при одновременном росте размера файла с цифровым представлением. Отсюда – необходимость сжатия данных.

4. Желательно упомянуть об альтернативных способах оцифровки звука – запись «партий» инструментов в MIDI-формате. Здесь уместно провести аналогию с растровым и векторным представлением изображений.

Б. Не столь сильные ученики .

1. Необходимо обеспечить усвоение соотношения (1). Рекомендуется дать задания типа «Как изменится объем файла, если время записи звучания увеличить/уменьшить в p раз? »,

«Во сколько раз можно увеличить/уменьшить продолжительность записи, если максимальный размер файла увеличить/уменьшить в p раз? », «Как изменится объем файла, если количество бит для записи одного значения увеличить/уменьшить в p раз?» и т.д.

2. Необходимо убедиться, что учащиеся свободно оперируют размерностями, знают, что в Мбайте 2 23 бит и т.д.

3. Необходимо убедиться, что учащиеся достаточно арифметически грамотны, свободно владеют устным счетом со степенями двойки (умножение, деление, выделение сомножителей, представляющих собой 2 n).

4. Придумывайте свои подходы и пробуйте их.

3.3. Полезный прием.

В подобных задачах часто возникают степени двойки. Перемножать и делить степени проще, чем произвольные числа: умножение и деление степеней сводится к сложению и вычитанию показателей.

Заметим, что числа 1000 и 1024 отличаются менее, чем на 3%, числа 60 и 64 отличаются менее, чем на 7%. Поэтому можно поступить так. Провести вычисления, заменив 1000 на 1024 = 2 10 и 60 на 64 = 2 6 , используя преимущества операций со степенями. Ближайший к полученному числу ответ и будет искомым. Можно после этого перепроверить себя, проведя точные вычисления. Но можно учесть, что общая погрешность вычислений при нашем приближении не превышает 10%. Действительно, 60*1000 = 60000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

Таким образом, правильный результат умножений по формуле (1) немного больше, чем 90% от полученного приближенного результата. Если учет погрешности не меняет результата – можно не сомневаться в ответе.

Пример. (ege.yandex.ru, вариант 1).

Производится двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 32-битным разрешением. Запись длится 12 минут, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

1) 30 Мбайт 2) 60 Мбайт 3) 75 Мбайт 4) 90 Мбайт

Решение. Размер записи в битах равен

2*16*1000*32*12*60

С учетом замены 1000 на 1024=2 10 и 60 на 64=2 6 получим:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

Как известно, 1 Мбайт = 2 20 байт = 2 23 бит. Поэтому 3*2 28 бит = 3*32 = 96 Мбайт. Уменьшив это число на 10%, получим 86.4 Мбайт. В обоих случаях ближайшей величиной является 90 Мбайт.

Правильный ответ: 4

1. Прочитайте условие задачи. Выразите неизвестный параметр через известные. Особое внимание обратите, на размерность известных параметров. Она должна быть – биты-секунды-герцы (напомним, что 1 Гц = с -1). При необходимости, приведите значения параметров к нужной размерности, так же как это делается в задачах по физике.

2. Проводите вычисления, стараясь выделять степени двойки.

3. Обратите внимание, что в условии требуется выбрать наиболее подходящий ответ, поэтому высокая точность вычислений до знаков после запятой не требуется. Как только стало ясно, какой из вариантов ответов наиболее близок к вычисляемому значению, вычисления следует прекратить. Если расхождение со всеми вариантами ответов очень велико (в разы или на порядок), то вычисления надо перепроверить.

4. Задачи для самостоятельного решения

4.1. Клоны задачи 2012-А8-1.

Ниже приведены еще четыре варианта задачи 2012-А8-1.

А) Производится одноканальная (моно) звукозапись с частотой дискретизации 32 кГц и 24-битным разрешением. Запись длится 15 секунд, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

Б) Производится двухканальная (стерео) звукозапись с частотой дискретизации 32 кГц и 24-битным разрешением. Запись длится 30 секунд, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

1) 1,5 Мбайт 2) 3 Мбайт 3) 6 Мбайт 4) 12 Мбайт

В) Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 32-битным разрешением. Запись длится 2 минуты, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

Г) Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 32-битным разрешением. Запись длится 4 минуты, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

1) 2 Мбайт 2) 4 Мбайт 3) 8 Мбайт 4) 16 Мбайт

Правильные ответы:

А:1; Б:3; В:3; Г:4.

4.2. Задача 2012-А8-2(обратная к предыдущей).

A) Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Результаты записываются в файл, размер которого не может превышать 8 Мбайт, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к максимально возможной длительности записываемого звукового фрагмента?

Б) Производится двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Результаты записываются в файл, размер которого не может превышать 8 Мбайт, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к максимально возможной длительности записываемого звукового фрагмента?

1) 1минута 2) 30 секунд 3) 3 минуты 4) 90 секунд

В) Производится одноканальная (моно) звукозапись с частотой дискретизации 48 кГц и 8-битным разрешением. Результаты записываются в файл, размер которого не может превышать 2,5 Мбайт, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к максимально возможной длительности записываемого звукового фрагмента?

1) 1минута 2) 30 секунд 3) 3 минуты 4) 90 секунд

Г) Производится одноканальная (моно) звукозапись с частотой дискретизации 48 кГц и 16-битным разрешением. Результаты записываются в файл, размер которого не может превышать 5 Мбайт, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к максимально возможной длительности записываемого звукового фрагмента?

1) 1минута 2) 30 секунд 3) 3 минуты 4) 90 секунд

Правильные ответы:

А:3; Б: 4 ; В: 1; Г:1 .

5.Дополнение. Некоторые сведения о цифровой звукозаписи.

Распространение звука в воздухе можно рассматривать как распространение колебаний давления. Микрофон преобразует колебания давления в колебания электрического тока. Это аналоговый непрерывный сигнал. Звуковая плата обеспечивает дискретизацию входного сигнала от микрофона. Это делается следующим образом – непрерывный сигнал заменяется последовательностью измеренных с определенной точностью значений.

График аналогового сигнала:

Дискретное представление этого же сигнала (41 измеренное значение):


Дискретное представление этого же сигнала (161 измеренное значение, более высокая частота дискретизации):

Видно, что чем выше частота дискретизации, тем выше качество приближенного (дискретного) сигнала. Кроме частоты дискретизации, на качество оцифрованного сигнала влияет количество двоичных разрядов, отводимых для записи каждого значения сигнала. Чем больше бит отводится под каждое значение, тем более точно можно оцифровать сигнал.

Пример 2-х битного представления этого же сигнала (двумя разрядами можно пронумеровать только 4 возможных уровня величины сигнала):


Теперь можно выписать зависимость для размера файла с оцифрованным звуком

размер_файла = (количество_значений,_фиксируемых_за_1_секунду)*

*(количество_двоичных_разрядов_для_записи_одного_значения)*

*(число_секунд_записи).

Учитывая возможность одновременной записи звука с нескольких микрофонов (стерео-, квадро- запись и т.д.), что делается для усиления реалистичности при воспроизведении, получаем формулу (1).

При воспроизведении звука цифровые значения преобразуются в аналоговые. Электрические колебания, передаваемые на динамики, преобразуются ими снова в колебания давления воздуха.

Что такое дискретизация, знает сегодня любой профессионал в сфере цифровой фотографии. Однако многие люди, которые только начинают знакомиться с этой сферой, не знают основных ее особенностей, вследствие чего могут допускать те или иные ошибки.

Что это?

Что такое дискретизация? Это нежелательный эффект, который приводит к тому, что качество фотографии заметно ухудшается. Данное явление может быть ассоциировано с любым устройством или же процессом, в котором информация подразделяется на несколько отдельных отсчетов. В данном случае дискретизация может рассматриваться в качестве типа если есть определенное соотношение между частотой данного явления и определенной периодической структурой в данных.

Глаз человека постоянно стремится к тому, чтобы воспринимать определенное соотношение в качестве интерференционной картины, которая сможет заслонить собой реальный смысл того или иного изображения. Рассматривая примеры того, что такое дискретизация, стоит выделить муар, который представляет собой не совсем точный ее эффект, но при этом может показать, каким образом человек вводится в заблуждение в том случае, когда два паттерна начинают между собой взаимодействовать, образуя третий.

Что такое муар?


Муар представляет собой непонятный волнообразный узор, который изначально не присутствовал на объекте съемки. Данный эффект чаще всего возникает на различных изображениях, которые получаются при помощи цифровых устройств. И заключается проблема здесь в том, что узор объекта накладывается на узор размещения пикселей на матрице, вследствие чего появляется третий, который и называется муаром.

В преимущественном большинстве случаев этот эффект возникает на детализированных высококонтрастных изображениях, которые не соответствуют изначально настроенному разрешению датчиков. В частности, его достаточно часто можно встретить в том случае, если снимаются такие объекты, как волосы или же ткани, а также сюжеты, в которых содержится большое количество повторяющихся деталей. Зачастую муар невозможно встретить в природе, так как он возникает на изображениях, которые получаются при помощи цифровой фотокамеры или же впоследствии неправильного сканирования.

Достаточно часто в современных цифровых фотокамерах для того, чтобы снизить данный эффект, применяется специализированный оптический низкочастотный фильтр, поэтому, если вы действительно собираетесь профессионально заниматься фотографией, то в таком случае вам следует обязательно задуматься о модели с этой функцией, которая сможет обеспечить должное качество вне зависимости от вторичных условий.

Дискретизация в современных фотоаппаратах


В современных цифровых устройствах эффект дискретизации вызван тем, что информация разбивается на несколько отсчетов с регулярным интервалом. В частности, одним из паттернов в данном случае будет расположение пикселей на матрице, вторым паттерном будут любые элементы на снимке, которые могут повторяться на большой области или же которые изменяются через определенное количество пикселей в поперечном или же продольном направлении.

Для тех, кто не понял, что такое дискретизация и когда она возникает, можно привести конкретный пример. Когда в наличии есть недостаточное количество пикселей для того, чтобы передать достоверную информацию со снимка, то в таком случае он делается в не самом лучшем качестве. В стандартном варианте достаточно было бы просто выбрать более высокое разрешение, гарантируя таким образом обеспечение нужного количества пикселей для передачи деталей не снимке с определенной точностью, а если бы число пикселей было бы недостаточным, то мы могли бы просто увидеть небольшое количество элементов снимка.

Однако на самом деле это не совсем так. Теория дискретизации гласит о том, что в действительности ситуация является гораздо более негативной, и если нам не будет хватать количества пикселей для того, чтобы сделать определенный снимок, то в таком случае качество изображения будет постоянно ухудшаться.

Сколько пикселей нужно?


Возьмем в качестве примера ситуацию, когда на снимке присутствует просто 20 черных и белых линий, каждая из которых имеет ширину 5 пикселей. В данном случае, если на каждой линии будет обеспечен хотя бы один пиксель, то снимок может быть записан. Естественно, если пиксели не будут попадать четко в центр каждой линии, то в таком случае каждый пиксель получится серым, а не белым или черным, а его оттенок уже непосредственно будет зависеть от того, как пиксель располагается относительно линий.

Если на снимке количество пикселей будет уменьшаться, то в таком случае некоторые из них начнут оказываться между линиями, вследствие чего на изображении появится вышеуказанный паттерн, который будет постоянно изменяться в зависимости от того, в каком соотношении находится интервал между линиями и число пикселей. Конечно, такое изображение уже не будет являться точным воспроизведением оригинала, так как регулярная структура линий будет уже заметно нарушена. Именно это явление и принято в профессиональных кругах называть «дискретизация данных».

Что делать?

Чтобы решить данную проблему, нужно несколько смягчить снимок перед тем, как снизить количество пикселей. Таким образом, вы сможете полностью избавиться от резких границ на каждой линии, а пиксели смогут принимать промежуточные значения. Другими словами, снимок становится более мягким, но при этом сохраняется общее впечатление от картинки.

Как это влияет на изображение?


Конечно, повторяющиеся и регулярные структуры линий достаточно редко можно встретить на снимках различных природных объектов - их присутствие часто ограничивается снимками разнообразных искусственных сооружений, таких как здания и прочее. Однако в любом случае глубина дискретизации может быть внушительной, поэтому этого эффекта всегда стоит избегать, занимаясь съемкой любых объектов.

При этом стоит отметить тот факт, что качество изображений может быть абсолютно разным даже в том случае, если они имеют одинаковое количество пикселей. Ведь, помимо всего прочего, разница между снимками может заключаться также в том, каким именно образом они были получены. К примеру, в одном случае снимок может быть несколько смягчен путем пропуска его через низкочастотный фильтр для получения промежуточных значений пикселей перед тем, как уменьшить размер, в то время как другое изображение может просто уменьшаться в размере, не внося в него при этом никаких дополнительных изменений и не получая промежуточных значений на границах объектов, где наблюдаются слишком резкие изменения яркости.

Как проверить?


Чтобы понять, как это работает, достаточно просто взять один снимок, после чего сделать его копию. Оригинал отфильтровать при изменении размера с применением опции так называемой бикубической фильтрации, которая является доступной в стандартном Adobe Photoshop. Таким образом, снимок будет смягчен. Несмотря на заметное снижение пикселей, переходы между тональностями в конечном итоге оказываются гладкими и вполне подходящими под имеющееся количество пикселей.

После этого сделанную нами ранее копию снимка уменьшаем, скажем, до 30% от первоначального размера, используя при этом опцию «ближайшей соседней точки» в той же программе. Именно эта операция в конечном итоге и даст вам эффект дискретизации, который будет налицо.

Дискретизация звука


Дискретизация звука - это фильтрация перед тем, как она будет сохранена в звуковой файл. Другими словами, в конечном файле будет не точная копия звуковой волны, а только приблизительная. С одной стороны, дискретизация звука обеспечивает определенное снижение объема сохраняемого файла, но с другой есть масса звуковых колебаний, которые не обязательно сохранять на жестком диске.

Такая фильтрация звука называется «частота дискретизации». При этом стоит отметить, что на самом деле только в природе присутствует звук без этого эффекта, хоть и немногие об этом знают. Частота дискретизации - это наложение определенной сетки на звуковую волну, а также запись только определенных ключевых элементов.

Производить запись полностью всей звуковой волны было бы достаточно сложно. Именно по этой причине гораздо чаще можно встретить такую ситуацию, когда производилась двухканальная звукозапись с частотой дискретизации 44.1 kHz. Последняя выбирается наиболее часто, так как это самый оптимальный параметр.

В принципе, рассматривая звуковую обработку, нужно уделить особенное внимание таким параметрам, как глубина кодирования и частота дискретизации, ведь чем эти показатели выше, тем больше будет соответствовать аналоговому.

Стандартов на кодирование звуковой информации двоичным кодом нет. Существуют отдельные корпо­ративные стандарты. Способы работы созву­ком и видео получили название мультимедийных технологий.

Имеется два основных метода кодирования звука.

Метод FM (Frequency Modulation ) – метод частотной модуляции. В нем используется разложение сложного звука на последовательность простейших гармонических сигналов разной частоты. Гармонический сигнал представляет собой правильную синусоиду, которую можно описать набором числовых параметров – амплитуды, фазы и ча­стоты.

Преобразование звука в цифровую форму или оцифровывание звука происходит следующим образом. В природе звуковые сигналы являются аналоговыми, т. е. непрерывными. В компьютере непрерывный звуковой сигнал заменяется дискретным и значение параметров, определяющих звуковые характеристики, определяются только в некоторые фиксированные моменты времени. Количество отсчетов сигнала в единицу времени называется частотой дискретизации , которую принимают равной 8, 11, 22 и 44 кГц. Например, частота дискретизации в 22 килогерца означает, что одна секунда непрерывного звучания заменяется набором из двадцати двух тысяч отдельных отсчетов сигнала. Чем выше частота дискретизации, тем лучше качество оцифро­ванного звука.

Качество преобразования звука в цифровую форму определяется также количеством битов памяти, используемых для записи амплитуды, фазы и ча­стоты для одного дискретного значения времени. Этот параметр принято называть разрядностью преобразо­ вания . Внастоящее время используется разрядность 8 бит 16 или 24 бит.

Аналогово-цифровые преобразова­тели (АЦП) выполняют разложение аналоговых сигналов в гармонические ряды, которые кодируются в виде дискретных цифровых сигналов. Обратное преобразование для воспроизведения звука, закодирован­ного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методом коди­рования, поэтому качество звукозаписи обычно получается не вполне удовлетво­рительным и соответствует качеству звучания простейших электромузыкальных инструментов с окрасом, характерным для электронной музыки. В то же время данный метод кодирования обеспечивает весьма компактный код , и потому он нашел применение еще в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.

Метод таблично-волнового (Wave - Table ) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различ­ных музыкальных инструментов (хотя не только для них). В технике такие образцы называют сэмплами . Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие пара­метры, характеризующие особенности звука. Поскольку в качестве образцов исполь­зуются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музы­кальных инструментов.

Используются следующие форматы кодирования звука .

Формат WAV (от WAVeform-audio - волно­вая форма аудио) кодирования звука. Получить запись звука в этом формате можно от подключаемых к компьютеру микрофона, проигрывателя, магнитофона, теле­визора и других стандартно используемых устройств работы со звуком. Однако формат WAV требует очень много памяти. Так, при записи стереофонического звука с частотой дискретизации 44 килогерца и разрядностью 16 бит - параметра­ми, дающими хорошее качество звучания, - на одну минуту записи требуется около десяти миллионов байтов памяти.

Широко применяется также формат с названием MIDI (Musical Instruments Digital Interface - цифровой интерфейс музыкальных инструментов). Фактически этот формат представляет собой набор инструкций, команд так называемого музыкального синтезатора - устройства, которое имитирует звучание реальных музыкальных инструментов. Команды син­тезатора фактически являются указаниями на высоту ноты, длительность ее зву­чания, тип имитируемого музыкального инструмента и т. д. Таким образом, по­следовательность команд синтезатора представляет собой нечто вроде нотной записи музыкальной мелодии. Получить запись звука в формате MIDI можно только от специальных электромузыкальных инструментов, которые поддержи­вают интерфейс MIDI. Формат MIDI обеспечивает высокое качество звука и тре­бует значительно меньше памяти, чем формат WAV.