Полезные статьи

На студии при двухканальной звукозаписи с 32-битным разрешением за 3 часа

Разбор задания №9 (подготовка к ЕГЭ по информатике)

Успейте воспользоваться скидками до 50% на курсы «Инфоурок»

Сколь­ко се­кунд по­тре­бу­ет­ся мо­де­му, пе­ре­да­ю­ще­му со­об­ще­ния со ско­ро­стью 14400 бит/с, чтобы пе­ре­дать цвет­ное раст­ро­вое изоб­ра­же­ние раз­ме­ром 640 на 480 пик­се­лей, при усло­вии, что цвет каж­до­го пик­се­ля ко­ди­ру­ет­ся 24 би­та­ми?
По­яс­не­ние.

Один цвет за­ни­ма­ет один пик­сел, по­это­му Q = 640 * 480 * 24 бит = 7 372 800 бит.

t = 7 372 800 бит / 14 400 бит/с = 512 с.

Задание 9 № 2
Ско­рость пе­ре­да­чи дан­ных через мо­дем­ное со­еди­не­ние равна 51200 бит/с. Пе­ре­да­ча тек­сто­во­го файла через это со­еди­не­ние за­ня­ла 10 с. Опре­де­ли­те, сколь­ко сим­во­лов со­дер­жал пе­ре­дан­ный текст, если из­вест­но, что он был пред­став­лен в 16-бит­ной ко­ди­ров­ке Unicode.
По­яс­не­ние.

Объём ин­фор­ма­ции вы­чис­ля­ет­ся по фор­му­ле Q = q * t, где t — время пе­ре­да­чи q — cко­рость пе­ре­да­чи дан­ных. По­это­му

Q = 51200 бит/c * 10 c.

Каж­дый сим­вол в дан­ной ко­ди­ров­ке ко­ди­ру­ет­ся 16-ю би­та­ми. Сле­до­ва­тель­но, ко­ли­че­ство сим­во­лов опре­де­лит­ся так:

N = 2 9 * 1000 / 2 4 = 2 5 * 1000 = 32 000.

Задание 9 № 3
Про­из­во­дит­ся двух­ка­наль­ная (сте­рео) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 48 кГц и 32-бит­ным раз­ре­ше­ни­ем, ре­зуль­та­ты за­пи­сы­ва­ют­ся в файл, сжа­тие дан­ных не ис­поль­зу­ет­ся. Раз­мер файла с за­пи­сью не может пре­вы­шать 16 Мбайт. Какая из при­ведённых ниже ве­ли­чин наи­бо­лее близ­ка к мак­си­маль­но воз­мож­ной про­дол­жи­тель­но­сти за­пи­си?

Так как ча­сто­та дис­кре­ти­за­ции 48 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 48 000 зна­че­ний сиг­на­ла. Глу­би­на ко­ди­ро­ва­ния 32 бит, т. е. 4 байта. По­сколь­ку за­пись двух­ка­наль­ная, объём па­мя­ти, не­об­хо­ди­мый для хра­не­ния дан­ных од­но­го ка­на­ла, умно­жа­ет­ся на 2, по­это­му, так как раз­мер файла не может пре­вы­шать 16 Мбайт, один канал за­ни­ма­ет 8 Мбайт или 8·2 20 байт. Чтобы найти мак­си­маль­но воз­мож­ную про­дол­жи­тель­но­сть за­пи­си, не­об­хо­ди­мо раз­де­лить най­ден­ный ин­фор­ма­ци­он­ный объем на глу­би­ну ко­ди­ро­ва­ния и на ча­сто­ту дис­кре­ти­за­ции:

Пра­виль­ный ответ ука­зан под но­ме­ром 3.

Про­из­во­ди­лась че­ты­рех­ка­наль­ная (квад­ро) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 24 кГц и 16-бит­ным раз­ре­ше­ни­ем. В ре­зуль­та­те был по­лу­чен файл раз­ме­ром 1800 Мбайт, сжа­тие дан­ных не про­из­во­ди­лось. Опре­де­ли­те при­бли­зи­тель­но, сколь­ко минут про­из­во­ди­лась за­пись.

В ка­че­стве от­ве­та ука­жи­те бли­жай­шее к вре­ме­ни за­пи­си целое число минут.
По­яс­не­ние.

Так как ча­сто­та дис­кре­ти­за­ции 24 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 24000 зна­че­ний сиг­на­ла.

Глу­би­на ко­ди­ро­ва­ния 16 бита, т. е. 2 байта. Т. к. за­пись четырёхка­наль­ная, объём па­мя­ти, не­об­хо­ди­мый для хра­не­ния дан­ных од­но­го ка­на­ла, умно­жа­ет­ся на 4, по­это­му, так как по­тре­бо­ва­лось 1800 Мбайт, один канал за­ни­ма­ет 450 Мбайт или 450·2 20 байт. Чтобы найти время, в те­че­ние ко­то­ро­го про­во­ди­лась за­пись, не­об­хо­ди­мо раз­де­лить най­ден­ный ин­фор­ма­ци­он­ный объем на глу­би­ну ко­ди­ро­ва­ния и на ча­сто­ту дис­кре­ти­за­ции:

сек.

Тем самым, время за­пи­си при­мер­но равно 163,84 ми­ну­ты, что близ­ко к 164 ми­ну­там.

Задание 9 № 5
Про­из­во­ди­лась четырёхка­наль­ная (квад­ро) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 8 кГц и 32-бит­ным раз­ре­ше­ни­ем. В ре­зуль­та­те был по­лу­чен файл раз­ме­ром 16 Мбайт, сжа­тие дан­ных не про­из­во­ди­лось. Какая из при­ведённых ниже ве­ли­чин наи­бо­лее близ­ка ко вре­ме­ни, в те­че­ние ко­то­ро­го про­во­ди­лась за­пись?

Так как ча­сто­та дис­кре­ти­за­ции 8 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 8 000 зна­че­ний сиг­на­ла. Глу­би­на ко­ди­ро­ва­ния 32 бит, т. е. 4 байта. По­сколь­ку за­пись четырёхка­наль­ная, объём па­мя­ти, не­об­хо­ди­мый для хра­не­ния дан­ных од­но­го ка­на­ла, умно­жа­ет­ся на 4, по­это­му, так как раз­мер файла не может пре­вы­шать 16 Мбайт, один канал за­ни­ма­ет 4 Мбайт или 4·2 20 байт. Чтобы найти про­дол­жи­тель­но­сть за­пи­си, не­об­хо­ди­мо раз­де­лить най­ден­ный ин­фор­ма­ци­он­ный объем на глу­би­ну ко­ди­ро­ва­ния и на ча­сто­ту дис­кре­ти­за­ции:

Задание 9 № 6
Ка­ко­во время (в ми­ну­тах) пе­ре­да­чи пол­но­го объ­е­ма дан­ных по ка­на­лу связи, если из­вест­но, что пе­ре­да­но 9000 Мбайт дан­ных, при­чем треть вре­ме­ни пе­ре­да­ча шла со ско­ро­стью 60 Мбит в се­кун­ду, а осталь­ное время — со ско­ро­стью 90 Мбит в се­кун­ду?
По­яс­не­ние.

Обо­зна­чим время пе­ре­да­чи за t. Тогда t1 = 1/3 t, а t2 = 2/3 t.

Обо­зна­чим за Q — ко­ли­че­ство дан­ных, q — со­рость пе­ре­да­чи. Пе­ре­ведём Q в Мбиты:

9 000 Мбайт = 72 000 Мбит.

1/3 t * 60 +2/3 t * 90 = 72 000.

t * (20 + 60) = 72 000

От­ку­да на­хо­дим время: t = = 900 с = 15 минут.

Задание 9 № 7 Про­из­во­дит­ся од­но­ка­наль­ная (моно) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 11 кГц и глу­би­ной ко­ди­ро­ва­ния 24 бита. За­пись длит­ся 7 минут, ее ре­зуль­та­ты за­пи­сы­ва­ют­ся в файл, сжа­тие дан­ных не про­из­во­дит­ся. Какое из при­ве­ден­ных ниже чисел наи­бо­лее близ­ко к раз­ме­ру по­лу­чен­но­го файла, вы­ра­жен­но­му в ме­га­бай­тах?

Так как ча­сто­та дис­кре­ти­за­ции 11 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 11000 зна­че­ний сиг­на­ла.

Глу­би­на ко­ди­ро­ва­ния – 24 бита = 3 байта, время за­пи­си 7 минут = 420 се­кунд, по­это­му для хра­не­ния ин­фор­ма­ции о такой за­пи­си по­тре­бу­ет­ся 11000 * 3 * 420 = 13860000 байт или 13,22 Мб, что близ­ко к 13 Мб.

Пра­виль­ный ответ ука­зан под но­ме­ром 2.

Задание 9 № 8
Про­из­во­дит­ся од­но­ка­наль­ная (моно) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 8 кГц и глу­би­ной ко­ди­ро­ва­ния 16 бита. За­пись длит­ся 2 ми­ну­ты, ее ре­зуль­та­ты за­пи­сы­ва­ют­ся в файл, сжа­тие дан­ных не про­из­во­дит­ся. Какое из при­ве­ден­ных ниже чисел наи­бо­лее близ­ко к раз­ме­ру по­лу­чен­но­го файла, вы­ра­жен­но­му в ме­га­бай­тах.

Задание 9 № 9
Про­из­во­дит­ся од­но­ка­наль­ная (моно) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 8 кГц и глу­би­ной ко­ди­ро­ва­ния 16 бита. За­пись длит­ся 2 ми­ну­ты, ее ре­зуль­та­ты за­пи­сы­ва­ют­ся в файл, сжа­тие дан­ных не про­из­во­дит­ся. Какое из при­ве­ден­ных ниже чисел наи­бо­лее близ­ко к раз­ме­ру по­лу­чен­но­го файла, вы­ра­жен­но­му в ме­га­бай­тах.

Так как ча­сто­та дис­кре­ти­за­ции 8 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 8000 зна­че­ний сиг­на­ла.

Глу­би­на ко­ди­ро­ва­ния – 16 бит = 2 байта, время за­пи­си 2 ми­ну­ты = 120 се­кунд, по­это­му для хра­не­ния ин­фор­ма­ции о такой за­пи­си по­тре­бу­ет­ся 8000 * 2 * 120 = 1920000 байт или 1,86 Мб, что близ­ко к 2 Мб.

Задание 9 № 10
Сколь­ко се­кунд по­тре­бу­ет­ся мо­де­му, пе­ре­да­ю­ще­му со­об­ще­ния со ско­ро­стью 19200 бит/с, чтобы пере­дать цвет­ное раст­ро­вое изоб­ра­же­ние раз­ме­ром пик­се­лей, при усло­вии, что цвет каж­до­го пик­се­ля ко­ди­ру­ет­ся 24 би­та­ми?
По­яс­не­ние.

Время t вы­чис­ля­ет­ся по фор­му­ле t = Q / q, где Q — объем файла, q — cко­рость пе­ре­да­чи дан­ных.

Q = 1280 * 800 * 24 бит = 24 576 000 бит.

t = 24 576 000 бит / 19 200 бит/с = 1280 с.

До­ку­мент объёмом 20 Мбайт можно пе­ре­дать с од­но­го ком­пью­те­ра на дру­гой двумя спо­со­ба­ми. А. Сжать ар­хи­ва­то­ром, пе­ре­дать архив по ка­на­лу связи, рас­па­ко­вать. Б. Пе­ре­дать по ка­на­лу связи без ис­поль­зо­ва­ния ар­хи­ва­то­ра. Какой спо­соб быст­рее и на­сколь­ко, если:

сред­няя ско­рость пе­ре­да­чи дан­ных по ка­на­лу связи со­став­ля­ет 2 23 бит в се­кун­ду;

объём сжа­то­го ар­хи­ва­то­ром до­ку­мен­та равен 50% ис­ход­но­го;

время, тре­бу­е­мое на сжа­тие до­ку­мен­та, — 15 се­кунд, на рас­па­ков­ку — 2 се­кун­ды?

В от­ве­те на­пи­ши­те букву А, если быст­рее спо­соб А, или Б, если быст­рее спо­соб Б. Сразу после буквы на­пи­ши­те число, обо­зна­ча­ю­щее, на сколь­ко се­кунд один спо­соб быст­рее дру­го­го. Так, на­при­мер, если спо­соб Б быст­рее спо­со­ба А на 23 се­кун­ды, в от­ве­те нужно на­пи­сать Б23. Еди­ни­цы из­ме­ре­ния «се­кунд», «сек.», «с.» к от­ве­ту до­бав­лять не нужно.
По­яс­не­ние.

Общее время скла­ды­ва­ет­ся из вре­ме­ни сжа­тия, рас­па­ков­ки и пе­ре­да­чи. Время пе­ре­да­чи t рас­счи­ты­ва­ет­ся по фор­му­ле t = Q / q, где Q — объём ин­фор­ма­ции, q — cко­рость пе­ре­да­чи дан­ных.

Найдём сжа­тый объём: 20 · 0,5 = 10 Мбайт. Пе­ре­ведём Q из Мбайт в биты: 10 Мбай­т = 10 · 2 20 байт = 10 · 2 23 бит. Найдём общее время: t = 15 с + 2 с + 10 · 2 23 бит / 2 23 бит/с = 17 + 10 · 2 0 с = 27 с.

Общее время сов­па­да­ет с вре­ме­нем пе­ре­да­чи: t = 20 · 2 23 бит / 2 23 бит/с = 20 · 2 0 с = 20 с.

Таким об­ра­зом, спо­соб Б быст­рее на 27 − 20 = 7 с.

Про­из­во­дит­ся од­но­ка­наль­ная (моно) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 48 кГц и глу­би­ной ко­ди­ро­ва­ния 16 бит. За­пись длит­ся 2 ми­ну­ты, ее ре­зуль­та­ты за­пи­сы­ва­ют­ся в файл, сжа­тие дан­ных не про­из­во­дит­ся. Какое из при­ве­ден­ных ниже чисел наи­бо­лее близ­ко к раз­ме­ру по­лу­чен­но­го файла, вы­ра­жен­но­му в ме­га­бай­тах?

Так как ча­сто­та дис­кре­ти­за­ции 48 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 48000 зна­че­ний сиг­на­ла.

Глу­би­на ко­ди­ро­ва­ния – 16 бит = 2 байта, время за­пи­си 2 ми­ну­ты = 120 се­кунд, по­это­му для хра­не­ния ин­фор­ма­ции о такой за­пи­си по­тре­бу­ет­ся 48000 · 2 · 120 = 11520000 байт или 11520000/1024 2 = 10,99 Мб, что близ­ко к 11 Мб.

Пра­виль­ный ответ ука­зан под но­ме­ром 1.

Про­из­во­ди­лась двух­ка­наль­ная (сте­рео) зву­ко­за­пись с ча­сто­той дис­кре­ти­за­ции 64 кГц и 24-бит­ным раз­ре­ше­ни­ем. В ре­зуль­та­те был по­лу­чен файл раз­ме­ром 48 Мбайт, сжа­тие дан­ных не про­из­во­ди­лось. Опре­де­ли­те при­бли­зи­тель­но, сколь­ко вре­ме­ни (в ми­ну­тах) про­во­ди­лась за­пись. В ка­че­стве от­ве­та ука­жи­те бли­жай­шее к вре­ме­ни за­пи­си целое число.
По­яс­не­ние.

Так как ча­сто­та дис­кре­ти­за­ции 64 кГц, то за одну се­кун­ду за­по­ми­на­ет­ся 64000 зна­че­ний сиг­на­ла.

Глу­би­на ко­ди­ро­ва­ния 24 бита, т. е. 3 байта. Т. к. за­пись двух­ка­наль­ная, объём па­мя­ти, не­об­хо­ди­мый для хра­не­ния дан­ных од­но­го ка­на­ла, умно­жа­ет­ся на 2, по­это­му, так как по­тре­бо­ва­лось 48 Мбайт, один канал за­ни­ма­ет 24 Мбайт или 24·2 20 байт. Чтобы найти время, в те­че­ние ко­то­ро­го про­во­ди­лась за­пись, не­об­хо­ди­мо раз­де­лить най­ден­ный ин­фор­ма­ци­он­ный объем на глу­би­ну ко­ди­ро­ва­ния и на ча­сто­ту дис­кре­ти­за­ции:

Тем самым, время за­пи­си при­мер­но равно 2 ми­ну­там.

Задание 9 № 14
У Васи есть до­ступ к Ин­тер­нет по вы­со­ко­ско­рост­но­му од­но­сто­рон­не­му ра­дио­ка­на­лу, обес­пе­чи­ва­ю­ще­му ско­рость по­лу­че­ния им ин­фор­ма­ции 2 18 бит в се­кун­ду. У Пети нет ско­рост­но­го до­сту­па в Ин­тер­нет, но есть воз­мож­ность по­лу­чать ин­фор­ма­цию от Васи по низ­ко­ско­рост­но­му те­ле­фон­но­му ка­на­лу со сред­ней ско­ро­стью 2 14 бит в се­кун­ду. Петя до­го­во­рил­ся с Васей, что тот будет ска­чи­вать для него дан­ные объ­е­мом 6 Мбайт по вы­со­ко­ско­рост­но­му ка­на­лу и ре­транс­ли­ро­вать их Пете по низ­ко­ско­рост­но­му ка­на­лу. Ком­пью­тер Васи может на­чать ре­транс­ля­цию дан­ных не рань­ше, чем им будут по­лу­че­ны пер­вые 512 Кбайт этих дан­ных. Каков ми­ни­маль­но воз­мож­ный про­ме­жу­ток вре­ме­ни (в се­кун­дах), с мо­мен­та на­ча­ла ска­чи­ва­ния Васей дан­ных, до пол­но­го их по­лу­че­ния Петей? В от­ве­те ука­жи­те толь­ко число, слово «се­кунд» или букву «с» до­бав­лять не нужно.
По­яс­не­ние.

Нужно опре­де­лить, сколь­ко вре­ме­ни будет пе­ре­да­вать­ся файл объ­е­мом 6 Мбайт по ка­на­лу со ско­ро­стью пе­ре­да­чи дан­ных 2 14 бит/с; к этому вре­ме­ни нужно до­ба­вить за­держ­ку файла у Васи (пока он не по­лу­чит 512 Кбайт дан­ных по ка­на­лу со ско­ро­стью 2 18 бит/с).

Пе­ре­ведём объём ин­фор­ма­ции в Мб в биты: Q = 6 Мб = 6 * 2 20 байт = 6 * 2 23 бит.

Время за­держ­ки: = 512 кб / 2 18 бит/с = 2 (9 + 10 + 3) — 18 c = 2 4 с = 16 c.

Время скчи­ва­ния дан­ных Петей: = 6 * 2 23 бит / 2 14 бит/с = 6 * 2 9 с = 3072 c.

Пол­ное время: = (3072 + 16) c = 3088 c.

Задание 9 № 15
До­ку­мент объёмом 6 Мбайт можно пе­ре­дать с од­но­го ком­пью­те­ра на дру­гой

А. Сжать ар­хи­ва­то­ром, пе­ре­дать архив по ка­на­лу связи, рас­па­ко­вать.

Б. Пе­ре­дать по ка­на­лу связи без ис­поль­зо­ва­ния ар­хи­ва­то­ра.

· ско­рость пе­ре­да­чи дан­ных по ка­на­лу связи со­став­ля­ет 2 22 бит в се­кун­ду;

· объём сжа­то­го ар­хи­ва­то­ром до­ку­мен­та равен 50% от ис­ход­но­го;

· время, тре­бу­е­мое на сжа­тие до­ку­мен­та, — 6 се­кунд, на рас­па­ков­ку — 2 се­кун­ды.

Какой спо­соб быст­рее и на сколь­ко?

В от­ве­те на­пи­ши­те букву А, если быст­рее спо­соб А, или Б, если быст­рее спо­соб Б. Сразу после буквы на­пи­ши­те, на сколь­ко се­кунд один спо­соб быст­рее дру­го­го.

На­при­мер, если спо­соб Б быст­рее спо­со­ба А на 23 се­кун­ды, в от­ве­те нужно на­пи­сать Б23.

Еди­ни­цы из­ме­ре­ния «се­кунд», «сек.», «с» и т. п. к от­ве­ту до­бав­лять не нужно.
По­яс­не­ние.

Спо­соб А. Найдём сжа­тый объём: 6 · 0,5 = 3 Мбайт. Пе­ре­ведём Q из Мбайт в биты: 3 Мбай­т = 3 · 2 20 байт = 3 · 2 23 бит. Найдём общее время: t = 6 с + 2 с + 3 · 2 23 бит / 2 22 бит/с = 8 с + 6 с = 14 с.

Спо­соб Б. Общее время сов­па­да­ет с вре­ме­нем пе­ре­да­чи: t = 6 · 2 23 бит / 2 22 бит/с = 12 с.

Таким об­ра­зом, спо­соб Б быст­рее на 14 − 12 = 2 с.

infourok.ru

Виртуальная реальность. Пение при помощи компьютерной программы. Синтезаторы женского голоса.

Я уже ставил тему о виртуальной реальности.
Но вот сейчас наконец опять занялся музыкой — своим любимым делом.
Через компьютерные программы можно добиваться прекрасных результатов, прекрасных звучаний. И вот понадобилось мне звучание женского голоса. Вернее имитации женского голоса, которая может петь.

Раньше такие программы давали только возможность «петь» со звучанием скажем А. а. а. а. а , ну или другими, но весьма примитивными. Но с тем чем я столкнулся сейчас меня просто поразило.
Имитируют уже не просто пение , а и речь, То есть можно уже в программе давать слова, стихи, и переводить это все в музыку, чтобы голоса стали петь песни.
Да, конечно голоса еще по своему тембру весьма примитивные. Там не будет вокала Карузо, Собинова, Лучано Паваротти , или Мария Каллас, Монсеррат Кабалье — нет конечно!
Но все же.

Просто поразительно, что компьютерные программы могут имитировать живой человеческий голос, нет не просто речь (это уже давно было) но и пение.

А с другой стороны вот этот век можно назвать Век виртуальной реальности.
И конечно возникает множество проблем.
Компьютеры еще не могут соперничать с человеком, но . пока не могут.

И я начинаю эту тему с большой тревогой.
Да много прекрасного, нового, но.

Тема очень обширная, сложная. Но давайте сперва познакомимся то о чем я говорил, то с чем столкнулся.
Для кого то это может уже и не в новинку, и уже давно все это слышали и знали.
И все же.

Комментарии (31)

Давайте послушаем сперва о чем идет речь.
Только попытайтесь понять (вы не сразу это поймете) что все голосы — синтезированные в компьютере, как и слова песни, как и мелодии песни.

Это написано в программе Yamaha Vocaloid 4

И вот еще. Это уже явно видно. Но послушайте:

Это написано в программе Yamaha Vocaloid 3

Записывается это вот так в программе

Синтезировать можно и мужской голос.

поет довольно однообразно, но голос кажется живым!

Если уж мы заговорили о компьютерных программах для сочинения музыки, то я считаю что за ними будущее.

Вот посмотрите эту громоздкую студию с синтезаторами.

Вот это все можно уместить в компьютере домашнего пользования и использовать множество программ которые синтезируют звуки.

Для этого достаточно программ виртуальных синтезаторов. и одну программу, котоаря умещает множество виртуальных синтезаторов в одной платформе.

да нужна еще МИДИ клавиатура.
И ВСЕ!

И не надо этих громоздких студий.

И вот этих чудовищных монстров.

А все начиналось вот так!

Это один из первых синтезаторов голоса.

Рассмотрен первый электрический синтезатор речи, электронный аппарат (Voice Operation DEmonstratoR) был разработан Homer Dudley в Bell Labs и продемонстрировал как на 1939 Нью-йоркской Всемирной выставке и 1939 Золотые ворота Международной выставке. Трудно использовать и трудно работать, тем не менее, электронный аппарат проложил путь для будущей машины сгенерированных речи.

А синтезированный электронный звуковой инструмент был изобретен в 1920 году!!

Терменво́кс (theremin или thereminvox) — электромузыкальный инструмент, созданный в 1920 году советским изобретателем Львом Сергеевичем Терменом в Петрограде.

На нем играли передвижением руки
И звучал он вот так

В 1919 году руководитель Физико-технического института в Петрограде Абрам Иоффе пригласил к себе на работу Льва Термена как специалиста по радиотехнике. Новому сотруднику была поставлена задача измерения диэлектрической постоянной газов при различных давлениях и температурах [1] . Поначалу измерительная установка Термена представляла собой генератор электрических колебаний на катодной лампе. Испытуемый газ в полости между металлическими пластинами был элементом колебательного контура — конденсатором, который влиял на частоту электрических колебаний. В процессе работы над повышением чувствительности установки возникла идея объединения двух генераторов, один из которых давал колебания определённой неизменной частоты. Сигналы от обоих генераторов подавались на катодное реле, на выходе которого формировался сигнал с разностной частотой. Относительное изменение разностной частоты от параметров испытуемого газа было намного больше. При этом, если разностная частота попадала в звуковой диапазон, то сигнал можно было принимать на слух.

Прибор оказался очень чувствительным. Он реагировал на малейшие изменения ёмкости колебательного контура, которая менялась от приближения руки. Соответственно менялась и частота звука. Подобрать мелодию не составляло для Термена большого труда, так как он с детства увлекался музыкой. В ноябре 1920 года на заседании кружка механиков имени профессора Кирпичёва физик Термен дал свой первый концерт [1] . Изобретённый им электронный музыкальный инструмент первоначально был назван этеротон (звук из воздуха, эфира). Вскоре он был переименован в честь автора и стал называться терменвокс.

При создании инструмента (помимо электрической генерации звука) Термен обращал особое внимание на «возможность весьма тонкого управления без какой-либо затраты механической энергии, требуемой для нажатия струн или клавиш. Исполнение музыки на электрическом инструменте должно производиться, например, свободными движениями пальцев в воздухе, аналогично дирижерским жестам, на расстоянии от инструмента».

В марте 1922 года Л. С. Термен и член коллегии Наркомпочтеля председатель Радиосовета А. М. Николаев приехали в Кремль к В. И. Ленину для показа инструмента. Л. С. Термен после собственноручного исполнения «Этюда» Скрябина, «Лебедя» Сен-Санса и «Жаворонка» Глинки стал помогать В. И. Ленину играть на терменвоксе. Однако вскоре оказалось, что Ленин может играть самостоятельно. Он завершил исполнение «Жаворонка» Глинки без помощи изобретателя. Кроме того, была продемонстрирована сигнализация на ёмкостном реле, принцип действия которого был схож с принципом действия терменвокса

Высоко оценив перспективы изобретения, Ленин написал записку наркомвоенмору Льву Троцкому:

Обсудить, нельзя ли уменьшить караулы кремлёвских курсантов посредством введения в Кремле электрической сигнализации? (Один инженер, Термен, показывал нам в Кремле свои опыты…)

В результате, несмотря на все трудности того времени, был подписан декрет о создании физико-технического отдела при Государственном рентгенологическом и радиологическом институте, где изобретатель продолжил свои исследования.

Классический терменвокс
В первых, классических, моделях, созданных самим Львом Терменом, управление звуком происходит в результате свободного перемещения рук исполнителя в электромагнитном поле вблизи двух металлических антенн. Исполнитель играет стоя. Изменение высоты звука достигается путём приближения руки к правой антенне, в то время как громкость звука управляется за счёт приближения другой руки к левой антенне. Именно эта модель терменвокса получила самое широкое распространение в мире. Существует целый ряд фирм, производящих инструменты этого типа.

Конечно в исполнении электронном очень мало души. Вернее ее совсем нет. И между прочим в электронных инструментах тот же порок. впрочем саунды бывают весьма интересными. они фантастические, и привлекательные, но замечено, что особенно в дигитальных звуках ( не аналоговых) присутствует мертвость. Их можно слушать и наслаждаться , даже самыми прекрасными непродолжительное время, а потом они надоедают, даже вызывают отторжение.
Молодое поколение не улавливает эту мертвость звука, им все равно.
Любой дигитальный звук — придает мертвость.
Вот мы слушаем DVD диски , даже концертов классической музыки и не улавливаем разницу. Дело не в звучании в помещении, в концертном зале, в потому что записть хоть и производилась качественная, однако все это переведено в дигитальный вариант. Там идут «срезки» — пилообразность.

Единица и нуль — и все. Нет ничего между ними.
Конечно чем качественней запись, тем вот этих срезки частот будет меньше заметны.

Это как в видео изображении. Чем мельче зерна монитора, тем качественней изображение. Но какие бы они не были раскрашенными в фотошопе, они все равно не сравняться с глазом человека.

Вот и здесь в этом пении есть эта дигитальность. И к тому же нет души в пении.
оттенки уже добавляют в пении элекронном и голос звучит не как у робота. и все же недостаточно.

Но что будет дальше? Потом?

Параметры цифрового звука.

Биты, герцы, shaped dithering.

Что скрывается за этими понятиями? При разработке стандарта аудио компакт дисков (CD Audio) были приняты значения 44 кГц, 16 бит и 2 канала (т.е. стерео). Почему именно столько? В чём причина такого выбора, а также — почему предпринимаются попытки повысить эти значения до, скажем, 96 кГц и 24 или даже до 32х битов.

Разберёмся сначала с разрешением сэмплирования — то есть с битностью. Так уж получается, что выбирать приходится между числами 16, 24 и 32. Промежуточные значения были бы, конечно, удобнее в смысле звука, но слишком неприятны для использования в цифровой технике (весьма спорное утверждение, если учесть, что многие АЦП имеют 11 или 12 разрядный цифровой выход — прим. сост.).

За что отвечает этот параметр? В двух словах — за динамический диапазон. Диапазон одновременно воспроизводимых громкостей — от максимальной амплитуды (0 децибел) до той наименьшей, которую позволяет передать разрешение, например, около минус 93 децибел для 16 битного аудио. Как ни странно, это сильно связано с уровнем шумов фонограммы. В принципе, для 16 битного аудио вполне возможна передача сигналов мощностью и в -120 дБ, однако эти сигналы будет затруднительно применять на практике из-за такого фундаментального понятия как шум дискретизации. Дело в том, что при взятии цифровых значений мы всё время ошибаемся, округляя реальное аналоговое значение до ближайшего возможного цифрового. Самая маленькая возможная ошибка — нулевая, максимально же мы ошибаемся на половину последнего разряда (бита, далее термин младший бит будет сокращаться до МБ). Эта ошибка даёт нам так называемый шум дискретизации — случайное несоответствие оцифрованного сигнала оригиналу. Этот шум носит постоянный характер и имеет максимальную амплитуду равную половине младшего разряда. Это можно рассматривать как случайные значения, подмешанные в цифровой сигнал. Иногда это называется шум округления или квантования (что является более точным названием, так как кодирование амплитуды называется квантованием, а дискретизацией называется процесс преобразования непрерывного сигнала в дискретную (импульсную) последовательность — прим. сост.).

Остановимся подробнее на том, что понимается под мощностью сигналов, измеряемой в битах. Самый сильный сигнал в цифровой обработке звука принято принимать за 0 дБ, это соответствует всем битам, поставленным в 1. Если старший бит (далее СБ) обнулить, получившееся цифровое значение будет в два раза меньше, что соответствует потере уровня на 6 децибел (10 * log(2) = 6). Таким образом, обнуляя единички от старших разрядов к младшим, мы будем уменьшать уровень сигнала на шесть децибел. Понятно, что минимальный уровень сигнала (единичка в младшем разряде, а все остальные разряды — нули) (N-1)*6децибел, где N — разрядность отсчета (сэмпла). Для 16 разрядов получаем уровень самого слабого сигнала — 90 децибел.

Когда мы говорим «половина младшего разряда», мы имеем в виду не -90/2, а половину шага до следующего бита — то есть ещё на 3 децибела ниже, минус 93 децибел.

Возвращаемся к выбору разрешения оцифровки. Как уже было сказано, оцифровка вносит шум на уровне половины младшего разряда, это говорит о том, что запись, оцифрованная в 16 бит, постоянно шумит на минус 93 децибел. Она может передавать сигналы и тише, но шум всё равно остаётся на уровне -93 дБ. По этому признаку и определяется динамический диапазон цифрового звука — там, где соотношение сигнал/шум переходит в шум/сигнал (шумов больше, чем полезного сигнала), находится граница этого диапазона снизу. Таким образом, главный критерий оцифровки — сколько шума мы можем себе позволить в восстановленном сигнале? Ответ на этот вопрос зависит отчасти от того, сколько шума было в исходной фонограмме. Важный вывод — если мы оцифровываем нечто с уровнем шумов минус 80 децибел — нет совершенно никаких причин цифровать это в более чем 16 бит, так как, с одной стороны, шумы -93 дБ добавляют очень мало к уже имеющимся огромным (сравнительно) шумам -80 дБ, а с другой стороны — тише чем -80 дБ в самой фонограмме уже начинается шум/сигнал, и оцифровывать и передавать такой сигнал просто не нужно.

Теоретически это единственный критерий выбора разрешения оцифровки. Больше мы не вносим совершенно никаких искажений или неточностей. Практика, как ни странно, почти полностью повторяет теорию. Этим и руководствовались те люди, которые выбирали разрешение 16 бит для аудио компакт дисков. Шум минус 93 децибел — довольно хорошее условие, которое почти точно соответствует условиям нашего восприятия: разница между болевым порогом (140 децибел) и обычным шумовым фоном в городе (30-50 децибел) составляет как раз около сотни децибел, и если учесть, что на уровне громкости, приносящем боль, музыку не слушают — что ещё несколько сужает диапазон — получается, что реальные шумы помещения или даже аппаратуры получаются гораздо сильнее шумов квантования. Если мы можем расслышать уровень под минус 90 децибел в цифровой записи — мы услышим и воспримем шумы квантования, иначе — мы просто никогда не определим, оцифрованное это аудио или живое. Никакой другой разницы в смысле динамического диапазона просто нет. Но в принципе, человек может осмысленно слышать в диапазоне 120 децибел, и было бы неплохо сохранить весь этот диапазон, с чем 16 бит, казалось бы, не справляются.

Но это только на первый взгляд: с помощью специальной техники, называемой shaped dithering, можно изменить частотный спектр шумов дискретизации, почти полностью вынести их в область более 7-15 кГц. Мы как бы меняем разрешение по частоте (отказываемся от воспроизведения тихих высоких частот) на дополнительный динамический диапазон в оставшемся отрезке частот. В сочетании с особенностями нашего слуха — наша чувствительность к выкидываемой области высоких частот на десятки дБ ниже чем в основной области (2-4 кГц) — это делает возможным относительно бесшумную передачу полезных сигналов дополнительно ещё на 10-20 дБ тише, чем -93 дБ — таким образом, динамический диапазон 16 битного звука для человека составляет около 110 децибел. Да и вообще — одновременно человек просто не может слышать звуки на 110 децибел тише, чем только что услышанный громкий звук. Ухо, как и глаз, подстраивается под громкость окружающей действительности, поэтому одновременный диапазон нашего слуха составляет сравнительно мало — около 80 децибел. Поговорим о dithring-е подробнее после обсуждения частотных аспектов.

Для компакт дисков выбрана частота дискретизации 44100 Гц. Бытует мнение (основанное на неверном понимании теоремы Котельникова-Найквиста), что при этом воспроизводятся все частоты вплоть до 22.05 кГц, однако это не совсем так. Однозначно можно сказать лишь то, что частот выше 22.05 кГц в оцифрованном сигнале нет. Реальная же картина воспроизведения оцифрованного звука всегда зависит от конкретной техники и всегда не так идеальна, как хотелось бы, и как соответствует теории. Все зависит от конкретного ЦАП (цифро-аналогового преобразователя, отвечающего за получение звукового сигнала из цифровой последовательности).

Разберемся сначала, что нам хотелось бы получить. Человек среднего возраста (скорее молодой) может чувствовать звуки от 10 Гц до 20 кГц, осмысленно слышать — от 30 Гц до 16 кГц. Звуки выше и ниже воспринимаются, но не составляют акустических ощущений. Звуки выше 16 кГц ощущаются как раздражающий неприятный фактор — давление на голову, боль, особо громкие звуки приносят такой резкий дискомфорт, что хочется покинуть помещение. Неприятные ощущения настолько сильны, что на этом основано действие охранных устройств — несколько минут очень громкого звука высокой частоты сведут с ума кого угодно, и воровать что либо в такой обстановке становится решительно невозможно. Звуки ниже 30 — 40 Гц при достаточной амплитуде воспринимаются как вибрация, исходящая от объектов (колонок). Вернее будет даже сказать так — просто вибрация. Человек акустически почти не определяет пространственное положение настолько низких звуков, поэтому в ход уже идут другие органы чувств — осязательные, мы чувствуем такие звуки телом.

Для передачи звука как он есть было бы неплохо сохранить весь воспринимаемый диапазон от 10 Гц до 20 кГц. С низкими частотами в теории в цифровой записи проблем совершенно никаких нет (но есть проблемы при передаче этих частот по электрическим цепям и воспроизведении их через малогабаритные стереоколонки или наушники). Так на выходе звуковых плат обычно стоит усилитель мощности, который и подаёт сигнал на стереоколонки. Этот усилитель в дешевых платах совместно с цепью обратной связи, а также паразитными емкостями составляет фильтр нижних частот, который «заваливает басы».

С высокими частотами все немного хуже, по крайней мере точно сложнее. Почти вся суть усовершенствований и усложнений ЦАП и АЦП направлена как раз на более достоверную передачу высоких частот. Под «высокими» подразумеваются частоты сравнимые с частотой дискретизации — то есть в случае 44.1 кГц это 7-10 кГц и выше.

Представим синусоидальный сигнал с частотой 14 кГц, оцифрованный с частотой дискретизации 44.1 кГц. На один период входной синусоиды приходится около трех точек (отсчетов), и чтобы восстановить исходную частоту в виде синусоиды, надо проявить некоторую фантазию. Процесс восстановления формы сигнала по отсчетам происходит и в ЦАП, этим занимается восстанавливающий фильтр. И если сравнительно низкие частоты представляют собой почти готовые синусоиды, то форма и, соответственно, качество восстановления высоких частот лежит целиком на совести восстанавливающей системы ЦАП.Таким образом, чем ближе частота сигнала к одной второй частоты дискретизации, тем сложнее восстановить форму сигнала.

Это и составляет основную проблему при воспроизведении высоких частот. Проблема, однако, не так страшна, как может показаться. Во всех современных ЦАП используется технология пересэмплирования (multirate), которая заключается в цифровом восстановлении до в несколько раз более высокой частоты дискретизации, и в последующем переводе в аналоговый сигнал на повышенной частоте. Таким образом проблема восстановления высоких частот перекладывается на плечи цифровых фильтров, которые могут быть очень качественными. Настолько качественными, что в случае дорогих устройств проблема полностью снимается — обеспечивается неискаженное воспроизведение частот до 19-20 кГц. Пересэмплирование применяется и в не очень дорогих устройствах, так что в принципе и эту проблему можно считать решенной. Устройства в районе $30 — $60 (звуковые карты) или музыкальные центры до $600, обычно аналогичные по ЦАПу этим звуковым картам, отлично воспроизводят частоты до 10 кГц, сносно — до 14 — 15, и кое-как остальные. Этого вполне достаточно для большинства реальных музыкальных применений, а если кому-то нужно большее качество — он найдет его в устройствах профессионального класса, которые не то чтобы сильно дороже — просто они сделаны с умом.

Вернемся к dithering-у — посмотрим, как можно с пользой увеличить динамический диапазон за пределы 16 бит.

Идея dithering-а заключается в том, чтобы подмешать в сигнал шум. Как ни странно это звучит — для того чтобы уменьшить шумы и неприятные эффекты квантования, мы добавляем свой шум. Рассмотрим пример — воспользуемся возможностью CoolEdit-а работать в 32х битах. 32 бита — это в 65 тысяч раз большая точность, нежели 16 бит, поэтому в нашем случае 32х битный звук можно считать аналоговым оригиналом, а перевод его в 16 бит — оцифровкой. Пусть в исходном 32х битном звуке самый высокий уровень звука соответствует минус 110 децибел. Это с запасом гораздо тише динамического диапазона 16 битного звука, для которого самый слабый различимый звук соответствует уровню минус 90 децибел . Поэтому если просто округлить данные до 16 бит — мы получим полную цифровую тишину.

Добавим в сигнал «белый» шум (т.е. широкополосный и равномерный по всей полосе частот) с уровнем минус 90 децибел, примерно соответствующий по уровню шумам квантования. Теперь, если преобразовать эту сместь сигнала и «белого» шума в 16 бит (возможны только целые значения — 0, 1, -1, . ), то окажется, что какая-то часть сигнала осталась. Там, где исходный сигнал имел больший уровень, больше единиц, где меньший — нулей.

Для экспериментальной проверки изложенного выше способа можно воспользоваться звуковым редактором Cool Edit (или любым другим, поддерживающим 32 битный формат). Чтобы услышать то, что получится, следует усилить сигнал на 14 бит (на 78 дБ).

Результат — зашумленный 16 битный звук, содержащий исходный сигнал, который имел уровень минус 110 децибел. В принципе, это и есть стандартный способ расширения динамического диапазона, получающийся часто чуть ли не сам собой — шума везде хватает. Однако само по себе это довольно бессмысленно — уровень шумов дискретизации так и остаётся на прежнем уровне, а передавать сигнал слабее шума — занятие не очень понятное с точки зрения логики. (Весьма ошибочное мнение, так как передача сигнала с уровнем, который меньше уровня шумов, — это один из фундаментальных методов кодирования данных. Прим. сост.)

Более сложный способ — shaped dithering, заключается в том, что раз мы всё равно не слышим высоких частот в очень тихих звуках, значит, следует основную мощность шума направить в эти частоты, при этом можно даже воспользоваться шумом более высокого уровня — я воспользуюсь уровнем в 4 младших разряда (два бита в 16 битном сигнале). Полученную смесь 32 битного сигнала и шума преобразуем в 16 битный сигнал, отфильтровываем верхние частоты (которые реально не воспринимаются человеком на слух) и повышаем уровень сигнала, чтобы можно было оценить результат.

Это уже вполне хорошая (для запредельно низкой громкости) передача звука, шумы примерно равняются по мощности самому звуку с исходным уровнем минус 110 децибел! Важное замечание: мы повысили реальные шумы дискретизации с половины младшего разряда (-93 дБ) до четырёх младших разрядов (-84 дБ), понизив слышимые шумы дискретизации с -93 дБ до примерно -110 дБ. Отношение сигнал/шум ухудшилось, но шум ушел в высокочастотную область и перестал быть слышимым, что дало существенное улучшение реального (воспринимаемого человеком) отношения сигнал/шум.

(Иными словами, поскольку мощность шума как бы «размазана» по частотному диапазону, то не пропуская верхние частоты, мы отбираем у него часть мощности, в результате чего во временном представлении сигналов улучшается соотношение сигнал/шум. — Прим. сост.)

Практически это уже уровень шумов дискретизации 20 битного звука. Единственное условие этой технологии — наличие частот для шума. 44.1 кГц звук даёт возможность размещать шум в неслышимых на тихой громкости частотах 10-20 кГц. А вот если оцифровывать в 96 кГц — частотная область для шума (неслышимая человеком) будет настолько велика, что при использовании shaped dithering 16 бит реально превращаются и во все 24.

[На заметку: PC Speaker — однобитное устройство, с однако довольно высокой максимальной частотой дискретизации (включения/выключения этого единственного бита). С помощью процесса, сходного по сути с dithering-ом, называемым скорее широтно-импульсная модуляция, на нём игрался довольно качественный цифровой звук — из одного бита и высокой частоты дискретизации вытягивались 5-8 бит низкой частоты, а фильтром высокочастотного шума выступала неспособность аппаратуры воспроизводить столь высокие частоты, как впрочем и наша неспособность их слышать. Лёгкий высокочастотный свист, однако — слышимая часть этого шума — был слышен.]

Таким образом, shaped dithering позволяет существенно понизить и без того низкие шумы дискретизации 16 битного звука, спокойно расширив таким образом полезный (бесшумный) динамический диапазон на всю область человеческого слуха. Поскольку сейчас уже всегда при переводе из рабочего формата 32 бит в конечный 16 бит для CD используется shaped dithering — наши 16 бит совершенно достаточны для полной передачи звуковой картины.

Следует отметить, что эта технология действует только на этапе подготовки материала к воспроизведению. Во время обработки качественного звука просто необходимо оставаться в 32х битах, чтобы не применять dithering после каждой операции, более качественно кодируя результаты обратно в 16 бит. Но если уровень шума фонограммы составляет более минус 60 децибел — можно без малейших зазрений совести вести всю обработку в 16 битах. Промежуточный dithering обеспечит отсутствие искажений округления, а добавленный им шум в сотни раз слабее уже имеющегося и поэтому совершенно безразличен.
Q: Почему говорят, что 32-х битный звук качественнее 16 битного?
A1: Ошибаются.
A2: [Имеют в виду немного другое: при обработке или записи звука нужно использовать большее разрешение. Этим пользуются всегда. Но в звуке как в готовой продукции разрешение более 16 бит не требуется.]

Q: Имеет ли смысл увеличивать частоту дискретизации (например до 48 кГц или до 96)?
A1: Не имеет. При хоть сколь грамотном подходе в конструировании ЦАП 44 кГц передают весь необходимый частотный диапазон.
A2: [Имеют в виду немного другое: это имеет смысл, но лишь при обработке или записи звука.]

Q: Почему всё же идет внедрение больших частот и битности?
A1: Прогрессу важно двигаться. Куда и зачем — уже не столь важно.
A2: Многие процессы в этом случае происходят легче. Если, например, устройство собирается обработать звук — ему будет легче это сделать в 96 кГц / 32 бита. Почти все DSP используют 32 бита для обработки звука, и возможность забыть про преобразования — облегчение разработки и всё же небольшое увеличение качества. Да и вообще — звук для дальнейшей обработки имеет смысл хранить в большем разрешении, нежели 16 бит. Для hi-end устройств которые лишь воспроизводят звук это абсолютно безразлично.

Q: 32х или 24х или даже 18 битные ЦАП лучше чем 16 битные?
A: В общем случае — нет. Качество преобразования нисколько не зависит от битности. В AC’97 кодеке (современная звуковая карта до $50) используется 18 битный кодек, а в картах за $500, звук которых с этой ерундой даже сравнивать нельзя — 16 битный. Это не имеет абсолютно никакого значения для воспроизведения 16 битного звука.
Стоит также иметь в виду, что большинство ЦАПов обычно реально воспроизводят меньше бит, чем берутся. Например, реальный уровень шумов типичного дешевого кодека составляет -90 дБ, что составляет 15 бит, и даже если он сам 24х битный — вы не получите никакой отдачи от ‘лишних’ 9 бит — результат их работы, даже если он имелся, потонет в их же собственном шуме. Большинство же дешевых устройств просто игнорируют дополнительные биты — они просто реально не идут в расчет в их процессе синтеза звука, хотя и поступают на цифровой вход ЦАПа.

Q: А для записи?
A: Для записи — лучше иметь АЦП большей разрядности. Опять же, большей реальной разрядности. Разрядность ЦАПа должна соответствовать уровню шумов исходной фонограммы, или просто быть достаточной для достижения желаемо низкого уровня шума.
Также удобно бывает иметь разрядность с запасом, чтобы использовать повышенный динамический диапазон для менее точной регулировки уровня записи. Но помните — вы должны всегда попадать в реальный диапазон кодека. В реальности 32х битный АЦП, к примеру, почти полностью бессмысленнен, так как младший десяток бит будут просто непрерывно шуметь — настолько малого шума (под -200 дБ) просто не бывает в аналоговом музыкальном источнике.

Требовать от звука повышенной разрядности или частоты дискретизации, по сравнению с CD, лучшего качества — не стоит. 16 бит / 44 кГц, доведённые до предела с помощью shaped dithering, вполне способны полностью передать интересующую нас информацию, если дело не идет о процессе звукообработки. Не стоит тратить место на лишние данные готового материала, также как не стоит ожидать повышенного качества звука от DVD-Audio с его 96 кГц / 24 бит. При грамотном подходе при создании звука в формате стандартного CD мы будем иметь качество, которое просто не нуждается в дальнейшем улучшении, а ответственность за правильную звукозапись конечных данных давно взяли на себя разработанные алгоритмы и люди, умеющие правильно их использовать. В последние несколько лет вы уже не найдете нового диска без shaped dithering и других приемов доведения качества звукопередачи до предела. Да, ленивым или просто криворуким будет удобнее давать готовый материал в 32х битах и 96 кГц, но по идее — стоит ли это в несколько раз больших аудио данных.

www.decoder.ru