Высокоэффективные системы сжатия медиа контента телевизионных программ, оценка качества и их способы дальнейшего совершенствования

Аннотация

Актуальность и востребованность темы диссертации. В мире проводятся исследования, направленные на разработку и усовершенствование высокоэффективных систем сжатия, позволяющих повысить качество медиа контента телевизионных программ и увеличить количество передаваемых каналов. «Если учесть, что к 2025 году глобальная база данных возрастет до 163 ЗБ (зеттабайт - триллион гигабайт)»1, то уменьшение большого объема, занимаемую аудио-видеосигналами телевизионных программ с сохранением качества звука и изображения является одной из актуальных проблем. В этой связи в зарубежных странах, в том числе США, Великобритании, Японии, Франции, Италии, Бельгии, Испании, Швейцарии, Германии, Китае, России и других государствах достигнуты определенные результаты, в которых особое внимание уделяется созданию высокоэффективной системы сжатия медиа контента телевизионных программ.
С приобретением независимости в нашей республике особое внимание уделялось развитию средств массовой информации, техническому и технологическому переходу на цифровое телевидение, а также улучшению систем передачи и приема медиаконтента телевизионных программ. В этом отношении достигнуты значительные результаты в предоставлении населению качественного изображения и звука с помощью цифрового телевещания, в том числе налажено производство приемных устройств цифровых видеосигналов. Вместе с тем требуется совершенствование высокоэффективных систем сжатия сигналов изображения и звука исходя из современных требований. В Стратегии действий по дальнейшему развитию Республики Узбекистан определены задачи, в частности «... усиление роли средств массовой информации, ... установка и эксплуатация 66 высокомощных и 328 маломощных передатчиков цифрового телевидения, ... обеспечить 100 процентный охват населения цифровым телевидением». Для выполнения этих задач одним из важных вопросов являются повышение качества изображения и звука передаваемых телевизионных сигналов, уменьшение объема медиа контента телевизионных программ, создание возможности внедрения дополнительных сервисных услуг.
В мире одной из актуальных задач является разработка систем сжатия изображений и звука на основе модифицированного дискретно-косинусного и вейвлет преобразований и их трехмерных реализаций, алгоритмов блочного масштабирования, быстрого преобразования Фурье и различных их комбинированных методов. В этом отношении особое внимание уделяется осуществлению целенаправленных научных исследований, в том числе: разработка систем кодирования медиа контента телевизионных программ позволяющих уменьшить объем в сто и более раз с сохранением качество звука и изображений, разработка методов оценки качества восстановленных изображений и звука, усовершенствование разработанных систем, разработка методов согласования созданного нового стандарта Н.265 с предыдущим стандартом Н.264.
Данное диссертационное исследование в определенной степени служит выполнению задач, предусмотренных в Указе Президента Республики Узбекистан №УП-4947 от 7 февраля 2017 года «О стратегии действий по дальнейшему развитию Республики Узбекистан», Постановлениях Президента Республики Узбекистан №ПП-1730 от 21 марта 2012 года «О мерах по дальнейшему внедрению и развитию современных информационнокоммуникационных технологий», №ПП-1741 от 17 апреля 2012 года «О государственной программе по техническому и технологическому переходу на цифровое телевещание в Республике Узбекистан», постановлении Кабинета Министров Республики Узбекистан №24 от 1 февраля 2012 года «О мерах по созданию условий для дальнейшего развития компьютеризации и информационно-коммуникационных технологий на местах», а также в других нормативно-правовых документах, принятых в данной сфере.
Целью исследования является разработка высокоэффективной системы сжатия медиа контента телевизионных программ, уменьшающей их объем в сто и более раз с сохранением хорошего качества изображения и звука.
Научная новизна исследования заключается в следующем:
создан метод яркостного преобразования, приводящий изображения в однородный вид с помощью блоков адаптивно изменяющими размерами;
разработаны метод и алгоритм межаудиокадровой обработки, увеличивающий коэффициент сжатия аудиосигналов ТВ программ;
создан алгоритм межкадрового масштабирования, повышающий качество изображения при больших коэффициентах сжатия;
разработан метод сжатия видеосигналов ТВ программ на основе межкадрового масштабирования, увеличивающий качество изображения, с яркостным преобразованием, использующий блоки переменного размера;
разработана структурная схема и сформирована элементная база аудиовидео кодека.
Заключение
Представлены следующие выводы по теме диссертации «Высокоэффективные системы сжатия медиа контента телевизионных программ, оценка качества и способы их дальнейшего совершенствования»:
1. Разработаны методы и алгоритмы эффективного сжатия аудиовидеосигналов ТВ программ на основе яркостных преобразований, использующих переменные блоки усреднения. При применении, которое позволяет увеличить быстродействие преобразования и сжимать без потерь данных и соответственно, восстанавливать изображения без ухудшения качества.
2. Разработан межкадрово-масштабирующий алгоритм, позволяющий устранить временную избыточность изображений. Экспериментальные исследования показали, что на изображениях без мелких деталей применение данного метода позволяет обеспечить хорошее качество изображений при результирующем сжатии в сто раз и уменьшить объем выходных аудиовидео файлов в 1,2 раза по сравнению с существующими кодеками.
3. Разработан метод и алгоритм сжатия аудиосигнала на основе устранения временной избыточности звукового сигнала, применение которого позволяет увеличить итоговое сжатие звуковых сигналов в 1.1 раза по сравнению с существующими кодеками и уменьшить объем выходных файлов в 1,05-1,1 раза (5-10%) в зависимости от сюжета программы.
4. Разработан измеритель средней яркости изображений, показывающий подобие двух кадров, который позволяет наиболее точно найти подобные кадры.
5. Разработан корректор четкости декодированных изображений, позволяющий получить высококачественное изображение, исправляя значения, полученные при восстановлении, с использованием базисных функций.
6. Разработаны измерители резкости и среднеквадратического отклонения значений пикселей сравниваемых изображений для оценки полученных результатов восстановления по сравнению с исходными, позволяющий объективно оценить погрешности кодирования.
7. Разработана структурная схема устройства сжатия аудиовидеосигналов на основе вейвлет преобразований яркостей изображений и фрактально-спектральной обработки аудиосигналов для внедрения в государственном унитарном предприятии «O‘zbckiston MTRK mcdiamarkazi» была реализована на микропроцессорном устройстве telcstrcam pipeline dual HD. В результате применения разработанной системы эффективного кодирования аудио-видеосигналов уменьшился объем выходных сигналов в 1,2 раза, что позволило хранить на 20% больше информации на сервере.

CC BY f
1-44
33

Скачивания

Данные скачивания пока недоступны.
Поделиться
Носиров, Х. (2023). Высокоэффективные системы сжатия медиа контента телевизионных программ, оценка качества и их способы дальнейшего совершенствования. Каталог авторефератов, 1(1), 1–44. извлечено от https://www.inlibrary.uz/index.php/autoabstract/article/view/49323
Crossref
Сrossref
Scopus
Scopus

Аннотация

Актуальность и востребованность темы диссертации. В мире проводятся исследования, направленные на разработку и усовершенствование высокоэффективных систем сжатия, позволяющих повысить качество медиа контента телевизионных программ и увеличить количество передаваемых каналов. «Если учесть, что к 2025 году глобальная база данных возрастет до 163 ЗБ (зеттабайт - триллион гигабайт)»1, то уменьшение большого объема, занимаемую аудио-видеосигналами телевизионных программ с сохранением качества звука и изображения является одной из актуальных проблем. В этой связи в зарубежных странах, в том числе США, Великобритании, Японии, Франции, Италии, Бельгии, Испании, Швейцарии, Германии, Китае, России и других государствах достигнуты определенные результаты, в которых особое внимание уделяется созданию высокоэффективной системы сжатия медиа контента телевизионных программ.
С приобретением независимости в нашей республике особое внимание уделялось развитию средств массовой информации, техническому и технологическому переходу на цифровое телевидение, а также улучшению систем передачи и приема медиаконтента телевизионных программ. В этом отношении достигнуты значительные результаты в предоставлении населению качественного изображения и звука с помощью цифрового телевещания, в том числе налажено производство приемных устройств цифровых видеосигналов. Вместе с тем требуется совершенствование высокоэффективных систем сжатия сигналов изображения и звука исходя из современных требований. В Стратегии действий по дальнейшему развитию Республики Узбекистан определены задачи, в частности «... усиление роли средств массовой информации, ... установка и эксплуатация 66 высокомощных и 328 маломощных передатчиков цифрового телевидения, ... обеспечить 100 процентный охват населения цифровым телевидением». Для выполнения этих задач одним из важных вопросов являются повышение качества изображения и звука передаваемых телевизионных сигналов, уменьшение объема медиа контента телевизионных программ, создание возможности внедрения дополнительных сервисных услуг.
В мире одной из актуальных задач является разработка систем сжатия изображений и звука на основе модифицированного дискретно-косинусного и вейвлет преобразований и их трехмерных реализаций, алгоритмов блочного масштабирования, быстрого преобразования Фурье и различных их комбинированных методов. В этом отношении особое внимание уделяется осуществлению целенаправленных научных исследований, в том числе: разработка систем кодирования медиа контента телевизионных программ позволяющих уменьшить объем в сто и более раз с сохранением качество звука и изображений, разработка методов оценки качества восстановленных изображений и звука, усовершенствование разработанных систем, разработка методов согласования созданного нового стандарта Н.265 с предыдущим стандартом Н.264.
Данное диссертационное исследование в определенной степени служит выполнению задач, предусмотренных в Указе Президента Республики Узбекистан №УП-4947 от 7 февраля 2017 года «О стратегии действий по дальнейшему развитию Республики Узбекистан», Постановлениях Президента Республики Узбекистан №ПП-1730 от 21 марта 2012 года «О мерах по дальнейшему внедрению и развитию современных информационнокоммуникационных технологий», №ПП-1741 от 17 апреля 2012 года «О государственной программе по техническому и технологическому переходу на цифровое телевещание в Республике Узбекистан», постановлении Кабинета Министров Республики Узбекистан №24 от 1 февраля 2012 года «О мерах по созданию условий для дальнейшего развития компьютеризации и информационно-коммуникационных технологий на местах», а также в других нормативно-правовых документах, принятых в данной сфере.
Целью исследования является разработка высокоэффективной системы сжатия медиа контента телевизионных программ, уменьшающей их объем в сто и более раз с сохранением хорошего качества изображения и звука.
Научная новизна исследования заключается в следующем:
создан метод яркостного преобразования, приводящий изображения в однородный вид с помощью блоков адаптивно изменяющими размерами;
разработаны метод и алгоритм межаудиокадровой обработки, увеличивающий коэффициент сжатия аудиосигналов ТВ программ;
создан алгоритм межкадрового масштабирования, повышающий качество изображения при больших коэффициентах сжатия;
разработан метод сжатия видеосигналов ТВ программ на основе межкадрового масштабирования, увеличивающий качество изображения, с яркостным преобразованием, использующий блоки переменного размера;
разработана структурная схема и сформирована элементная база аудиовидео кодека.
Заключение
Представлены следующие выводы по теме диссертации «Высокоэффективные системы сжатия медиа контента телевизионных программ, оценка качества и способы их дальнейшего совершенствования»:
1. Разработаны методы и алгоритмы эффективного сжатия аудиовидеосигналов ТВ программ на основе яркостных преобразований, использующих переменные блоки усреднения. При применении, которое позволяет увеличить быстродействие преобразования и сжимать без потерь данных и соответственно, восстанавливать изображения без ухудшения качества.
2. Разработан межкадрово-масштабирующий алгоритм, позволяющий устранить временную избыточность изображений. Экспериментальные исследования показали, что на изображениях без мелких деталей применение данного метода позволяет обеспечить хорошее качество изображений при результирующем сжатии в сто раз и уменьшить объем выходных аудиовидео файлов в 1,2 раза по сравнению с существующими кодеками.
3. Разработан метод и алгоритм сжатия аудиосигнала на основе устранения временной избыточности звукового сигнала, применение которого позволяет увеличить итоговое сжатие звуковых сигналов в 1.1 раза по сравнению с существующими кодеками и уменьшить объем выходных файлов в 1,05-1,1 раза (5-10%) в зависимости от сюжета программы.
4. Разработан измеритель средней яркости изображений, показывающий подобие двух кадров, который позволяет наиболее точно найти подобные кадры.
5. Разработан корректор четкости декодированных изображений, позволяющий получить высококачественное изображение, исправляя значения, полученные при восстановлении, с использованием базисных функций.
6. Разработаны измерители резкости и среднеквадратического отклонения значений пикселей сравниваемых изображений для оценки полученных результатов восстановления по сравнению с исходными, позволяющий объективно оценить погрешности кодирования.
7. Разработана структурная схема устройства сжатия аудиовидеосигналов на основе вейвлет преобразований яркостей изображений и фрактально-спектральной обработки аудиосигналов для внедрения в государственном унитарном предприятии «O‘zbckiston MTRK mcdiamarkazi» была реализована на микропроцессорном устройстве telcstrcam pipeline dual HD. В результате применения разработанной системы эффективного кодирования аудио-видеосигналов уменьшился объем выходных сигналов в 1,2 раза, что позволило хранить на 20% больше информации на сервере.


background image

ТОШКЕНТ АХБОРОТ ТЕХНОЛОГИЯЛАРИ УНИВЕРСИТЕТИ

ҲУЗУРИДАГИ ИЛМИЙ ДАРАЖАЛАР БЕРУВЧИ

DSc.27.06.2017.Т.07.01 РАҚАМЛИ ИЛМИЙ КЕНГАШ

ТОШКEНТ АХБОРОТ ТEXНОЛОГИЯЛАРИ УНИВEРСИТEТИ

ТЕЛЕВИЗИОН ДАСТУРЛАРНИНГ МЕДИА КОНТЕНТИНИ

СИҚИШНИНГ ЮҚОРИ САМАРАЛИ ТИЗИМЛАРИ, СИФАТИНИ

БАҲОЛАШ ВА УЛАРНИ ТАКОМИЛЛАШТИРИШ УСЛУБЛАРИ

05.04.02 – Радиотехника, радионавигация, радиолокация ва телевидение тизимлари ва

қурилмалари. Мобил, тола-оптик алоқа тизимлари

ТЕХНИКА ФАНЛАР БЎЙИЧА ФАЛСАФА ДОКТОРИ (PhD)

ДИССЕРТАЦИЯСИ АВТОРЕФЕРАТИ

Тошкент – 2017


background image

УДК:

621.397.13:621.397.6



Техника фанлари бўйича фалсафа доктори (PhD)

диссертацияси

автореферати мундарижаси

Оглавление автореферата диссертации

доктора философии (PhD) по техническим наукам

Contents of dissertation abstract of the doctor of philosophy (PhD)

on technical sciences



Носиров Хабибулло Хикматулло ўғли

Телевизион дастурларнинг медиа контентини сиқишнинг юқори самарали
тизимлари, сифатини баҳолаш ва уларни такомиллаштириш услублари

3



Носиров Хабибулло Хикматулло угли

Высокоэффективные системы сжатия медиа контента телевизионных
программ, оценка качества и их способы дальнейшего
совершенствования

19



Nosirov Khabibullo Khikmatullo ogli

High efficiency systems of compression of media content of television
programs, quality estimation and methods of their further development

35



Эълон қилинган ишлар рўйхати
Список опубликованных работ
List of published works

39


background image

ТОШКЕНТ АХБОРОТ ТЕХНОЛОГИЯЛАРИ УНИВЕРСИТЕТИ

ҲУЗУРИДАГИ ИЛМИЙ ДАРАЖАЛАР БЕРУВЧИ

DSc.27.06.2017.Т.07.01 РАҚАМЛИ ИЛМИЙ КЕНГАШ

ТОШКEНТ АХБОРОТ ТEXНОЛОГИЯЛАРИ УНИВEРСИТEТИ

НОСИРОВ ХАБИБУЛЛО ХИКМАТУЛЛО ЎҒЛИ

ТЕЛЕВИЗИОН ДАСТУРЛАРНИНГ МЕДИА КОНТЕНТИНИ

СИҚИШНИНГ ЮҚОРИ САМАРАЛИ ТИЗИМЛАРИ, СИФАТИНИ

БАҲОЛАШ ВА УЛАРНИ ТАКОМИЛЛАШТИРИШ УСЛУБЛАРИ

05.04.02 – Радиотехника, радионавигация, радиолокация ва телевидение тизимлари ва

қурилмалари. Мобил, тола-оптик алоқа тизимлари

ТЕХНИКА ФАНЛАР БЎЙИЧА ФАЛСАФА ДОКТОРИ (PhD)

ДИССЕРТАЦИЯСИ АВТОРЕФЕРАТИ

Тошкент – 2017


background image

Фалсафа доктори (PhD) диссертацияси мавзуси Ўзбекистон Республикаси Вазирлар

Маҳкамаси ҳузуридаги Олий аттестация комиссиясида B2017.2.PhD/T140 рақам билан
рўйхатга олинган.

Диссертация Тошкент ахборот технологиялари университетида бажарилган.
Диссертация автореферати уч тилда (ўзбек, рус, инглиз (резюме)) Илмий кенгаш

веб-саҳифасида (www.tuit.uz) ва «ZiyoNet» ахборот-таълим порталида (www.ziyonet.uz

)

жойлаштирилган.

Илмий раҳбар:

Камилов Мирзоян Мирзаахмедович

техника фанлари доктори, профессор,

академик

Расмий оппонентлар:

Раджабов Тельман Дадаевич

физика-математика фанлари доктори,
профессор, академик

Нигматов Хикмат

техника фанлари доктори, профессор

Етакчи ташкилот:

«UZTELECOM» акциядорлик компанияси

Диссертация ҳимояси Тошкент ахборот технологиялари университети ҳузуридаги

DSc.27.06.2017.Т.07.01 рақамли Илмий кенгашнинг 2017 йил «___» _______ соат ____ даги
мажлисида бўлиб ўтади. (Манзил: 100202, Тошкент шаҳри, Амир Темур кўчаси, 108-уй.
Тел.: (99871) 238-64-43; факс: (99871) 238-65-52; e-mail: tuit@tuit.uz).

Диссертация билан Тошкент ахборот технологиялари университети Ахборот-ресурс

марказида танишиш мумкин (___ рақам билан рўйхатга олинган). (Манзил: 100202, Тошкент
шаҳри, Амир Темур кўчаси, 108-уй. Тел.:(+99871) 238-65-44).

Диссертация автореферати 2017 йил «____»___________да тарқатилди.
(2017 йил «____» __________ даги ____ рақамли реестр баѐнномаси.)







Р.Х.Хамдамов

Илмий даражалар берувчи илмий

кенгаш раиси, т.ф.д., профессор

Ф.М.Нуралиев

Илмий даражалар берувчи илмий

кенгаш илмий котиби, т.ф.д.

Х.К.Арипов

Илмий даражалар берувчи илмий

кенгаш қошидаги илмий семинар

раиси, ф.-м.ф.д., профессор


background image

5

КИРИШ (фалсафа доктори (PhD) диссертацияси аннотацияси)

Диссертация мавзусининг долзарблиги ва зарурати.

Дунѐда

телевизион дастурлар медиа контентининг сифатини яхшилаш ва
узатиладиган каналларнинг сонини оширишга имкон яратувчи юқори
самарали сиқиш тизимларини ишлаб чиқиш ва такомиллаштиришга
қаратилган тадқиқотлар олиб борилмоқда. «Агар 2025 йилга бориб дунѐ
маълумотлар омбори 163 ЗБ (зеттабайт – триллион гигабайт) гача ортишини
ҳисобга олсак»

1

, катта хажмни эгалловчи телевизион дастурлар аудио-

видеосигналларининг товуш ва тасвирлари сифат даражасини сақлаган ҳолда
ҳажмини камайтириш долзарб муаммолардан бири ҳисобланади. Бу борада
чет эл мамлакатларда, жумладан АҚШ, Буюк Британия, Япония, Франция,
Италия, Белгия, Испания, Швецария, Германия, Хитой, Россия ва бошқа
давлатларда маълум ютуқларга эришилган бўлиб, уларда телевизион
дастурларнинг медиа контентини юқори самарали сиқиш тизимини яратишга
алоҳида эътибор қаратилмоқда.

Республикамиз мустақилликка эришгандан буѐн оммавий ахборот

воситаларини ривожлантириш, техник ва технологик тарзда рақамли
телевидениега ўтиш ҳамда телевизион дастурлар медиа контентини узатиш
ва қабул қилиш тизимларини қўллашга алоҳида эътибор қаратилди. Бу
борада, рақамли телеэшиттириш билан аҳолига сифатли телевизион тасвир
ва товуш сигналларни етказиб беришда сезиларли натижаларга эришилиб,
жумладан рақамли видеосигналларни қабул қилиш қурилмаларини ишлаб
чиқиш йўлга қўйилди. Шулар билан бир қаторда тасвир ва товуш
сигналларни сиқишнинг юқори самарали тизимларини замонавий
талаблардан келиб чиққан ҳолда такомиллаштириш талаб этилмоқда.
Ўзбекистон Республикасини янада ривожлантириш бўйича Ҳаракатлар
стратегиясида, жумладан « ... оммавий ахборот воситалари ролини
кучайтириш, ... 66 та юқори қувватли ва 328 та кам қувватли рақамли
телевидение узаткичларини ўрнатиш ва ишга тушириш, ... аҳолини рақамли
телевидение билан қамраб олиш даражаси 100 фоизга етказиш» вазифалари
белгилаб берилган. Ушбу вазифаларни бажаришда узатиладиган телевизион
сигналлар тасвир ва товушининг сифат даражасини ошириш, телевизион
дастурлар медиа контентининг ҳажмини камайтириш, қўшимча хизмат
турларини жорий этишга имкон яратиш муҳим масалалардан бири
ҳисобланади.

Жаҳонда тасвирларни модификацияланган дискрет-косинус, вейвлет ва

уч ўлчамли ўзгартиришлар, масштаблаш алгоритмлари, бўлакларга бўлиш
ѐрдамида, товуш сигналларини тезкор Фурье ўзгартиришлари ва уларнинг
комбинацияланган усулларидан фойдаланиб сиқиш тизимларини ишлаб
чиқиш долзарб масалалардан бири бўлиб, бу борада мақсадли илмий
тадқиқотлар, жумладан қуйидагиларга алоҳида эътибор қаратилмоқда: товуш

1

http://www.storagenewsletter.com/2017/04/05/total-ww-data-to-reach-163-zettabytes-by-2025-idc/


background image

6

ва тасвирларнинг сифат даражасини сақлаган ҳолда юз ва ундан ортиқ марта
сиқишга эришиш имконини яратувчи телевизион дастурларнинг медиа
контентини кодлаш тизимини ишлаб чиқиш, қайта тикланган тасвир ва
товуш сигналларини сифатини баҳолаш усулларини ишлаб чиқиш, ишлаб
чиқилган тизимларни такомиллаштириш, янги яратилган H.265 стандарти
билан аввалги H.264 стандартини мослаштириш усулларини ишлаб чиқиш.

Ўзбекистон Республикаси Президентининг 2017 йил 7 февралдаги

ПФ-4947-сон «Ўзбекистон Республикасини янада ривожлантириш бўйича
Ҳаракатлар стратегияси тўғрисида»ги Фармони, 2012 йил 21 мартдаги
ПҚ-1730-сон «Замонавий ахборот-коммуникация технологияларини янада
жорий этиш ва ривожлантириш чора-тадбирлари тўғрисида»ги ва 2012 йил
17 апрелдаги ПҚ-1741-сон «Ўзбекистон Республикасида рақамли
телеэшиттиришга техник ва технологик ўтиш Давлат дастури тўғрисида»ги
Қарорлари, Вазирлар Маҳкамасининг 2012 йил 1 февралдаги 24-сон
«Жойларда

компьютерлаштириш

ва

ахборот

коммуникация

технологияларини бундан кейинги ривожлантиришга шароитлар яратиш
учун чора тадбирлар тўғрисида»ги қарори ҳамда мазкур фаолиятга тегишли
меъѐрий-ҳуқуқий ҳужжатларда белгиланган вазифаларни амалга оширишга
ушбу диссертация тадқиқоти муайян даражада хизмат қилади.

Тадқиқотнинг республика фан ва технологиялари ривожланиши

устувор йўналишларига мослиги.

Мазкур тадқиқот рeспублика фан ва

технологиялар ривожланишининг IV. «Ахборотлаштириш ва ахборот-
коммуникация технологияларини ривожлантириш» устувор йўналиши
доирасида бажарилган.

Муаммонинг ўрганилганлик даражаси.

ISO/IEC JTC 1 Moving Picture

Experts Group (MPEG) гуруҳи томонидан тасвирларга дискрет-косинусли
қайта

ишлаш

алгоритмларини

қўллаган

ҳолда

рақамли

видео-

аудиосигналларни сиқишнинг MPEG-1, MPEG-2 телевизион стандартлари
ишлаб чиқилган. ITU-T Video Coding Experts Group (VCEG) ва MPEG
гуриҳлари биргаликда телевизион эшиттириш учун мўлжалланган
MPEG-4-10 (H.264

AVC), кейинчалик эса H.265 HEVC стандартлари ишлаб

чиқилган. S.Blasi, M.Naccari, R.Weerakkody, J.Funnell, M.Mrak, J.Samuelsson,
D.Nandakumar, S.Kotecha, S.Metta томонидан H.264 тизимидан H.265
тизимига ва тескари транскодлаш тизимлари ишлаб чиқилган. Y.Miki,
Y.Sugito, K.Iguchi, T.Sakiyama, K.Onthriar, K.Loo, Z.Xue томонидан тасвирни
бўлакларга бўлиб кодлаш тизими яратилган. A.Murphy, S.Silva, L.Claesson,
D.Ratka тадқиқотлари натижасида юқори самарали кодлаш тизими ишлаб
чиқилган. В.Дворкович, Ю.Зубарев, А.Рижков тадқиқотлари аудио ва
видеосигналларни

кодлаш

тизимларини

таҳлил

қилиш

ва

такомиллаштиришга қаратилган бўлиб статик тасвирларни кодлаш,
ҳаракатни таянч нуқталарга боғлаган ҳолда таҳлил қилишга бағишланган.
И.Родионов,

В.Артюшенко,

М.Смирнов,

В.Юкин,

А.Ратушняк,

Д.Ватолинларнинг изланишлари AVC кодеки ва бошқа кодекларни таҳлил ва
тадқиқ этиш ҳамда баҳолашга бағишланган.


background image

7

Ўзбекистонда тасвирларга ишлов бериш жараѐнларини интеллектуал

бошқариш тизимини такомиллаштириш ва фильтрлаш жараѐнларини турли
сонли моделларини яратиш муаммолари Д.А.Абдуллаев, М.М.Камилов,
М.М.Мусаев,

Х.Н.Зайнидинов,

Р.Н.Усмонов,

Т.Ф.Бекмуратов

ва

бошқаларнинг тадқиқотларида ўрганилган, Ю.С.Сагдуллаев, Ш.З.Таджибаев,
М.З.Зупаров, Т.Г.Рахимов ва бошқаларнинг тадқиқотларида видео ва
аудиосигналларни автоматик равишда шакллантириш усуллари, тиниқлик
даражасини таъминлаш жараѐнини бошқариш усуллари, сиқишнинг
олдиндан масштаблаш, ѐрқинлик ўзгартиришларига асосланган усул ва
алгоритмлари ўрганилган. Шу билан бирга тасвирларни кодлашда ўлчами
ўзгарувчан блоклар ѐрдамида ѐрқинлик ўзгартиришларини амалга ошириш,
тасвир сифатини оширувчи кадрли умумлаштиришли масштаблаш
алгоритмини қўллаш, телевизион дастурларнинг аудиосигналларини
аудиокадрлараро қайта ишлаш усулларини ишлаб чиқиш, сиқиш
коэффициенти юз мартадан катта бўлган қийматларда тасвир ва товушнинг
юқори сифат даражасини сақловчи самарали сиқиш усулларини яратишга
бағишланган илмий изланишлар ҳозирги кунда етарли даражада
ўрганилмаган.

Диссертация тадқиқотининг диссертация бажарилган олий таълим

муассасасининг илмий-тадқиқот ишлари режалари билан боғлиқлиги.

Диссертация тадқиқоти Тошкент ахборот технологиялари университетининг
илмий-тадқиқот ишлари режасининг А5-037 «Мобил алоқа тизимлари учун
кадрлараро ишлов беришли вейвлет-ўзгартириш асосидаги аудио-
видеокодекнинг қурилма-дастурий воситаларини ишлаб чиқиш» (2012-2014),
А5-024 «Мобил алоқа тизимлари учун кадрлараро тасвирга ишлов бериб
вейвлет ўзгартириш асосида видеокодекни ишлаб чиқиш» (2015-2017)
мавзуларидаги лойиҳалари доирасида бажарилган.

Тадқиқотнинг мақсади

телевизион дастурларнинг медиа контенти

ҳажмини тасвир ва товушнинг яхши сифат даражасини сақлаган ҳолда юз ва
ундан ортиқ марта камайтиришни таъминловчи юқори самарали сиқиш
тизимини ишлаб чиқишдан иборат.

Тадқиқотнинг вазифалари:

телевизион (ТВ) дастурларнинг видеосигналларини самарали сиқиш

усул ва алгоритмларини ишлаб чиқиш;

ТВ дастурларнинг аудиосигналларини самарали сиқиш усуллари ва

алгоритмларини ишлаб чиқиш;

тасвир ва товуш сифатини баҳолаш усулларини такомиллаштириш;
аудио-видео кодек дастури вариантларини яратиш;
аудио-видео кодекни тузилиш схемасини ишлаб чиқиш ва уни яратиш

учун элементлар базасини шакллантириш.

Тадқиқотнинг объекти

сифатида

телевизион дастурларнинг медиа

контентини юқори самарали сиқиш жараѐнлари қаралган.

Тадқиқотнинг предмети

телевизион дастурларнинг медиа контентини

сиқишда қўлланиладиган усуллари, алгоритмлари, воситалари ва
қурилмаларидан иборат.


background image

8

Тадқиқотнинг усуллари.

Тадқиқот жараѐнида таҳлилий, математик ва

сонли моделлаштириш, алгоритмлаш, дастурлаш, махсус ишлаб чиқилган
сиқиш даражасини, товушни эшиттириш ва тасвирлар визуал ўзгаришлари-
нинг сифат кўрсаткичларини баҳолаш усулларидан фойдаланилган.

Тадқиқотнинг илмий янгилиги

қуйидагилардан иборат:

тасвирни ўлчами адаптив ўзгарувчан блоклар ѐрдамида бир хил

кўринишга келтирувчи ѐрқинлик ўзгартириш усули яратилган;

ТВ дастурларнинг аудиосигналларини сиқиш коэффициентини

оширувчи аудиокадрлараро қайта ишлаш усул ва алгоритми ишлаб чиқилган;

видеосигналларни сиқишнинг катта коэффициентларида тасвир

сифатини оширувчи кадрлараро масштаблаш алгоритми яратилган;

ТВ дастурлар видеосигналларини ўлчами ўзгарувчан блоклар ѐрдамида

ѐрқинлик ўзгартиришларини амалга ошириб, тасвир сифатини оширувчи
кадрлараро масштаблаш асосидаги сиқиш тизими ишлаб чиқилган;

аудио-видео кодекнинг структура схемаси ва шакллантирилган

элементлар базаси ишлаб чиқилган.

Тадқиқотнинг амалий натижалари

қуйидагилардан иборат:

ТВ дастурларнинг тасвирларини вақт бўйича ортиқчалигини йўқотувчи

кадрлараро қайта ишлашга асосланган видеосигналларни самарали сиқувчи
усул ва алгоритм ишлаб чиқилган;

катта сиқиш коэффициентларида тасвир сифатини сақловчи, адаптив

блоклар ѐрдамида тасвирнинг тузилмавий ортиқчалигини йўқотувчи усул ва
алгоритм ишлаб чиқилган;

аудиосигналларни анъанавий сиқиш усулларининг самарадорлигини

оширувчи аудио файлларни аудиокадрлараро қайта ишлаш усул ва
алгоритми ишлаб чиқилган;

видеосигналларни H.264 кодекига нисбатан 1,2–1,5 баробар самаралироқ

сиқиш имконини берувчи, магнит, оптик ва электрон сақлаш
қурилмаларининг хотирасини самаралироқ ишлатишга имкон яратувчи
аудио-видео кодек тизими ишлаб чиқилган.

Тадқиқот натижаларининг ишончлилиги.

Тадқиқот натижаларининг

ишончлилиги келтирилган усул ва алгоритмлар реал мультимедиа
дастурлари устида ўтказилган тажрибалар асосида олинган натижалар,
тасвир ва товушларни турли бит тезликлардаги солиштирма жадваллари
билан текширилганлиги, тасвир ва товушнинг сифатини баҳолаш учун
нафақат субъектив, балки ўрта квадратик четлашишини ва пик сигналнинг
шовқинга нисбатини ҳисоблаш билан объектив усуллар қўлланилганлиги,
ҳамда тасвир ва товушнинг сифати юз ва ундан ортиқ марта сиқилганида
MPEG-4-10 стандартидан қолишмаслиги исботланганлиги билан изоҳланади.

Тадқиқот натижаларининг илмий ва амалий аҳамияти.

Тадқиқотлар

натижаларининг илмий аҳамияти аудиокадрлараро ва кадрлараро қайта
ишлашга

ҳамда

бирламчи

масштаблашга

асосланган

аудио-

видеосигналларни сиқишнинг янги усул ва алгоритмлари яратилганидадир.
Ишнинг натижалари аудио-видеосигналларни қайта ишлаш, сиқиш ва сақлаш
тизимларида, телевизион дастурларни узатишда қўлланилиши мумкин.


background image

9

Тадқиқотлар

натижаларининг

амалий

аҳамияти

узатилаѐтган

дастурларнинг ҳажмини камайтириш ҳисобига, улар эгаллайдиган частота
кенглигини торайтириш билан узатилаѐтган дастурлар сонини оширган
ҳолда телевизион сигналларни узатиш тизимини яхшилашга, аудио ва
видеосигналларни сиқиш, сақлаш ва узатиш миллий стандартини яратишга,
радиочастота полосасидан самарали фойдаланишга, қабул қилиш томонида
жорий узатиш параметрлари доирасида юқори сифатли тасвир ва товушни
олишга хизмат қилади.

Тадқиқот

натижаларининг

жорий

қилиниши.

Аудио-

видеосигналларни ўлчамлари адаптив ўзгарувчан блоклар қўлланилган
ѐрқинлик ўзгартиришлари ва аудиокадрлараро қайта ишлаш усуллари
ѐрдамида ишлаб чиқилган сиқиш тизими асосида:

ТВ дастурларнинг тасвирларини вақт бўйича ортиқчалигини йўқотувчи

кадрлараро қайта ишлашга асосланган, тасвир сифатини сақлаб қолиб
тузилмавий ортиқчалигини адаптив блоклар ѐрдамида йўқотувчи
видеосигналларни

самарали

сиқувчи

тизими

«O„zbekiston MTRK

mediamarkazi» давлат унитар корхонасига жорий қилинган (Ўзбекистон
Республикаси

ахборот

технологиялари

ва

коммуникацияларини

ривожлантириш вазирлигининг 2017 йил 25 сентябрдаги 33-8/6360-сон
маълумотномаси). Тадқиқот натижалари чиқувчи аудио-видео файлларнинг
ҳажмини 1,2 марта камайтириш ва серверда 20% кўпроқ маълумотларни
сақлаш имконини берган;

аудиокадрлараро қайта ишлашга асосланган аудиосигналнинг вақт

бўйича ортиқчалигини йўқотиш тизими «Respublika teleradiomarkazi» давлат
унитар корхонаси Тошкент радиоэшиттириш уйида ѐзиб олинган
аудиосигналларни сиқиш жараѐнига жорий қилинган (Ўзбекистон
Республикаси

ахборот

технологиялари

ва

коммуникацияларини

ривожлантириш вазирлигининг 2017 йил 25 сентябрдаги 33-8/6360-сон
маълумотномаси).

Олинган

натижалар

товуш

сигналларида

такрорланишларни кодлаб, чиқувчи файлларнинг ҳажмини дастур сюжетга
боғлиқ ҳолатда 1,05–1,1 мартагача (5–10%) камайтириш имконини яратган.

Тадқиқот

натижаларининг

апробацияси.

Мазкур

тадқиқот

натижалари, жумладан 7 та халқаро ва 10 та республика илмий-амалий
анжуманларида муҳокамадан ўтказилган.

Тадқиқот натижаларининг эълон қилинганлиги.

Тадқиқот мавзуси

бўйича жами 29 та илмий иш чоп этилган, шулардан, Ўзбекистон
Республикаси Олий аттестация комиссиясининг докторлик диссертациялари
асосий илмий натижаларини чоп этиш тавсия этилган илмий нашрларда 9 та
мақола, 3 таси хорижий ва 6 таси республика журналларида нашр қилинган
ҳамда 3 та ЭҲМ учун яратилган дастурий воситаларни қайд қилиш
гувоҳномалари олинган.

Диссертациянинг тузилиши ва ҳажми.

Диссертация кириш, тўртта

боб, хулоса, фойдаланилган адабиѐтлар рўйхати, иловалардан иборат.
Диссертациянинг ҳажми 119 бетни ташкил этади.


background image

10

ДИССЕРТАЦИЯНИНГ АСОСИЙ МАЗМУНИ

Кириш

қисмида диссертация мавзусининг дoлзарблиги ва зарурияти

асосланган, тадқиқотнинг Ўзбекистoн Республикаси фан ва технологиялари
тараққиѐтининг устувoр йўналишларига мoслиги кўрсатилган, тадқиқотнинг
мақсад ва вазифалари белгилаб олинган ҳамда тадқиқот объекти ва предмети
аниқланган, oлинган натижаларнинг ишончлилиги асослаб берилган,
уларнинг назарий ва амалий аҳамияти очиб берилган, тадқиқот
натижаларини амалда жорий қилиш ҳолати, нашр этилган ишлар ва
диссертациянинг тузилиши бўйича маълумотлар келтирилган.

Диссертациянинг

«Телевизион дастурларнинг медиа контентини

сиқиш усуллари»

деб номланган биринчи бобида медиа контентнинг

мазмуни ва узатилиши талаблари тавсифланган, телевизион тасвирларнинг
ортиқча маълумотлари ва уларни йўқотиш усуллари таҳлил қилинган. Аудио
ва видеосигналлар ҳажмини сиқишнинг замонавий усуллари ўрганилган.
Кенг тарқалган ўзгартириш усулларидан дискрет-косинус ва вейвлет
ўзгартиришлари келтирилган. Психоакустик ва спектрал ўзгаришларга
асосланган товуш сигналларининг сиқиш усуллари таҳлил қилинган.

Аудио ва видеосигналларни сиқишнинг замонавий усулларини ўрганиш

ва таҳлил қилиш натижасида тадқиқот вазифалари шакллантирилди.

Бажарилган ишларнинг натижалари асосида қуйидагилар аниқланди.

Тасвирларнинг ҳажмини қисқартириш асосан қайта ишланаѐтган тасвир
сюжетига кучли боғлиқ бўлган ортиқча (башорат қилинадиган)
маълумотларни йўқотиш билан амалга оширилади. Нисбатан бир ҳил
сюжетга эга бўлган тасвирлар майда тузилмали тасвирларга қараганда
яхшироқ сиқилиши

аниқланди.

Сиқиш қийин бўлган тасвирларни сиқилишини бошқариш учун спектрал

коэффициентларни махсус квантлаш коэффициентларига бўлиш ва натижани
энг яқин бутун қийматга тенглаштириш усули қўлланилади. Натижада,
сиқиш миқдори ортади, лекин бузилишларга олиб келадиган фойдали
маълумотларнинг йўқотилиши ҳам ошади.

Видео оқими ичида катта ўхшашликларга эга бўлган қўшни кадрларнинг

кўплиги сабабли видеосигналларни сиқишда асосан видео объектларининг
ҳаракатини компенсация қилиш усулидан фойдаланиб, кадрлараро
фарқларни йўқотишга асосланилади. Шу билан бирга мақбул сифат билан
сиқишни 60–70 марта бўлишини таъминлаш мумкин. Бироқ, каттароқ
сиқишда блок эффекти кўринишидаги бузилишлар намоѐн бўла бошлайди.

Замонавий видео кодекларда визуал тасвир сифатининг ѐмонлашувисиз,

блокли бузилишларни йўқотиш учун таянч кадрларни сиқишни 1,5–2 марта
ошириш имконини берувчи турли вейвлет ўзгартиришлари қўлланилади. Энг
оддий Хаара вейвлет функциялари қуйидаги ифода билан берилади:

бу ерда

c

k

ва

d

j,k

аниқланиши керак бўлган коэффициентлар.


background image

11

Базис функцияси бўлган

)

(

t

бу бирлик импульс ҳисобланади.

(2)

)

(

k

t

функция

)

(

t

функциянинг

k

қийматга сурилган нусхаси

ҳисобланади. Шу билан бирга

)

2

(

k

t

функция

)

(

k

t

функциянинг

аргументини 2 марта камайтириш (яъни масштабини камайтириш) билан
ҳосил қилинади. Сурилган функциялар вақтнинг турли қийматларида

f

(

t

)

функциясини аппроксимация қилишда, турли масштабли функциялар эса

f

(

t

)

функцияни юқорироқ сифатларда аппроксимация қилишда қўлланилади.

Хаара вейвлетининг базиси

ψ(t)

зинасимон функция ҳисобланади:

(3)

Аммо, вейвлетлар бутун тасвирни қайта ишлашда яхши фойдаланилади,

ҳаракатни компенсациялашда башорат қилинган кадрларнинг пиксел
блокларини кодлаш учун эса, одатда, дискрет-косинус ўзгартиришлар (ДКЎ)
ѐки модификацияланган ДКЎ қўлланилади, бу эса кодлаш самарадорлигини
камайтиради. Дискрет-косинус ўзгартиришлар қуйидагича ифодаланади:

16

)

1

2

(

cos

16

)

1

2

(

cos

)

,

(

)

(

)

(

)

4

/

1

(

)

,

(

7

0

7

0

v

y

u

x

y

x

p

v

C

u

C

v

u

F

y

x

,

(4)

бу ерда

v

– график блокнинг горизонтал координатаси,

u

–вертикал

координатаси,

x

– блокнинг ичидаги вертикал координата,

y

– блокнинг

ичидаги горизонтал координата,

u, v

= 0 бўлганда

C

(

u

)

, C

(

v

)

= 1/

2, бошқа

ҳолларда

С

(

u

)

, С

(

v

) = 1.

Модификацияланган дискрет-косинус ўзгартириш нафақат тасвирларни

сиқишда, балки товуш сигналларини сиқишда ҳам қўлланилади ва
қуйидагича ифодаланади:

2

1

0

( )

( ) ( )

M

n

X

k

x n h n

,

(5)

бу ерда

k

ва

n –

мос равишда

( )

X k

спектрал компонентанинг ва товуш

сигналининг

( )

x k

дискрет қийматларининг индекслари;

0

1

k

M

;

( 2

1) ( 2

1)

( )

( )

2

c o s

4

k

n

M

k

h

n

w n

M

M

паст частотали фильтр

сифатларига эга бўлган фильтр-таҳлил сигнали

( )

x n

нинг импульсли жавоби

ѐки

( )

h k

базис векторнинг компонентлари; 2М – кадр узунлиги.

Товушни кодлашда эшиттириш сигналлари, одатда, турли манбалар

(мусиқа асбоблари, одамлар овози ва бошқалар) жамланмасидан иборатлиги
аниқланди. Натижада бундай сигнал шовқин кўринишида бўлади ва жуда
паст корреляцияга эга бўлади, бу эса сиқиш имкониятини камайтиради.
Шунинг учун аудио оқимларни сиқиш асосан инсон қабул қила қилмайдиган
компонентларини психоакустик қайта ишлаш билан йўқотишга асосланади.
Бунда, аудиосигналларни қайта ишлашнинг қолган қисми тасвирларни қайта


background image

12

ишлаш усулларига асосланади.

Диссертациянинг «

Аудио-видеосигналларни сиқиш стандартлари-

нинг тузилиши ва уларнинг самарадорлигини баҳолаш тамойиллари»

деб номланган иккинчи бобида MPEG-4/H.264, HEVC/H.265 тизимларида
видео ва аудиосигналларни кодлашнинг асосий усуллари таҳлил қилинган.
Кўриб чиқилган стандартлар юқори сифатли тасвир ва товушни таъминловчи
махсус эшиттириш телевидениеси учун ишлаб чиқилган.

Амалга оширилган ишлар натижасида қуйидагилар ўрнатилди. MPEG-2

эшиттириш телевидениеси стандарти таянч ва видеообъектларнинг
ҳаракатини

компенсация

қилиб

билан

башоратланган

кадрларни

тасвирларининг блоклар тузилмасини дискрет-косинусли ўзгартиришга
асосланган. Бунда барча кадрлар учун блок ўлчами 32х32 пикселни ташкил
этади. Ушбу стандарт 3 Мбит/с ва ундан юқори битрэйтларда декодланган
тасвирларнинг яхши сифатини таъминлайди, пастроқ битрэйтларда эса блок
эффекти ва бир қатор бошқа бузилишлар пайдо бўлади.

MPEG-2 стандартида аудио кодлаш товуш сигналининг частота

диапазонини модификацияланган дискрет-косинус ўзгартириш ѐрдамида
32 йўлакка бўлишга асосланган. Бунда асосий сиқиш ҳар бир йўлак
аудиосигналларини эшитиш қобилиятининг яхшиланган 2 психоакустик
модели ѐрдамида амалга оширилади. Шундай қилиб аудио оқимни яхши
эшиттириш сифатида 9-15 марта сиқилиши таъминланади.

MPEG-4-10 стандарти (H.264) MPEG-4 мультимедиа стандартининг

видео сиқишни объектга йўналтирилган ѐндошуви асосида эшиттириш
варианти ҳисобланади. Ҳаракатни тўлдириш ажратиб олинган видео
объектининг конфигурацияси ва ўлчамларига эга бўлган блокларни қўллаш
кадрлараро фарқланишларини сезиларли даражада камайтиради, бу эса
сифатни ѐмонлаштирмасдан видео оқимни сиқишни оширади. Бошқа
томондан, тасодифий шаклдаги видео объект контурларини белгилаш
мураккаб ажратиб олиш вазифаси бўлиб, реал вақтда бажариш қийин.
Шунинг учун, MPEG-4-10 ва H.264 параметрлари ўзгарувчан ўлчамдаги
оддий тўртбурчакли блоклардан фойдаланади, бу кодлаш тезлигини
сезиларли даражада оширади. Бундан ташқари, таянч кадрларни кодлаш учун
вейвлет ўзгартиришлар қўлланилади, шунингдек башоратланган кадрларнинг
блокли бузилишларини камайтириш мақсадида махсус деблокинг
фильтрлари қўлланилади.

MPEG-4-10 стандартининг аудио қисмида MPEG-2 стандартининг

усуллари тўлиқ қўлланилади, шунингдек, аудио оқимнинг сиқиш
коэффициентини сезиларли оширувчи, параметрик кодлаш усулларидан
фойдаланилади. Субполосали ва параметрик гибрид кодлашдан фойдаланиш
аудиосигналларни сиқишни 20–22 мартагача ошириш имконини беради.

Ҳозирги вақтда ишлаб чиқилаѐтган H.265 стандарти кўп видео

маълумотларни ўз ичига олган юқори сифатли тасвирларни самаралироқ
кодлаш учун мўлжалланган. Ушбу стандарт видео оқимнинг визуал
сифатини сақлаш билан 40% юқорироқ сиқиш коэффициентини бериши
кўзланмоқда. Шундай қилиб, H.264 билан солиштирганда, ҳаракатни


background image

13

компенсация қилиш билан блокларининг максимал ҳажми 64х64 га
кўтарилди, яъни 4096 пикселни ташкил қилди. Бундай блоклар бир хил
юзаларни кодлашни осонлаштиради. Бироқ, тасвирга мураккаб ишлов бериш
ишлаш тезлигини пасайтиради, шунинг учун юқори самарадор ва қиммат
микропроцессор қурилмалари талаб қилинади.

Ўтказилган тадқиқотлар шуни кўрсатадики, ҳозирги вақтда ишлаб

чиқиш жараѐнида H.265 стандартининг овоз қисмида H.264 стандартининг
овозли қисми усулларидан фойдаланилмоқда

Диссертациянинг “

ТВ дастурларнинг

аудио ва видеосигналларини

самарали сиқиш қурилмасининг усул ва алгоритмларини ишлаб
чиқиш”

деб номланган учинчи бобида аудио ва видеосигналларнинг

сиқилиш қийматига ва қайта тикланганида сифатига таъсир кўрсатувчи
омиллар келтирилган, шунингдек, статик, динамик тасвирларнинг
видеомаълумотларини сиқиш самарадорлигини ошириш усулларини танлаш
асосланган. Аудиосигналларни вақт бўйича ортиқчалигини бартараф этишга
асосланган сиқишнинг самарали усуллари келтирилган, аудио-видео
кодекнинг структура схемалари яратилган.

Тасвирларни сиқиш самарадорлигини ошириш учун тасвир пиксел

қийматларининг мослашувчан ѐрқинлик ўзгартиришлари ва бирламчи
тасвирни олдиндан масштаблаш усул ва алгоритмлари ишлаб чиқилган.
Блок-схемаси 1-расмда келтирилган ушбу алгоритмда тасвирларнинг ўхшаш
соҳаларини топиш амали бажарилади.

1-расм. Тасвирларни ўзгарувчан ўлчамли блокларга адаптив бўлиш

алгоритми блок-схемаси


Бу бир хил ранглилик сатҳига эга бўлган соҳаларнинг маълумотларини


background image

14

узатиш учун юза ҳақидаги маълумот ва бир ранг сатҳини узатиш етарли
бўлади. Бу усул RLE ўзгартиришига ўхшаш бўлиб, кўп такрорланадиган
элементларни узатиш учун элементлардан бирининг қиймати ва
такрорланишлар сони етарли бўлади.

Тасвир 3-блокда 2х2 ўлчамли, яъни ҳар бири 4 пикселдан иборат

блокларга бўлинади. Бу 4 пикселлардан энг кичик (минимал) қийматга эга
пиксел 4-блокда аниқланади. Сўнгра минимал қиймат блокнинг ҳар бир
пикселидан айрилади. Натижалар 5-блокда 2,55*

k

хато омил (

k

-

фойдаланувчи томонидан ўрнатилган фоиз бўлиб, фоиз хато деб аталади)
билан солиштирилади. Фарқ берилган қийматдан кичик бўлса, барча 4
пикселлар бир хил ҳисобланади ва кейинчалик 2х2 блок саналади, ҳамда
қўшни 2х2 блоклар билан 6-блокда солиштирилиб 4х4 ўлчамли блокни ҳосил
қилади. 7-блокда бу блокнинг минимал қиймати бошқалардан айрилади ва
айирма хато омилдан кичик бўлганда 8х8 блок шакллантирилади. Шу тарзда
32х32 (1024 пиксел) блоккача давом этади. Агар айирмалар хато омилдан
катта бўлса, қийматлар ўзгаришсиз ѐзилади.

Тасвирда ўхшашлик топилганидан ва шартли равишда блокларга

бўлинганидан сўнг ишлов берилади, яъни ҳамма топилган минимал
қийматлар берилган тасвирдан уларни жойлашишига қараб айрилади. Бунда
бир хил соҳалар тасвирда қанча кўп бўлса, чиқишда шанчалик бир хил
ѐрқинлик қийматли тасвир ҳосил бўлади, шу билан бирга RLE компрессор
ѐрдамида яхшироқ сиқилади. Мета маълумотларда тасвирни декодлашда
тиклаш мумкин бўлиши учун блокларнинг ўлчамини англатадиган
коэффициентлар ва уларнинг ранглилиги минимал қийматлари ѐзилади.

Аудио

кодлаш

самарадорлигини

ошириш

мақсадида

аудиосигналларнинг вақт бўйича ортиқчалигини йўқотадиган ўхшаш
аудиокадрларни қидиришга асосланган, вейвлет асосида спектрал
ўзгартиришли усул ишлаб чиқилган.Товуш сигналларини фрактал қайта
ишлаш асосидаги сиқиш алгоритмининг блок-схемаси 2-расмда келтирилган.
Алгоритмнинг ишлаши буфер хотирага WAV форматдаги товушли бирламчи
файлни юклашдан бошланади, 3-блок – “блокларга бўлиш”га вақт бўйича
қийматлари келиб тушади. Бу ерда 0 орқали ўтиш ҳоссасига кўра қийматлар
аудиокадрларга бўлинади. Сўнгра 4-блокда бу аудиокадрлар «ўхшаш»
аудиокадрларни топиш учун солиштирилади.

Агар шундай кадрлар топилса, чиқиш буферига солиштирилган

«бирламчи аудиокадр» ва унга ўхшаш бўлган массивдаги аудиокадрларнинг
координаталари сақланади. Агар қайсидир аудиокадрга ўхшашлари
топилмаган бўлса, бу кадр тўлиқлигича вейвлет ўзгартириш блокига
юборилади, ундан чиқадиган коэффициентлар RLE компрессор ва Хаффман
алгоритмлари билан қайта ишланади.

Кейин сиқилган маълумотлар турли ахборот ташувчиларга ѐзилиши ѐки

алоқа канали орқали узатилиши мумкин.

Товуш ва видео оқимларини бирлаштириш учун тасвирларни вейвлет

ўзгартиришли ѐрқинлик ўзгартириш ва товуш сигналларини фрактал-
спектрал қайта ишлаш асосида телевизион сигналларни сиқиш тузилиш


background image

15

схемаси (3-расм) ишлаб чиқилган.

Бирламчи

рақамли

аудио

ва

видеосигналли

оқим

демультиплексорлангандан сўнг видео ва аудио сигналларга ажралади.

2-расм. Товуш сигналини фрактал-спектрал қайта ишлашга

асосланган сиқишнинг умумлашган блок-схемаси

Видеосигналлар тўрт кадрли хотира буферига келиб тушади, сўнгра

ранглилик модели YUV форматига ўзгартирилади. Тасвирларни сиқиш
самарадорлигини ошириш мақсадида «ўлчамларини камайтириш блокида»
тасвир масштаби камайтирилади. Кичрайтирилган тасвир вейвлет
ўзгартириш (ВЎ) фильтри блокига келиб тушади. Бу ерда пикселлар
декорреляцияланади ва ВЎ коэффициентлари шакллантирилади. Видео оқим
сиқилишини бошқариш учун ВЎ коэффициентлари «квантлагич» блокида
квантланади ва «статик компрессор» блокида кодланади. Компрессор
сиқишни 20–25% оширувчи кетма-кетликлар узунлиги усули ва қўшимча
арифметик кодер ѐки Хаффман кодери ѐрдамида асосий сиқишни амалга
оширади.

Кодланган маълумотлар видео ва товуш сигналларининг аудио

маълумотлари билан чиқиш каналида бирлаштириш учун мультиплексорга


background image

16

келиб тушади. Товуш сигналларини кодлаш блоки фрактал кодлаш усулини
қўллайди. Бунинг учун аудио сигналнинг вақт бўйича маълумотлари буфер
ҳотира

блокига

келиб

тушади.

Маълумотлар

массивида

гуруҳ

маълумотларнинг нол орқали ўтиш асосида аудиокадрлар шакллантирилади
ва бир хил тузимали аудиокадрлар умумий оқимдан изланади. Агар шундай
тузилмалар ѐки фракталлар топилса, улар узатилмайди, уларнинг бирламчи
фракталга тегишлиларининг параметрлари ва чиқиш оқимида жойлашган
ўрни узатилади. Агар бундай аудиокадрлар топилмаса, улар вейвлет
ўзгартириш блокига келиб тушади. Бу ерда видеосигналларнинг кодлаш
каналидаги каби ВЎ коэффициентларига ўзгартирилади.

3-расм. Вейвлет ўзгартириш билан тасвирнинг ѐрқинлигини

ўзгартиришли ва аудиосигналларнинг фрактал-спектрал ўзгартиришга

асосланган телевизион сигнални сиқишнинг умумлашган структура

схемаси


background image

17

Сиқиш коэффициентини бошқариш учун улар «квантлагич»да

белгиланган бит тезликда квантланади ва ҳосил бўлган қийматлар
компрессор блокига келиб тушади. Бу ерда статик ортиқчалик йўқотилади.
Сўнгра маълумотлар маълум вақт оралиқларида ўқишни таъминлаш учун
чиқиш

буферига

киритилади

ва

аудио-видеосигналларнинг

синхронлаштирилиши таъминланади.

Диссертациянинг

“ТВ

дастурнинг

аудио-видеосигналларини

кодлаш тизимининг ишлаш самарадорлигини экспериментал баҳолаш”

деб номланган тўртинчи бобида қайта тикланган тасвир ва товушларнинг
сифатини баҳолаш усуллари, видео ва аудиосигналларни кодлашни
экспериментал баҳолаш натижалари келтирилган. Тадқиқотлар шуни
кўрсатдики, ѐрқинлик ўзгартиришлари ва кадрлараро масштаблаш сиқиш
қийматини 100 ва ундан катта марта ошириш имконини яратади.

4-расм. Мусиқий сигналларни фрактал-спектрал усулида сиқиш

натижалари гистограммаси


Адио сигналларнинг эксперимментал тадқиқотлари натижаси (4-расм)

шуни кўрсатадики, энг катта сиқиш коэффициенти кўп такрорланувчи
мусиқий қисмлари мавжуд бўлган «Three 6 mafia - Side To Side» ритмик
оҳангини қайта ишланганда олинган. Бироқ, бошқа композицияларда, сиқиш
коэффициенти нисбатан паст ва аниқлаш хатолигининг 10% қийматида
ўртача 4–6 мартани ташкил этади.

Товушларни фрактал кодек билан сиқиш самарадорлигини ошириш

учун гибрид усули ишлаб чиқилди. Бунда вейвлет ўзгартиришлари блокини
қўшилиши ҳисобига, сақлашдан аввал фракталларнинг статистик
ортиқчаликларини йўқотиш имконини беради. ВЎ блокини қўллаш ўртача
7–10%га аудиосигналларни сиқишни оширишга ѐрдам беради.


background image

18

ХУЛОСА

«Телевизион дастурларнинг медиа контентини сиқишнинг юқори

самарали тизимлари, сифатини баҳолаш ва уларни такомиллаштириш
услублари»

мавзусидаги диссертация бўйича қуйидаги хулосалар

тақдим

этилди

:

1. Блокларининг ўртача қийматини аниқлашни қўлловчи

ѐрқинлик

ўзгаришларига асосланган ТВ дастурларининг аудио-видеосигналларини
самарали сиқиш усуллари ва алгоритмлари ишлаб чиқилган. Қўллаш
натижасида ўзгартиришларнинг тезлигини оширишга ва маълумотларни
йўқотмасдан сиқишга, мос равишда тикланган тасвирларнинг сифатини
ўзгармаслигига имкон яратади.

2. Тасвирларнинг вақт бўйича ортиқлигини йўқотишга имкон берувчи

кадрлараро

масштаблаш

алгоритми ишлаб чиқилган. Экспериментал

тадқиқотлар кичик деталлари бўлмаган тасвирларга ушбу усулни қўллаш
якуний юз марта сиқилганда тасвирнинг яхши сифатини сақлаб қолиш ва
чиқувчи аудио-видео файлларнинг ҳажмини мавжуд кодекларга нисбатан 1,2
марта камайтириш имконини беради.

3. Товуш сигналининг вақт бўйича ортиқчалигини йўқотишга

асосланган аудиосигналларни сиқиш усули ва алгоритми ишлаб чиқилган
бўлиб, қўлланилиши натижасида мавжуд кодекларга нисбатан овоз
сигналларининг умумий сиқилишини 1,1 марта ошириш ва чиқувчи
файлларнинг ҳажмини дастур

сюжетга боғлиқ ҳолатда

1,05–1,1 мартагача

(5–10%) камайтириш имконини яратади.

4. Икки кадрнинг ўхшашлигини кўрсатувчи тасвирлар ўртача

ѐрқинлигини ўлчагич ишлаб чиқилган бўлиб ўхшаш кадрларни аниқроқ
топишга ѐрдам беради.

5. Декодланган тасвирнинг сифатини корректори ишлаб чиқилган

бўлиб, тиклаш натижасида ҳосил бўлган қийматларни базис функциялари
ѐрдамида тўғирлаб сифатли тасвир олиш имконини яратади.

6. Бирламчи ва тикланган тасвирлар натижаларини баҳолаш учун

тасвир аниқлиги ва ўрта-квадратик оғишни ўлчагичлари ишлаб чиқилган
бўлиб, кодлашнинг ҳатоликларини объектив баҳолаш имконини беради.

7. “

O„zbekiston MTRK mediamarkazi” давлат унитар корхонасида

қўлланиладиган telestream pipeline dual HD микропроцессор қурилмасида
жорий этиш учун

вейвлет ўзгартириш билан тасвирнинг ѐрқинлигини қайта

ишлаш асосида ва аудиосигналларнинг фрактал спектр ўзгартиришга
асосланган телевизион сигнални сиқишнинг структура схемаси ишлаб
чиқилган. Ишлаб чиқилган аудио-видеосигналларни самарали кодлаш
тизимини қўллаш натижасида кодланган сигналларнинг ҳажмини 1,2 марта
камайтириш ва серверда 20% кўпроқ маълумот сақлаш имконини берди.


background image

НАУЧНЫЙ СОВЕТ DSc.27.06.2017.Т.07.01 ПО ПРИСУЖДЕНИЮ

УЧЕНЫХ СТЕПЕНЕЙ ПРИ ТАШКЕНТСКОМ УНИВЕРСИТЕТЕ

ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

ТАШКЕНТСКИЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ

ТЕХНОЛОГИЙ

НОСИРОВ ХАБИБУЛЛО ХИКМАТУЛЛО УГЛИ

ВЫСОКОЭФФЕКТИВНЫЕ СИСТЕМЫ СЖАТИЯ МЕДИА

КОНТЕНТА ТЕЛЕВИЗИОННЫХ ПРОГРАММ, ОЦЕНКА КАЧЕСТВА

И ИХ СПОСОБЫ ДАЛЬНЕЙШЕГО СОВЕРШЕНСТВОВАНИЯ

05.04.02 – Системы и устройства радиотехники, радионавигации, радиолокации и

телевидения. Мобильные, волоконно-оптические системы связи





АВТОРЕФЕРАТ ДИССЕРТАЦИИ

ДОКТОРА ФИЛОСОФИИ (PhD) ПО ТЕХНИЧЕСКИМ НАУКАМ

Ташкент – 2017


background image

Тема диссертации доктора философии (PhD) зарегистрирована в Высшей

аттестационной комиссии при Кабинете Министров Республики Узбекистан за
№ B2017.2.PhD/T140.

Диссертация выполнена в Ташкентском университете информационных технологий.
Автореферат диссертации на трех языках (узбекский, русский, английский (резюме))

размещен на веб-странице научного совета (www.tuit.uz) и на Информационно-образовательном
портале «ZiyoNet» (www.ziyonet.uz

)

.

Научный руководитель:

Камилов Мирзоян Мирзаахмедович

доктор технических наук, профессор,

академик

Официальные оппоненты:

Раджабов Тельман Дадаевич

доктор физико-математических наук,
профессор, академик

Нигматов Хикмат

доктор технических наук, профессор

Ведущая организация:

Акционерная компания «UZTELECOM»

Защита диссертации состоится «__» ______ 2017 года в ___ часов на заседании Научного

совета DSc.27.06.2017.Т.07.01 при Ташкентский университет информационных технологий.
(Адрес: 100202, г. Ташкент, ул. Амира Темура, 108. Тел.: (99871) 238-64-43; факс: (99871) 238-65-
52; e-mail: tuit@tuit.uz).

С диссертацией можно ознакомиться в Информационно-ресурсном центре Ташкентского

университета информационных технологий (регистрационный номер №___). (Адрес: 100202,
г. Ташкент, ул. Амира Темура, 108. Тел.: (99871) 238-65-44).

Автореферат диссертации разослан «___» _________ 2017 года.
(протокол рассылки №__ от «___» _________ 2017 года.)









Р.Х.Хамдамов

Председатель научного совета по присуждению

учeных степеней, д.т.н., проф.

Ф.М.Нуралиев

Ученый секретарь научного совета по

присуждению ученых степеней, д.т.н.

Х.К.Арипов

Председатель научного семинара при Научном

совете по присуждению ученых степеней,

д.ф.-м.н., профессор


background image

21

ВВЕДЕНИЕ (аннотация диссертации доктора философии (PhD))

Актуальность и востребованность темы диссертации.

В мире

проводятся

исследования,

направленные

на

разработку

и

усовершенствование высокоэффективных систем сжатия, позволяющих
повысить качество медиа контента телевизионных программ и увеличить
количество передаваемых каналов. «Если учесть, что к 2025 году глобальная
база данных возрастет до 163 ЗБ (зеттабайт – триллион гигабайт)»

1

, то

уменьшение

большого

объема,

занимаемую

аудио-видеосигналами

телевизионных программ с сохранением качества звука и изображения
является одной из актуальных проблем. В этой связи в зарубежных странах, в
том числе США, Великобритании, Японии, Франции, Италии, Бельгии,
Испании, Швейцарии, Германии, Китае, России и других государствах
достигнуты определенные результаты, в которых особое внимание уделяется
созданию

высокоэффективной

системы

сжатия

медиа

контента

телевизионных программ.

С приобретением независимости в нашей республике особое внимание

уделялось развитию средств массовой информации, техническому и
технологическому переходу на цифровое телевидение, а также улучшению
систем передачи и приема медиаконтента телевизионных программ. В этом
отношении достигнуты значительные результаты в предоставлении
населению качественного изображения и звука с помощью цифрового
телевещания, в том числе налажено производство приемных устройств
цифровых видеосигналов. Вместе с тем

требуется

совершенствование

высокоэффективных систем сжатия сигналов изображения и звука исходя из
современных требований. В Стратегии действий по дальнейшему развитию
Республики Узбекистан определены задачи, в частности « … усиление роли
средств массовой информации, … установка и эксплуатация 66
высокомощных и 328 маломощных передатчиков цифрового телевидения,
… обеспечить 100 процентный охват населения цифровым телевидением».
Для выполнения этих задач одним из важных вопросов являются повышение
качества изображения и звука передаваемых телевизионных сигналов,
уменьшение объема медиа контента телевизионных программ, создание
возможности внедрения дополнительных сервисных услуг.

В мире одной из актуальных задач является разработка систем сжатия

изображений и звука на основе модифицированного дискретно-косинусного
и вейвлет преобразований и их трехмерных реализаций, алгоритмов
блочного масштабирования, быстрого преобразования Фурье и различных их
комбинированных методов. В этом отношении особое внимание уделяется
осуществлению целенаправленных научных исследований, в том числе:
разработка систем кодирования медиа контента телевизионных программ
позволяющих уменьшить объем в сто и более раз с сохранением качество

1

http://www.storagenewsletter.com/2017/04/05/total-ww-data-to-reach-163-zettabytes-by-2025-idc/


background image

22

звука и изображений, разработка методов оценки качества восстановленных
изображений и звука, усовершенствование разработанных систем, разработка
методов согласования созданного нового стандарта H.265 с предыдущим
стандартом H.264.

Данное диссертационное исследование в определенной степени служит

выполнению задач, предусмотренных в Указе Президента Республики
Узбекистан №УП-4947 от 7 февраля 2017 года «О стратегии действий по
дальнейшему

развитию

Республики

Узбекистан»,

Постановлениях

Президента Республики Узбекистан №ПП-1730 от 21 марта 2012 года «О
мерах по дальнейшему внедрению и развитию современных информационно-
коммуникационных технологий», №ПП-1741 от 17 апреля 2012 года «О
государственной программе по техническому и технологическому переходу
на цифровое телевещание в Республике Узбекистан», постановлении
Кабинета Министров Республики Узбекистан №24 от 1 февраля 2012 года «О
мерах по созданию условий для дальнейшего развития компьютеризации и
информационно-коммуникационных технологий на местах», а также в
других нормативно-правовых документах, принятых в данной сфере.

Соответствие исследования приоритетным направлениям развития

науки и технологий республики.

Данное исследование выполнено в

соответствии с приоритетным направлением развития науки и технологий
республики

IV.

«Развитие

информатизации

и

информационно-

коммуникационных технологий».

Степень изученности проблемы.

Группой ISO/IEC JTC 1 Moving

Picture Experts Group (MPEG) разработаны телевизионные стандарты сжатия
цифровой видео-аудио информации MPEG-1, MPEG-2 на основе алгоритмов
дискретно-косинусной обработки изображений. Совместно с группой ITU-T
Video Coding Experts Group (VCEG) группа MPEG создали стандарты,
предназначенные для телевизионного вещания MPEG-4-10 (H.264

AVC),

позднее H.265

HEVC. Учеными S.Blasi, M.Naccari, R.Weerakkody, J.Funnell,

M.Mrak, J.Samuelsson, D.Nandakumar, S.Kotecha, S.Metta разработаны
системы транскодирования со стандарта H.264 в H.265 и обратно. Y.Miki,
Y.Sugito, K.Iguchi, T.Sakiyama, K.Onthriar, K.Loo, Z.Xue создана система
кодирования изображения с разбиением на блоки. В результате исследований
A.Murphy, S.Silva, L.Claesson, D.Ratka разработана система высокоэффектив-
ного кодирования. Исследования В.Дворковича, Ю.Зубарева, А.Рыжкова
посвящены анализу систем кодирования аудио и видео информации, их
усовершенствованию, кодированию статистических изображений и анализу
движения видеообъектов по опорным точкам. Исследования И.Родионова,
В.Артюшенко, М.Смирнова, В.Юкина, А.Ратушняк, Д.Ватолина посвящены
анализу, исследованию и оценке кодека AVC и других кодеков.

В

Узбекистане

проблемы

совершенствования

системы

интеллектуального управления процессами обработки изображений и
создания различных цифровых моделей процессов фильтрования
рассмотрены в трудах Д.А.Абдуллаева, М.М.Камилова, М.М.Мусаева,
Х.Н.Зайнидинова,

Р.Н.Усмонова,

Т.Ф.Бекмуратова

и

других.

В


background image

23

исследованиях

Ю.С.Сагдуллаева,

Ш.З.Таджибаева,

М.З.Зупарова,

Т.Г.Рахимова и других изучены методы автоматического формирования
видео и аудиосигналов, методы управления процессами повышения
четкости, методы и алгоритмы кодирования на основе предварительного
масштабирования яркостных преобразований. Однако на сегодняшний день
исследования, посвященные осуществлению яркостных преобразований с
использованием блоков переменного размера для кодирования изображений,
применению межкадрового масштабирования, сохраняющих качество
изображений, разработке методов обработки аудиосигналов телевизионных
программ, созданию эффективных методов сжатия, сохраняющих
приемлемое качество изображений и звука при их сжатии в сто и более раз не
рассмотрены в достаточной степени.

Связь диссертационного исследования с планами научно-

исследовательских работ высшего образовательного учреждения, где
выполнена диссертация.

Диссертационное исследование выполнено в

рамках научных проектов согласно плану научно-исследовательских работ
Ташкентского

университета

информационных

технологий

А5-037

«Разработка аппаратно-программных средств аудио-видеокодека на основе
вейвлет-преобразований с межкадровой обработкой для систем мобильной
связи»

(2012-2014), А5-024 «Разработка аппаратно-программных средств

аудио-видеокодека на основе вейвлет-преобразований с межкадровой
обработкой для систем мобильной связи»

(2015-2017).

Целью исследования

является

разработка высокоэффективной системы

сжатия медиа контента телевизионных программ, уменьшающей их объем в
сто и более раз с сохранением хорошего качества изображения и звука.

Задачи исследования:

разработка методов и алгоритмов эффективного сжатия видеосигналов

телевизионных (ТВ) программ;

разработка методов и алгоритмов эффективного сжатия аудиосигналов

ТВ программ;

усовершенствование методов оценки качества восстановленных

изображений и звука;

разработка вариантов программ аудио-видео кодека;
разработка структурной схемы и формирование элементной базы по

практическому созданию аудио-видео кодека.

Объектами исследования

выбраны процессы высокоэффективного

кодирования медиа контента телевизионных программ.

Предмет исследования

составляют

методы, алгоритмы, средства и

устройства, используемые при сжатии медиа контента телевизионных
программ.

Методы исследования.

В процессе исследования были использованы

аналитический метод, метод математического и цифрового моделирования,
методы алгоритмизации и программирования, специально разработанные
методы оценки степени сжатия, оценки качественных показателей звукового
воспроизведения и зрительного изменения изображений.


background image

24

Научная новизна исследования

заключается в следующем

:

создан метод яркостного преобразования, приводящий изображения в

однородный вид с помощью блоков адаптивно изменяющими размерами;

разработаны метод и алгоритм межаудиокадровой обработки,

увеличивающий коэффициент сжатия аудиосигналов ТВ программ;

создан алгоритм межкадрового масштабирования, повышающий

качество изображения при больших коэффициентах сжатия;

разработан метод сжатия видеосигналов ТВ программ на основе

межкадрового масштабирования, увеличивающий качество изображения, с
яркостным преобразованием, использующий блоки переменного размера;

разработана структурная схема и сформирована элементная база аудио-

видео кодека.

Практические результаты исследования

заключаются в следующем:

разработан метод и алгоритм эффективного сжатия видеосигналов ТВ

программ на основе межкадровой обработкой изображений, устраняющий
временную избыточность;

разработан метод и алгоритм яркостного преобразования изображений,

устраняющий структурную избыточность адаптивными блоками с
сохранением качества изображений при больших коэффициентах сжатия;

разработан метод и алгоритм межаудиокадровой обработки аудио

файлов, увеличивающий эффективность сжатия традиционных методов
сжатия;

разработана система аудио-видео кодека, обеспечивающая сжатие

видеосигналов в 1,2–1,5 раза эффективнее, чем кодек H.264, позволяя
эффективнее использовать объемы магнитных, оптических и электронных
устройств хранения.

Достоверность результатов исследования.

Достоверность результатов

исследования подтверждается

результатами проведенных экспериментов по

оценке разработанных методов и алгоритмов обработки реальных
мультимедийных программ, приведенными сравнительными таблицами
искажений изображений и звука при различных битовых скоростях,
применением методов не только субъективной, но и объективной оценки
качества изображений и звука на основе расчета среднеквадратического
отклонения значений и отношения пикового сигнала к шуму, также доказано,
что качество изображений и звука не уступает стандарту MPEG-4-10 при
кодировании в сто и более раз.

Научная и практическая значимость результатов исследования.

Научная значимость полученных результатов исследований заключается в
том, что созданы новые алгоритмы и методы сжатия на основе
межаудиокадровой и межкадровой обработи, разработана система
эффективного сжатия аудио-видеосигналов. Результаты работы могут быть
использованы для систем обработки, сжатия и хранения аудио-
видеосигналов, а также передачи телевизионных программ.

Практическая значимость полученных в диссертации результатов

заключается в возможности улучшения систем передачи телевизионных


background image

25

сигналов путем увеличения числа передаваемых программ, за счет
сокращения ширины занимаемых частот, уменьшив объем передаваемых
программ и создания национального стандарта сжатия, хранения и передачи
аудио и видеосигналов, экономичному использованию радиочастотного
диапазона и получения на приемной стороне более высокую четкость
изображений и звука при существующих параметрах передачи.

Внедрение результатов исследования.

На основании разработанной

системы, использующей методы яркостного преобразования изображений
блоками адаптивно изменяющими свои размеры и межаудиокадровой
обработки:

внедрена система эффективного сжатия видеосигналов, устраняющая

структурную избыточность с использованием адаптивных блоков, сохраняя
качество изображений на основе межкадровой обработки, устраняющий
временную избыточность ТВ программ, снятых передач в государственной
унитарной компании «O„zbekiston MTRK mediamarkazi» (справка
Министерства по развитию информационных технологий и коммуникаций
Республики Узбекистан от 25 сентября 2017 года №33-8/6360). Результаты
исследований дают возможность уменьшения объема выходных файлов в 1,2
раза и хранения на 20% больше информации на сервере;

внедрена система устранения временной избыточности аудиосигналов

на основе межаудиокадровой обработки записанных звуковых сигналов в
Ташкентском радиовещательном доме государственной унитарной компании
«Respublika teleradiomarkazi» (справка Министерства по развитию
информационных технологий и коммуникаций Республики Узбекистан от
25 сентября

2017 года №33-8/6360). Полученные результаты дают

возможность уменьшения объема выходных файлов в зависимости от сюжета
в 1,05–1,1 раза (5–10%), кодируя повторения звуковых сигналов.

Апробация

результатов

исследования.

Результаты

данного

исследования были обсуждены, в том числе, на 7 международных и 10
республиканских научно-практических конференциях.

Публикация результатов исследования.

По теме исследования

опубликованы всего 29 научных работ, из них 9 статей в журналах,
рекомендованных

Высшей

аттестационной

комиссией

Республики

Узбекистан, в том числе 3 в иностранных, 6 в республиканских журналах,
также получены 3 свидетельства регистрации программных продуктов
созданных для ЭВМ.

Структура и объем диссертации.

Диссертация состоит из введения,

четырех глав, заключения, списка использованной литературы и
приложений. Объем диссертации состоит из 119 страниц.


background image

26

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении

обосновываются актуальность и востребованность темы

диссертации, показано соответствие с приоритетными направлениями
развития науки и технологий Республики Узбекистан, формулируются цель и
задачи, а также объект и предмет исследования, изложены научная новизна и
практические результаты исследования, обоснована достоверность получен-
ных результатов, раскрыта их теоретическая и практическая значимость,
приведен перечень внедрений в практику результатов исследования, сведе-
ния об опубликованных работах и структура диссертации.

В первой главе диссертации, озаглавленной как

«Методы сжатия медиа

контента телевизионных программ»

приведены требования к содержанию

и передачи медиа контента, проанализированы виды избыточной
информации ТВ изображений и методы их устранения. Изучены
современные методы сжатия объемов аудио и видеосигналов. Представлены
наиболее распространенные методы преобразования, такие как дискретно-
косинусное и вейвлет преобразование. Рассмотрены сжатия звуковых
сигналов на основе психоакустических и спектральных преобразований.

По проведенному обзору и анализу современных методов сжатия аудио

и видеосигналов были сформулированы задачи исследования.

По результатам проделанной работы было установлено, что сжатие

объемов данных изображений в основном осуществляется на основе
устранения избыточной (предсказуемой) информации, которая в телевидении
сильно зависит от обрабатываемых сюжетов изображений. Установлено, что
изображения с относительно однородным сюжетов сжимаются значительно
лучше, чем мелкоструктурные.

Для регулирования сжатия плохо сжимаемых изображений используют

деление коэффициентов спектральных преобразований на специальные коэф-
фициенты квантования с округлением результатов до ближайшего целого
числа. В результате величина компрессии возрастает, но увеличиваются и
потери полезной информации, приводящие к возникновению искажений.

В силу большой схожести смежных кадров в видеопотоке основное

сжатие видеосигналов производится на основе выделения межкадровых
различий, с использованием методов компенсации движения видеообъектов.
При этом с приемлемым качеством можно обеспечить сжатие в 60–70 раз. Но
при большем сжатии начинают сильно проявляться искажения в виде
блочного эффекта.

Для устранения блочных искажений в современных видеокодеках для

кодирования

опорных

кадров

используются

различные

вейвлет

преобразования (1), которые позволяют увеличить сжатие изображений в
1,5–2 раза без ухудшения визуального качества изображений. Функция
простейшего вейвлет преобразования Хаара выражается в следующем виде:


background image

27

где

c

k

и

d

j,k

коэффициенты, которые необходимо определить.

Базисная функция шкалы

)

(

t

является единичным импульсом.

(2)

Функция

)

(

k

t

является копией функции

)

(

t

, сдвинутой вправо на

число

k.

Аналогично, функция

)

2

(

k

t

получается из функции

)

(

k

t

сжатием аргумента в два раза (это еще можно назвать уменьшением
масштаба). Сдвинутые функции используются для аппроксимации функции

f

(

t

) при различных моментах времени, а функции с разными масштабами

нужны для аппроксимации функции

f

(

t

)

при более высоком разрешении.

Базисный вейвлет Хаара

)

(

t

является ступенчатой функцией:

(3)

Однако вейвлет фильтры хорошо работают при обработке целого

изображения, а при кодировании блоков пикселей в предсказанных кадрах с
компенсацией движения обычно используется дискретно-косинусное
преобразование (ДКП) (4) или модифицированное ДКП (МДКП) (5), что
снижает эффективность кодирования. Дискретно-косинусное преобразование
описывается выражением:

16

)

1

2

(

cos

16

)

1

2

(

cos

)

,

(

)

(

)

(

)

4

/

1

(

)

,

(

7

0

7

0

v

y

u

x

y

x

p

v

C

u

C

v

u

F

y

x

,

(4)

где

v

– горизонтальная координата графического блока,

u

– вертикальная,

x

– вертикальная координата внутри блока, а

y

– горизонтальная координата

внутри блока,

C

(

u

)

, C

(

v

)

= 1/

2 для

u, v

= 0 и

С

(

u

)

, С

(

v

) = 1 в противном

случае.

Модифицированное

дискретно-косинусное

преобразование

используется как при сжатии изображений, так и при сжатии звуковых
сигналов и выражается следующим образом:

2

1

0

( )

( ) ( )

M

n

X

k

x n h n

,

(5)

где

k

и

n –

индексы спектральной компоненты

( )

X k

и дискретного

отсчета

( )

x k

речевого

сигнала

соответственно;

0

1

k

M

;

( 2

1) ( 2

1)

( )

( )

2

c o s

4

k

n

M

k

h

n

w n

M

M

импульсный

отклик

фильтра-анализа сигнала

( )

x n

, обладающий свойствами фильтра нижних

частот, или компоненты базисного вектора

( )

h k

; 2М – длина кадра.

При кодировании звукового сопровождения установлено, что

вещательный сигнал, как правило, представляет сумму большого количества
разнообразных источников (музыкальные инструменты, голоса людей и др.).
В результате такой сигнал становится шумоподобным с очень слабыми
корреляционными связями отсчетов, что значительно снижает его


background image

28

сжимаемость. Поэтому основное сжатие аудиопотоков производится на
основе психоакустической обработки, устраняющей такие его компоненты,
которые человек не воспринимает. При этом остальная часть обработки
аудиосигналов, как правило, базируется на методах обработки изображений.

Во второй главе диссертации, озаглавленной как

«Принципы

построения стандартов компрессии аудио-видеосигналов и оценка их
эффективности»

проанализированы основные методы кодирования видео и

аудиосигналов в таких распространенных системах, как MPEG-2, MPEG-4-10
(H.264) и Н.265. Рассмотренные стандарты специально разработаны для
обеспечения высокого качества изображений и звука в вещательном
телевидении.

В результате проделанной работы было установлено, что стандарт

MPEG-2 вещательного телевидения основан на дискретно-косинусной обра-
ботке блочной структуры изображений опорных и предсказанных кадров с
компенсацией движения видеообъектов. При этом для всех кадров размер
блоков составляет 32х32 пикселя. Данный стандарт обеспечивает хорошее
визуальное качество декодированных изображений на битрейтах выше 3
Мбит/с, а на более низких битрейтах проявляются блочный эффект и ряд
других искажений.

Аудио кодирование в стандарте MPEG-2 основано на разбиении ча-

стотного диапазона звукового сигнала на 32 полосы с использованием моди-
фицированного дискретно-косинусного преобразования. При этом основное
сжатие аудиосигналов в каждой субполосе производится улучшенной психо-
акустической модели слуха 2. Таким образом, обеспечивается сжатие аудио
потока в 9–15 раз при хорошем качестве воспроизведения.

Стандарт MPEG-4-10 (Н.264) представляет собой вещательную версию

мультимедийного стандарта MPEG-4, основанного на объектно-ориентиро-
ванном подходе к сжатию видеосигналов. Использование блоков компенса-
ции движения с конфигурацией и размерами выделенного видеообъекта
позволяет существенно уменьшить межкадровые различия, что увеличивает
сжатие видеопотока без ухудшения качества. С другой стороны, выделение
контуров видеообъектов в произвольной форме представляет собой сложную
задачу распознавания, что трудновыполнимо в режиме реального времени.
Поэтому в MPEG-4-10 и Н.264 используют более простые прямоугольные
блоки переменного размера, что существенно увеличивает скорость
кодирования. Кроме того, для кодирования опорных кадров используются
вейвлет преобразования, что позволяет обеспечить их сжатие в 1,5–2 раза
больше, чем в MPEG-2. Также для снижения заметности блочных искажений
предсказанных кадров используются специальные деблокинговые фильтры.

Звуковая часть стандарта MPEG-4-10 использует весь арсенал стандарта

MPEG-2, а также методы параметрического кодирования, позволяющие
существенно увеличить коэффициент сжатия аудио потока. Использование
гибридного субполосного и параметрического кодирования позволяет
увеличить сжатие аудиосигналов до 20–22 раз.

Стандарт Н.265, разрабатываемый в настоящее время, предназначен для


background image

29

более эффективного кодирования изображений высокой четкости,
содержащих гораздо больше видеосигналов. Предполагается, что данный
стандарт обеспечит на 40% больший коэффициент сжатия видеопотока с
сохранением его визуального качества. Так по сравнению с Н.264
максимальный размер блоков компенсации движения увеличен до 64х64, что
составляет 4096 пикселей. Такие блоки облегчают кодирование однородных
областей. Однако более сложная обработка изображений имеет гораздо
меньшее быстродействие, поэтому требуются высокопроизводительные и
дорогие микропроцессорные устройства.

Как показали проведенные исследования, звуковая часть стандарта

Н.265 находится в разработке и в настоящее время пока используется
звуковая часть стандарта Н.264.

В третьей главе диссертации, озаглавленной как

«Разработка методов и

алгоритмов устройства эффективной компрессии аудио-видеосигналов
ТВ программ»

приведены факторы, влияющие на величину компрессии и

качество восстановленных аудио и видеосигналов, а также обоснован выбор
методов повышения эффективности сжатия видеосигналов статических и
динамических изображений. Проведен выбор методов повышения
эффективности сжатия аудиосигналов, основанных на устранении временной
избыточности вещательных аудиосигналов, созданы структурные схемы
аудио-видео кодеков.

Для повышения эффективности сжатия изображения предложены

методы и алгоритмы сжатия видеосигналов на основе адаптивного
яркостного

преобразования

значений

пикселей

изображений

и

предварительного масштабирования исходных изображений.

В данном алгоритме, блок схема которого представлена на рисунке 1,

выполняется процедура нахождения одинаковых областей изображения.

Это означает, что для передачи информации об областях, имеющих

одинаковые уровни цветности (однотонных), необходимо лишь передать
площадь и уровень цвета. Данный метод похож на преобразование RLE, где
при передаче одинаковых часто повторяющих элементов необходимо иметь
один из элементов и количество его повторений.

Изображение делится на блоки размером 2х2 в блоке №3, т.е. по 4

пикселя каждый. Из этих 4-х пикселей находится минимальное значение
яркости №4. Затем минимальное значение отнимается от каждого пикселя в
блоке. Найденные результаты сравниваются с коэффициентом погрешности,
размер которого определяется по формуле 2,55*k (при этом k - это процент,
который задается в процентном соотношении до 100) №5. Если разность
меньше заданного числа, то все 4 пикселя являются подобными и далее
будут считаться блоком 2х2, и сравниваются с соседними блоками 2х2 №6,
формируя блок размером 4х4. В блоке №7 минимальное значение этого
блока отнимается от остальных, если разность меньше коэффициента
погрешности формируется блок 8х8 и так до блока 32х32 (1024 пикселей).
Если разности больше погрешности, то значении пишутся неизменно.

После нахождения и условного деления на блоки, изображение


background image

30

обрабатывается, т.е. все найденные значения отнимаются от исходного
изображения в зависимости от их расположения. При этом, чем больше
одинаковых областей в изображении, тем более однородное изображение на
выходе и соответственно оно лучше сжимается RLE компрессором. В
метаданные записываются коэффициенты блоков, означающих их размер, и,
их минимальное значение цвета для того, чтобы можно было восстановить
изображение при декодировании.

Рис.1. Блок-схема алгоритма адаптивного разбиения изображения

на блоки переменного размера

Для повышения эффективности аудио кодирования предложен метод,

устраняющий временную избыточность аудиосигналов на основе поиска
подобных аудиокадров с последующим спектральным преобразованием на
основе вейвлетов. На рис. 2 представлена обобщенная блок схема алгоритма
сжатия звуковых сигналов с фрактальной обработкой. Работа алгоритма
начинается с загрузки в буферную память исходного звукового файла в
формате WAV, после чего отсчеты поступают в блок №3 «разделения на
аудиокадры», где по признаку перехода сигнала через 0 сигнал разбивается
на аудиокадры. Далее эти аудиокадры сравниваются в блоке №4 для
нахождения «похожих» аудиокадров.

Если такие кадры найдены, то в выходном буфере сохраняется

«опорный аудиокадр», от которого бралась разность, и указатель координаты
его положения в массиве для следующих подобных кадров. Если для какого-
либо аудиокадра подобные кадры не найдены, то этот кадр целиком
передается в блок вейвлет преобразований, выходные коэффициенты
которого обрабатываются RLE компрессором и алгоритмом Хаффмана.

Затем сжатые данные могут быть сохранены на различных носителях

информации или переданы по каналу связи.


background image

31

Рис. 2. Обобщенная блок-схема сжатия звукового сигнала на основе

фрактально-спектральной обработки

Для объединения звукового и видео потоков разработана структурная

схема сжатия телевизионного сигнала на основе яркостных преобразований
изображений с вейвлет преобразованием и фрактально-спектральной
обработкой звуковых сигналов (рис.3).

Исходный

цифровой

поток

аудио

и

видеосигналов

после

демультиплексирования разделяют на видео и аудиосигналы. Видеосигналы
поступают на четырех кадровый буфер памяти, после которого производится
преобразование цветового пространства в формат YUV. Далее для
повышения

эффективности

компрессии

изображения

применяется

уменьшение размеров изображении в «блоке уменьшения размеров». После
чего уменьшенное изображение поступает на блок фильтра «вейвлет
преобразования» (ВП), где производится декорреляция пикселей и
формируется коэффициенты ВП, которые для управления сжатием
видеопотока квантуются в блоке «квантователя» и кодируются в блоке
«статического компрессора». Компрессор производит основное сжатие
данных

методом

длинных

серий

и

дополнительную

обработку

арифметическим кодером или кодером Хаффмана, что позволяет увеличить
сжатие на 20%–25%.


background image

32

Рис. 3. Обобщенная структурная схема сжатия телевизионного

сигнала на основе яркостных преобразований изображений с вейвлет

преобразованием и фрактально-спектральной обработкой звуковых

сигналов

Далее кодированные данные поступают на мультиплексор, для

объединения видео и аудио данных с выхода канала звукового
сопровождения. Блок кодирования звукового сопровождения использует
фрактальный метод кодирования, для чего аудио данные поступают на блок
буферной памяти, куда заносятся отчеты входного сигнала. В массиве
отчетов формируются аудио-кадры, основанные на переходе группы отчетов
через нуль, и производится поиск однотипных структур аудио-кадров в
общем потоке одной информации. Если такие структуры или фракталы
находятся, то они не передаются, а передаются параметры ссылок на
существующий первоначальный найденный фрактал с указанием
позиционирования его выходном потоке. Если такие аудио-кадры не
находятся, то они дальше поступают на блок вейвлет преобразования, где


background image

33

аналогичным образом каналу кодирования видеосигналов преобразуются в
коэффициенты ВП. Для управления коэффициента сжатия они квантуются в
«квантователе» с заданным битрейтом и полученные значения поступают на
блок

компрессора,

где

устраняется

статическая

межэлементная

избыточность, после чего заносятся в выходной буфер, где производится
считывание в соответствующий момент времени и обеспечивается
синхронизация аудио-видеосигналов.

В

четвертой

главе

диссертации,

озаглавленной

как

«Экспериментальная оценка эффективности работы системы аудио-
видео кодирования сигналов ТВ программ»

приведены методы оценки

качества

восстановленных

изображений

и

звука,

результаты

экспериментальной

оценки

кодирования

видео

и

аудиосигналов

разработанными кодеками. Исследования показали, что применение
яркостных преобразований и межкадрового масштабирования позволяет
увеличить степень сжатия до 100 и более раз.

Рис. 4. Гистограмма результатов фрактального - спектрального

метода сжатия музыкальных сигналов

Результаты экспериментальных исследований аудиосигналов (рис.4)

показывают, что наибольший коэффициент сжатия получен при обработке
ритмичной мелодии Three 6 mafia - Side To Side, в которой присутствует
много повторяющихся музыкальных фрагментов, обеспечивающих хорошее
сжатие потока. Однако на других композициях коэффициент сжатия
относительно не высок и при 10% погрешности идентификации составляет в
среднем 4–6 раз.

Для повышения эффективности сжатия ЗС фрактальным кодеком был

предложен гибридный метод, позволяющий устранить статистическую
избыточность сохраняемых фракталов за счет добавления блока вейвлет
преобразования. Применение блока ВП позволяет в среднем на 7–10%
увеличить сжатие аудиосигналов.


background image

34

ЗАКЛЮЧЕНИЕ

Представлены

следующие

выводы

по

теме

диссертации

«Высокоэффективные системы сжатия медиа контента телевизионных
программ, оценка качества и способы их дальнейшего совершенствования»:

1. Разработаны методы и алгоритмы эффективного сжатия аудио-

видеосигналов ТВ программ на основе яркостных преобразований,
использующих переменные блоки усреднения. При применении, которое
позволяет увеличить быстродействие преобразования и сжимать без потерь
данных и соответственно, восстанавливать изображения без ухудшения
качества.

2. Разработан межкадрово-масштабирующий алгоритм, позволяющий

устранить временную избыточность изображений. Экспериментальные
исследования показали, что на изображениях без мелких деталей применение
данного метода позволяет обеспечить хорошее качество изображений при
результирующем сжатии в сто раз и уменьшить объем выходных аудио-
видео файлов в 1,2 раза по сравнению с существующими кодеками.

3. Разработан метод и алгоритм сжатия аудиосигнала на основе

устранения временной избыточности звукового сигнала, применение
которого позволяет увеличить итоговое сжатие звуковых сигналов в 1.1 раза
по сравнению с существующими кодеками и уменьшить объем выходных
файлов в 1,05–1,1 раза (5–10%) в зависимости от сюжета программы.

4. Разработан измеритель средней яркости изображений, показывающий

подобие двух кадров, который позволяет наиболее точно найти подобные
кадры.

5. Разработан корректор четкости декодированных изображений,

позволяющий получить высококачественное изображение, исправляя
значения, полученные при восстановлении, с использованием базисных
функций.

6. Разработаны

измерители

резкости

и

среднeквадратического

отклонения значений пикселей сравниваемых изображений для оценки
полученных результатов восстановления по сравнению с исходными,
позволяющий объективно оценить погрешности кодирования.

7. Разработана

структурная

схема

устройства

сжатия

аудио-

видеосигналов на основе вейвлет преобразований яркостей изображений и
фрактально-спектральной обработки аудиосигналов для внедрения в
государственном унитарном предприятии «O„zbekiston MTRK mediamarkazi»
была реализована на микропроцессорном устройстве telestream pipeline dual
HD. В результате применения разработанной системы эффективного
кодирования аудио-видеосигналов уменьшился объем выходных сигналов в
1,2 раза, что позволило хранить на 20% больше информации на сервере.


background image

SCIENTIFIC COUNCIL AWARDING SCIENTIFIC DEGREES

DSc.27.06.2017.Т.07.01 AT TASHKENT UNIVERSITY OF

INFORMATION TECHNOLOGIES

TASHKENT UNIVERSITY OF INFORMATION TECHNOLOGIES

NOSIROV KHABIBULLO KHIKMATULLO OGLI

HIGH EFFICIENCY SYSTEMS OF COMPRESSION OF MEDIA

CONTENT OF TELEVISION PROGRAMS, QUALITY ESTIMATION

AND METHODS OF THEIR FURTHER DEVELOPMENT

05.04.02 – Radio engineering, radionavigation, radiolocation and television systems

and devices. Mobile, fibrous-optical communication systems




DISSERTATION ABSTRACT OF THE DOCTOR OF PHILOSOPHY (PhD)

ON TECHNICAL SCIENCES

Tashkent – 2017


background image

The theme of doctor of philosophy (PhD) was registered at the Supreme attestation

commission at the Cabinet of Ministers of the Republic of Uzbekistan under number
B2017.2.PhD/T140.

The dissertation has been prepared at Tashkent University of Information Techologies.
The abstract of the dissertation is posted in three languages (Uzbek, Russian, English (resume)) on

the website www.tuit.uz and on the website of «ZiyoNet» Information and educational portal
www.ziyonet.uz.

Scientific adviser:

Kamilov Mirzoyan Mirzaakhmedovich

doctor of technical sciences, professor

academician

Official opponents:

Radjabov Telman Dadaevich

doctor of physical-mathematical sciences,

professor, academician

Nigmatov Khikmat

doctor of technical sciences, professor

Leading organization:

Stock company «UZTELECOM»

The defense will take place “_____” ________________ 2017 at _________ the meeting of

Scientific council No. DSc.27.06.2017.Т.07.01 at Tashkent University of Information Technologies
(Address: 100202, Tashkent city, Amir Temur street, 108. Tel.: (+99871) 238-64-43, fax: (+99871) 238-
65-52, e-mail: tuit@tuit.uz).

The dissertation can be reviewed at the Information Resourse Centre of the Tashkent University of

Information Technologies (is registered under No._____). (Address: 100202, Tashkent city, Amir Temur
street, 108. Tel.: (+99871) 238-64-43, fax: (+99871) 238-65-52)

Abstract of dissertation sent out on “____” ______________ 2017 y.
(mailing report No. ___ on “____” ______________ 2017 y.).









R.Kh.Khamdamov

Chairman of the scientific council

awarding scientific degrees,

doctor of technical sciences, professor.

F.М.Nuraliev

Scientific secretary of scientific council

awarding scientific degrees,

doctor of technical sciences

Kh.K.Aripov

Chairman of the academic seminar under the

scientific council awarding scientific degrees,

doctor of physical-mathematical sciences, professor


background image

37

INTRODUCTION (abstract of PhD dissertation)


The aim of the research work.

The aim of the study is the development of a

highly efficient system for compressing the media content of television programs,
reducing their volume by a hundred and more times, while maintaining good
image and sound quality.

The tasks of research work:

development of methods and algorithms for effective video signal

compression of TV programs;

development of methods and algorithms for effective audio signal

compression of TV programs;

improvement of methods for assessing the quality of reconstructed images

and sound;

development of variants of audio-video codec programs;
development of a structural diagram and the formation of an element base for

the practical creation of an audio-video codec.

The object of the research work

are the highly efficient coding processes of

the media content of television programs.

The scientific novelty of the research work

is as follows:

created the method of luminance transformation, which brings images into a

homogeneous form with the help of blocks with adaptively changing dimensions;

developed the method and algorithm of inter-audio frame processing, which

increases the compression ratio of audio signals of TV programs;

developed an algorithm for interframe scaling, which improves image quality

at high compression ratios;

developed the method of TV programs‟ video signals compression based on

inter-frame scaling, which increases an image quality, with brightness conversion
using blocks of variable size;

developed the structural scheme and formed an element base of the audio-

video codec.

Implementation of the research results.

On the basis of the developed

system using methods of audio-video information compression by brightness
conversion with blocks, adaptively varying sizes and inter-audio frame processing:

A system of effective video information compression that eliminates

structural redundancy using adaptive blocks, preserving the quality of images
based on interframe processing, eliminating the temporary redundancy of TV
programs, is embedded in the compression of the removed programs in the state
unitary company «O'zbekiston MTRK mediamarkazi». The results of the research
make it possible to reduce the volume of output files by 1.2 times and to store 20%
more information in the server.

The system for eliminating the temporal redundancy of audio signals based on

inter-audio frame processing is implemented in the compression of recorded audio
information in the Tashkent broadcasting house of the state unitary company
«Respublika teleradiomarkazi». The obtained results make it possible to reduce the
volume of output files depending on the plot by 1.05–1.1 times (5–10%), coding


background image

38

the repetition of sound signals.

Structure and volume of the dissertation.

The

structure of the dissertation

consists of an introduction, four chapters, conclusion and bibliography. The
volume of the thesis is 119 pages.


background image

39

ЭЪЛОН ҚИЛИНГАН ИШЛАР РЎЙИҲАТИ

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ

LIST OF PUBLISHED WORKS

I бўлим (Часть I; Part I)

1.

Носиров Х.Х., Гаврилов И.А., Абдуазизов А.А. Фрактальный метод

сжатия широкополосных аудиосигналов // Вестник ТУИТ, – Ташкент, 2011.
– №1. – С. 44-48, (05.00.00; №10).

2.

Носиров Х.Х., Гаврилов И.А., Рахимов Т.Г. Сжатие аудиосигналов на

основе фрактально-спектральных преобразований // Вестник ТУИТ.

Ташкент, 2013. – №1-2. – С. 45-53, (05.00.00; №10).

3.

Nosirov Kh.Kh., Gavrilov I.A., Puziy A.N. Choice of brightness

transformation method to improve video compression efficiency of TV images //
Вестник ТУИТ. – Ташкент, 2015. – №2. – С. 86-91, (05.00.00; №10).

4.

Носиров Х.Х. Яркостное преобразование телевизионных изображений

// Ахборот коммуникациялари: Тармоқлар – Технологиялар – Ечимлар.
– Тошкент, 2017. – №1(41). – С.13-18, (05.00.00; №2).

5.

Носиров Х.Х. Современные методы межкадровой обработки аудио

сигналов // Вестник ТУИТ. –Ташкент, 2017. – №1. –С. 48-53, (05.00.00; №10).

6.

Носиров

Х.Х.,

Гаврилов

И.А.

Исследование

квантователя

коэффициентов вейвлет преобразований на примере видео кодека Дирак //
Вестник ТУИТ. – Ташкент, 2017. – №1. – С. 110-117, (05.00.00; №10).

7.

Nosirov Kh.Kh., Kamilov M.M. Brightness transformation of image with

adaptive blocks, research of its efficiency in compression and estimation of
reconstructed image quality // European Science Review. – Vienna, 2017. – № 1-2.
–P. 189-192, (05.00.00; №3).

8.

Nosirov Kh.Kh., Gavrilov I.A., Puziy A.N. Application Scaling Methods

To Improve TV Images Data Compression // European Science Review. – Vienna,
2017. – № 1-2. – P. 218-221, (05.00.00; №3).

9.

Носиров Х.Х. Уменьшение размеров изображений для увеличения

коэффициента сжатия, и его влияние на качество восстановления в кодеке
Дирак // Eurasian Union of Scientists. – Москва, 2016. – №9, часть 2. – С. 17-19,
(№5) Global Impact Factor, IF=0,388.

II бўлим (Часть II; Part II)

10.

Носиров Х.Х. Применение методов дифференциальной кодовой

модуляции с предсказанием для сжатия звуковых сигналов // Международная
научно-техническая конференция студентов, аспирантов и молодых
специалистов государств участников РСС «Техника и технологии связи».
– Ташкент, 9-10 октября 2008г. – С. 159-160.

11.

Носиров Х.Х. Сжатие звуковых сигналов на основе вокодеров //

Международная научно-техническая конференция студентов, аспирантов и


background image

40

молодых специалистов государств участников РСС «Техника и технологии
связи». – Ташкент, 9-10 октября 2008г. – С. 157-159.

12.

Носиров Х.Х. Алгоритм сжатия звука "Alternative MP3" // «Ахборот

– коммуникация технологиялари» аспирант, магистрант ва иқтидорли
талабаларининг илмий – техник конференцияси. – Тошкент, 2009 йил
9-10 апрель. – Б. 70-72.

13.

Носиров Х.Х., Турсунбоев А. Сжатие аудиосигналов на основе

межаудиокадровой обработки // «Фан ва таълимда ахборот-коммуникация
технологиялари» Республика илмий – техник конференцияси. – Тошкент,
2010 йил 25-26 март. – Б. 219-223.

14.

Nosirov Kh. Kh., Gavrilov I.А., Аbduazizov А.А. The fractal method of

compression of broadband audio signals // 4th international conference on
Application of Information and Communication Technologies – AICT 2010.
– Tashkent, October 12-14, 2010. – P. 247-250.

15.

Носиров Х.Х., Ким М.В. Метод обработки телевизионных

изображений на основе внутрикадровой разности // Республиканская научно-
техническая конференция молодых ученых, исследователей, магистрантов и
студентов “Проблемы информационных технологий и телекоммуникаций”.
– Ташкент, 15-16 марта 2012. – III том. – С. 6-8.

16.

Носиров Х.Х., Отто С.Э., Бобобекова Д.Б. Реализация и оценка

эффективности метода обработки ТВ изображений на основе адаптивного
блочного разбиения // Республиканская научно-техническая конференция
«Информационные технологии и проблемы телекоммуникаций». – Ташкент,
14 март 2013. – Том 4. – С. 200-201.

17.

Носиров Х.Х., Отто С.Э. Метод яркостного преобразования ТВ

изображений на основе адаптивного блочного разбиения // Республиканская
научно-техническая

конференция

«Информационные

технологии

и

проблемы телекоммуникаций». –Ташкент, 14 март 2013. –Том 4. –С. 202-203.

18.

Носиров Х.Х., Гаврилов И.А. Исследование методов и алгоритмов

квантования вейвлет коэффициентов для сжатия ТВ изображений //
Республиканская

научно-техническая

конференция

«Перспективы

эффективного развития информационных технологий и телекоммуни-
кационных систем». – Ташкент, 13-14 март 2014. – Часть 3. – С.112-114.

19.

Nosirov Kh.Kh. Problems of preservation of image and sound quality of

TV programs when transferring them into narrow band channels // 1st KHU-TUIT
International Conference for ICT and Knowledge Economy. – Tashkent,
25-26 August 2014. – P.81-86.

20.

Nosirov Kh., Gavrilov I, Rakhimov T. Problems of interframe

compression of TV images based on motion compensation // Международная
конференция “Perspectives for development of information technologies”
ITPA-2014. – Tashkent, 4-5 November 2014. – P. 308-312.

21.

Носиров Х., Рахимов Т. Комбинированный метод сжатия

вещательной видеоинформации // Республиканская научно-техническая
конференция

«Информационные

технологии

и

проблемы

телекоммуникаций». – Ташкент, 12 март 2015г., – Том 3. – С. 279-281.


background image

41

22.

Ахмедова З., Носиров Х. Эффективные системы сжатия звука и

рекомендации по их применению // Республиканская научно-техническая
конференция

«Информационные

технологии

и

проблемы

телекоммуникаций». – Ташкент, 12 март 2015. – Том 3. –

С. 319-322.

23.

Nosirov Kh., Rakhimov T. Using vector quantization for video coding //

Международная конференция “Perspectives for development of information
technologies” ITPA-2015. – Tashkent, 4-5 November 2015. P. 308-312.

24.

Носиров Х.Х., С.А.Рахмонов Исследование параметров кодека

HEVC/H.265 относительно 8k вещания // Республиканская научно-
техническая конференция «Информационные технологии и проблемы
телекоммуникаций», – Ташкент, 10-11 март 2016. – Том 7. – С. 465-468.

25.

Носиров Х. Исследование влияния масштабирования кадров на

степень сжатия и качество восстановленных изображений в кодеке Dirac //
VIII Международная научная конференция «Современные направления в
науке и технологии». – Ташкент, 18-19 ноября 2016. – С. 601-605.

26.

Носиров Х. Влияние масштабирования на степень сжатия и качество

восстановленния изображений //

Республиканская научно-техническая

конференция

«Информационные

технологии

и

проблемы

телекоммуникаций». – Ташкент, 5-6 апрель 2017. –

С. 311-312.

27.

Маматов М.Ш., Ташманов Е.Б., Гаврилов И.А., Пузий А.Н.,

Носиров Х.Х., Измеритель средней яркости кадров сравниваемых
изображений // № DGU 03670 Агенство по интеллектуальной собственности
РУз. – Ташкент, 21.04.2016..

28.

Маматов М.Ш., Гаврилов И.А., Пузий А.Н., Ташманов Е.Б.,

Носиров Х.Х. Корректор четкости декодированных изображений //
№ DGU 03672 Агенство по интеллектуальной собственности РУз. – Ташкент,
21.04.2016.

29.

Маматов М.Ш., Гаврилов И.А., Пузий А.Н., Носиров Х.Х.,

Ташманов Е.Б., Измеритель резкости сравниваемых изображений //
№ DGU 03673 Агенство по интеллектуальной собственности РУз. – Ташкент,
21.04.2016.


background image

Автореферат «Муҳаммад ал-Хоразмий авлодлари» илмий журнали

таҳририятида таҳрирдан ўтказилди ва ўзбек, рус, инглиз тилларида
матнларни мослиги текширилди.

































Босишга рухсат этилди: 16.10.2017 йил

Бичими 60х84 1/16 , «Times New Roman»

гарнитурада офсет усулида босилди.

Шартли босма табоғи 2,75. Адади 100. Буюртма: № 70.

«Aloqachi» босмахонасида чоп этилди.

Тошкент шаҳри, А. Темур кучаси 108.


background image


background image

Библиографические ссылки

Носиров Х.Х., Гаврилов И.А., Абдуазизов А.А. Фрактальный метод сжатия широкополосных аудиосигналов // Вестник ТУИТ, - Ташкент, 2011. -№1. - С. 44-48, (05.00.00; №10).

Носиров Х.Х., Гаврилов И.А., Рахимов Т.Г. Сжатие аудиосигналов на основе фрактально-спектральных преобразований // Вестник ТУИТ. -Ташкент, 2013. -№1-2. - С. 45-53, (05.00.00; №10).

Nosirov Kh.Kh., Gavrilov ГА., Puziy A.N. Choice of brightness transformation method to improve video compression efficiency of TV images // Вестник ТУИТ. - Ташкент, 2015. - №2. - С. 86-91, (05.00.00; №10).

Носиров Х.Х. Яркостное преобразование телевизионных изображений // Ахборот коммуникациялари: Тармоқлар - Технологиялар - Ечимлар. - Тошкент, 2017. - № 1 (41). - С. 13-18, (05.00.00; №2).

Носиров Х.Х. Современные методы межкадровой обработки аудио сигналов // Вестник ТУИТ. -Ташкент, 2017. - №1. -С. 48-53, (05.00.00; №10).

Носиров Х.Х., Гаврилов И.А. Исследование квантователя коэффициентов вейвлет преобразований на примере видео кодека Дирак // Вестник ТУИТ. - Ташкент, 2017.-№ Г-С. 110-117, (05.00.00; №10).

Nosirov Kh.Kh., Kamilov М.М. Brightness transformation of image with adaptive blocks, research of its efficiency in compression and estimation of reconstructed image quality // European Science Review. - Vienna, 2017. - № 1-2. -P. 189-192, (05.00.00; №3).

Nosirov Kh.Kh., Gavrilov I.A., Puziy A.N. Application Scaling Methods To Improve TV Images Data Compression // European Science Review. - Vienna, 2017. - № 1 -2. - P. 218-221, (05.00.00; №3).

Носиров Х.Х. Уменьшение размеров изображений для увеличения коэффициента сжатия, и его влияние на качество восстановления в кодеке Дирак // Eurasian Union of Scientists. - Москва, 2016. - №9, часть 2. - С. 17-19, (№5) Global Impact Factor, IF=0,388.

Носиров Х.Х. Применение методов дифференциальной кодовой модуляции с предсказанием для сжатия звуковых сигналов И Международная научно-техническая конференция студентов, аспирантов и молодых специалистов государств участников РСС «Техника и технологии связи». - Ташкент, 9-10 октября 2008г. - С. 159-160.

Носиров Х.Х. Сжатие звуковых сигналов на основе вокодеров // Международная научно-техническая конференция студентов, аспирантов и молодых специалистов государств участников РСС «Техника и технологии связи». - Ташкент, 9-10 октября 2008г. - С. 157-159.

Носиров Х.Х. Алгоритм сжатия звука "Alternative MP3" И «Ахборот-коммуникация технологиялари» аспирант, магистрант ва иқтидорли талабаларининг илмий - техник конференцияси. - Тошкент, 2009 йил 9-10 апрель. - Б. 70-72.

Носиров Х.Х., Турсунбоев А. Сжатие аудиосигналов на основе межаудиокадровой обработки // «Фан ва таълимда ахборот-коммуникация технологиялари» Республика илмий - техник конференцияси. - Тошкент, 2010 йил 25-26 март. - Б. 219-223.

Nosirov Kh. Kh., Gavrilov LA., Abduazizov A.A. The fractal method of compression of broadband audio signals // 4th international conference on Application of Information and Communication Technologies - AICT 2010.-Tashkent, October 12-14, 2010. - P. 247-250.

Носиров X.X., Ким M.B. Метод обработки телевизионных изображений на основе внутрикадровой разности // Республиканская научно-техническая конференция молодых ученых, исследователей, магистрантов и студентов “Проблемы информационных технологий и телекоммуникаций”.-Ташкент, 15-16 марта 2012. - III том. - С. 6-8.

Носиров Х.Х., Отто С.Э., Бобобекова Д.Б. Реализация и оценка эффективности метода обработки ТВ изображений на основе адаптивного блочного разбиения // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций». - Ташкент, 14 март 2013. - Том 4. - С. 200-201.

Носиров Х.Х., Отто С.Э. Метод яркостного преобразования ТВ изображений на основе адаптивного блочного разбиения // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций». -Ташкент, 14 март 2013. -Том 4. -С. 202-203.

Носиров Х.Х., Гаврилов И.А. Исследование методов и алгоритмов квантования вейвлет коэффициентов для сжатия ТВ изображений // Республиканская научно-техническая конференция «Перспективы эффективного развития информационных технологий и телекоммуникационных систем». - Ташкент, 13-14 март 2014. - Часть 3. - С. 112-114.

Nosirov Kh.Kh. Problems of preservation of image and sound quality of TV programs when transferring them into narrow band channels // 1st KHU-TUIT International Conference for ICT and Knowledge Economy. - Tashkent, 25-26 August 2014.-P.81-86.

Nosirov Kh., Gavrilov I, Rakhimov T. Problems of interframe compression of TV images based on motion compensation // Международная конференция “Perspectives for development of information technologies” ITPA-2014. - Tashkent, 4-5 November 2014. - P. 308-312.

Носиров X., Рахимов T. Комбинированный метод сжатия вещательной видеоинформации // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций». - Ташкент, 12 март 2015г., - Том 3. - С. 279-281.

Ахмедова 3., Носиров X. Эффективные системы сжатия звука и рекомендации по их применению // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций». - Ташкент, 12 март 2015. - Том 3. -С. 319-322.

Nosirov Kh., Rakhimov Т. Using vector quantization for video coding // Международная конференция “Perspectives for development of information technologies” ITPA-2015. - Tashkent, 4-5 November 2015. P. 308-312.

Носиров X.X., С.А.Рахмонов Исследование параметров кодека HEVC/H.265 относительно 8k вещания // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций», - Ташкент, 10-11 март 2016. - Том 7. - С. 465-468.

Носиров X. Исследование влияния масштабирования кадров на степень сжатия и качество восстановленных изображений в кодеке Dirac // VIII Международная научная конференция «Современные направления в науке и технологии». - Ташкент, 18-19 ноября 2016. - С. 601-605.

Носиров X. Влияние масштабирования на степень сжатия и качество восстановленния изображений // Республиканская научно-техническая конференция «Информационные технологии и проблемы телекоммуникаций». - Ташкент, 5-6 апрель 2017. -С. 311-312.

Маматов М.Ш., Ташманов Е.Б., Гаврилов И.А., Пузий А.Н., Носиров Х.Х., Измеритель средней яркости кадров сравниваемых изображений // № DGU 03670 Агенство по интеллектуальной собственности РУз. - Ташкент, 21.04.2016..

Маматов М.Ш., Гаврилов И.А., Пузий А.Н., Ташманов Е.Б., Носиров Х.Х. Корректор четкости декодированных изображений // № DGU 03672 Агенство по интеллектуальной собственности РУз. - Ташкент, 21.04.2016.

Маматов М.Ш., Гаврилов И.А., Пузий А.Н., Носиров Х.Х., Ташманов Е.Б., Измеритель резкости сравниваемых изображений // № DGU 03673 Агенство по интеллектуальной собственности РУз. - Ташкент, 21.04.2016.