Diktorni tanib olish masalasida ovozni xarakterlovchi belgilarni ajratib olishning chiziqli bashoratlash va spektral sentroid usullari

Аннотация

Biometrik texnologiyalar axborot xavfsizligi sohasida istiqbolli yo‘nalish hisoblanadi. Ovozli biometriya bugungi kunda keng tarqalgan bo'lib, ovozli tizimlaming sifatini oshirish bo'yicha ishlar dolzarb hisoblanadi. Nutq xususiyatlarini ajratib olish usulini tanlash ovozli avtomatik tizimlami loyihalashning asosiy bosqichlaridan biridir. Ish mavzusi ushbu usullami o'rganish bilan bog'liq. Shuningdek, ushbu ishda chiziqli bashoratlash va spektral sentroid algoritmlariga e’tibor qaratiladi. Nutq xususiyatlarini parametrlash nutq, his-tuyg'ular, til, va jinsga bog'liq. Ushbu ishda diktomi tanib olish uchun nutqning akustik xususiyatlarini aniqlashning asosiy yondashuvlari sanab o'tilgan bo‘lsa-da, material yuqorida sanab o'tilgan nutq signallarini qayta ishlash vazifalarida ham foydali bo'lishi mumkin.

Тип источника: Конференции
Годы охвата с 2024
inLibrary
Google Scholar
Выпуск:
  • Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта
  • Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта
CC BY f
187-190
57

Скачивания

Данные скачивания пока недоступны.
Поделиться
Мирзаев N., & Оринбоев J. (2024). Diktorni tanib olish masalasida ovozni xarakterlovchi belgilarni ajratib olishning chiziqli bashoratlash va spektral sentroid usullari . Новый Узбекистан: наука, образование и инновации, 1(1), 187–190. извлечено от https://www.inlibrary.uz/index.php/new-uzbekistan/article/view/32156
Номаз Мирзаев, Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта
т.ф.д., к.и.х.
Жохонгир Оринбоев, Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта
аспирант
Crossref
Сrossref
Scopus
Scopus

Аннотация

Biometrik texnologiyalar axborot xavfsizligi sohasida istiqbolli yo‘nalish hisoblanadi. Ovozli biometriya bugungi kunda keng tarqalgan bo'lib, ovozli tizimlaming sifatini oshirish bo'yicha ishlar dolzarb hisoblanadi. Nutq xususiyatlarini ajratib olish usulini tanlash ovozli avtomatik tizimlami loyihalashning asosiy bosqichlaridan biridir. Ish mavzusi ushbu usullami o'rganish bilan bog'liq. Shuningdek, ushbu ishda chiziqli bashoratlash va spektral sentroid algoritmlariga e’tibor qaratiladi. Nutq xususiyatlarini parametrlash nutq, his-tuyg'ular, til, va jinsga bog'liq. Ushbu ishda diktomi tanib olish uchun nutqning akustik xususiyatlarini aniqlashning asosiy yondashuvlari sanab o'tilgan bo‘lsa-da, material yuqorida sanab o'tilgan nutq signallarini qayta ishlash vazifalarida ham foydali bo'lishi mumkin.


background image

187

Real vaqt rejimida tanib olish: Real vaqtda his-tuygʻularni aniqlashga qodir boʻlgan SER

tizimlarini ishlab chiqishga eʻtibor qaratilib, ushbu tizimlar turli sohalarda, jumladan, inson va
kompyuter oʻzaro taʻsiri, virtual yordamchilar va hissiyotlardan xabardor texnologiyalarni
ilovalarini yaratish mumkin.

Ruhiy salomatlikdagi ilovalar: SER texnologiyasi ruhiy salomatlikni baholash ilovalarni

yaratishi mumkin, bu ruhiy salomatlik buzilishi xavfi ostida boʻlgan shaxslarni aniqlashga
yordam beradi va yordam xizmatlarini taqdim etishi mumkin.

Xulosa

. SER sohasi kelajakda koʻplab yutuqlar yaxshilangan aniqlik, real vaqtda tanib

olish imkoniyatlari va multimodal yondashuvlarning integratsiyasiga olib kelishi kutilmoqda.
SER tizimlari turli sohalarni, jumladan, inson va kompyuter oʻzaro taʻsirini, aqliy salomatlikni
baholashni va foydalanuvchilarning shaxsiy tajribasini yaxshilash potentsialiga ega. Biroq, SER
texnologiyasi rivojlanib borar ekan, maxfiylik va axloq bilan bogʻliq muammolarni hal qilish
juda muhimdir. Umuman olganda, Nutqning his-tuygʻularini aniqlashning kelajagi texnologiya
bilan qanday munosabatda boʻlishimizni, inson his-tuygʻularini tushunishimizni va odamlarning
farovonligini qoʻllab-quvvatlashga erishishimiz mumkin. Doimiy tadqiqotlar, innovatsiyalar va
hamkorlik orqali SER kelgusi yillarda jamiyatga katta hissa qoʻshish imkoniyatiga ega.

Foydalanilgan adabiyotlar:

1.

Mamatov N.S. Madaminjonov A.D. “Sunʻiy neyron tarmoqlari va ularning asosiy turlari”.

Mirzo Ulugʻbek nomidagi Oʻzbekiston Milliy universitetining Jizzax filiali “Kompyuter ilimlari
va muhandislik texnologiyalari” mavzusidagi Xalqaro ilmiy -texnik anjuman materiallari
toʻplami, 2023.
2.

Liu, G., Cai, S., & Wang, C. (2023). Speech emotion recognition based on emotion

perception. EURASIP Journal on Audio, Speech, and Music Processing, 2023(1).
https://doi.org/10.1186/s13636-023-00289-
3.

De Lope, J., & Graña, M. (2023). An ongoing review of speech emotion recognition.

Neurocomputing, https://doi.org/10.1016/j.neucom.2023.01.002

DIKTORNI TANIB OLISH MASALASIDA OVOZNI XARAKTERLOVCHI

BELGILARNI AJRATIB OLISHNING CHIZIQLI BASHORATLASH VA SPEKTRAL

SENTROID USULLARI

t.f.d., k.i.x.

Mirzayev Nomaz,

doktorant O‘rinboyev Johongir Kalbay o‘g‘li

Raqamli texnologiyalar va sunʼiy intellektni rivojlantirish ITI

jahongir8010@gmail.com

Annotatsiya:

Biometrik texnologiyalar axborot xavfsizligi sohasida istiqbolli yo‘nalish

hisoblanadi. Ovozli biometriya bugungi kunda keng tarqalgan bo‘lib, ovozli tizimlarning sifatini
oshirish bo‘yicha ishlar dolzarb hisoblanadi. Nutq xususiyatlarini ajratib olish usulini tanlash
ovozli avtomatik tizimlarni loyihalashning asosiy bosqichlaridan biridir. Ish mavzusi ushbu
usullarni o‘rganish bilan bog‘liq. Shuningdek, ushbu ishda chiziqli bashoratlash va spektral
sentroid algoritmlariga e’tibor qaratiladi. Nutq xususiyatlarini parametrlash nutq, his-tuyg‘ular,
til, va jinsga bog‘liq. Ushbu ishda diktorni tanib olish uchun nutqning akustik xususiyatlarini
aniqlashning asosiy yondashuvlari sanab o‘tilgan bo‘lsa-da, material yuqorida sanab o‘tilgan
nutq signallarini qayta ishlash vazifalarida ham foydali bo‘lishi mumkin.

Kalit so‘zlar:

diktorni tanib olish, nutqni tahlil qilish, chiziqli bashoratlash, pertseptiv

chiziqli bashoratlash, spektral sentroid.

Kirish.

Biometrik texnologiyalar jamiyat hayotiga faol joriy etilmoqda. Buni global va

mahalliy darajada biometrika bozorining mavjud va kutilayotgan o‘sishi tasdiqlaydi [1].

Nutqni tanib olish masalasi shu sohadagi uskunalarning mavjudligi, masofadan

identifikatsiyalash imkoniyati borligi, o‘rganish jarayonining soddaligi va istemolchi uchun
foydalana olish qulayligi bilan axborot xavfsizligi sohasida keng qo‘llaniladigan mashxur
biometrika hisoblanadi. Turli sharoitlarda shaxsni tanib olish sifatini yaxshilash va soxta


background image

188

hujumlarga qarshi choralar topish nutq signallarini qayta ishlashda dolzarb muammolar bo‘lib
qolmoqda. Ovozli biometrikaning avtomatik tizimlarining muhim tarkibiy qismi nutq signalining
axborot sozlamalarini yuzaga chiqarishdir. Ushbu ishning maqsadi nutq ma’lumotlarini raqamli
qayta ishlashga qiziqqan ishlab chiqaruvchilar va tadqiqotchilar uchun diktorni ovoz yordamida
aniqlash vazifalarida nutqning individual xususiyatlarini aniqlashning mavjud usullari haqida
umumiy ma’lumot berishdir.

Chiziqli bashoratlash

Chiziqli bashorat uzoq vaqt davomida nutqni raqamli qayta ishlash vazifalariga asosiy

yondashuvlardan biri bo‘lib kelmoqda. U asosiy tovush davrini, formantlarni va nutqning boshqa
asosiy parametrlarini baholash uchun ishlatilishi mumkin. Chiziqli bashoratlash usulining
printsipi shundaki, nutq signalining bir qismi avvalgi signal bo‘limlarining chiziqli birikmasi
bilan yaqinlashishi mumkin. Nutq vaqt o‘tishi bilan o‘zgarib turadigan chiziqli filtrning (nutq
yo'lining) qo‘zg‘alishi natijasida lokalizatsiya qilinmagan nutq segmentlari uchun tasodifiy
shovqin yoki ovozli nutq uchun impulslar ketma-ketligi natijasida hosil bo‘ladi deb taxmin
qilinadi. Nutqni shakllantirishning soddalashtirilgan jarayoni (1-rasm) o‘zgaruvchan parametrlari
va uzatish funktsiyasi bo‘lgan chiziqli tizim bilan tavsiflanadi:

𝐻(𝑧) =

𝐺

1 − ∑

𝑎

𝑘

𝑧

−𝑘

𝑝
𝑘=1

Bu yerda

𝐺

– kuchaytirish koeffitsienti,

𝑎

𝑘

– bashoratlash koeffitsienti,

𝑝

– chiziqli

bashoratlashning tartibi [5].

1-Rasm. Nutqni shakllantirishning asosiy modelining blok sxemasi

Chiziqli bashoratlash konsepsiyasiga ko‘ra 1- rasmdagi saxema uchun

𝑠(𝑛)

nutq signali

n-

chi na’munasining

𝑢(𝑛)

qo‘zg‘alish signaliga bog‘ligi

𝑠(𝑛) = ∑ 𝑎

𝑘

(𝑠(𝑛 − 𝑘) + 𝐺𝑢(𝑛).

𝑝

𝑘=1

orqali ifodalanadi.

𝑎

𝑘

chiziqli bashoratlash koeffitsienti, chiqish signali bo‘lgan tizim sifatida quyidagicha

taqdim etiladi:

𝑠(𝑛) = ∑ 𝑎

𝑘

(𝑠(𝑛 − 𝑘).

𝑝

𝑘=1

Ushbu ifodaning mohiyati bashoratlash xatosini minimallashtirish orqali nutq signalidan

chiziqli bashoratlash koeffitsienti

(linear prediction coefficients (codes) – LPC)

𝑎

𝑘

ni aniqlash

hisoblanadi. Bashoratlash xatosi

𝑒(𝑛)

quyidagicha aniqlanadi

𝑒(𝑛) = 𝑠(𝑛) = ∑ 𝑎

𝑘

(𝑠(𝑛 − 𝑘).

𝑝

𝑘=1

Chiziqli bashoratlash koeffitsientlarini hisoblashning uchta asosiy algoritmi mavjud:

kovariatsiya, avtokorrelyatsiya va narvon (2-rasm). Ularning batafsil tavsifini [5] da, qiyosiy
tahlili bilan qisqacha xulosani [6] maqolada topish mumkin.


background image

189

2-Rasm. LPC algoritmlarining samaradorligini taqqoslash

Spektral sentroid

Spektral sentroid chastota (spectral centroid frequency – SCF) ma’lum bir diapazon ostidagi

o‘rtacha og‘irlikdagi chastota bo‘lib, unda og‘irlikkoeffitsientlari ushbu diapazon ostidagi har bir
chastota komponentining normallashtirilgan energiyasini ifodalaydi [7]. Spektral sentroid
chastotadan qo‘shni diapazon ostidagi cho‘qqilar ko‘rinishida namoyon bo‘ladigan
formantlarning taxminiy joylashuvini baholash mumkin. Spektral sentroid chastotaga asosiy
tovush va garmonik shakldagi o‘zgarishlar ta’sir qiladi.

𝐹

𝑘

diapazon ostidagi spektral sentroid

chastota k-chi diapazon osti uchun quyidagicha aniqlanadi:

𝐹

𝑘

=

𝑢

𝑘

𝑓=𝑙

𝑘

𝑓

|

𝑆

[

𝑓

]

𝜔

𝑘

[

𝑓

]|

𝑢

𝑘

𝑓=𝑙

𝑘

|

𝑆

[

𝑓

]

𝜔

𝑘

[

𝑓

]|

bu yerda

u

va

l

diapazon ostining yuqori va quyi chegaraviy chastotasidir;

𝑆[𝑓]

𝑘

diapazon

ostidagi bo‘lingan freym spektori,

𝜔

𝑘

- filtrning chastotali javobi. Spektral sentroid amplituda

(spectral centroid magnitude – SCM) – bu ma’lum bir diapazon osti uchun amplitudaning
o‘rtacha og‘irlikdagi qiymati bo‘lib, bu yerda og‘irlik koeffitsientlari

𝑀

𝑘

=

𝑢

𝑘

𝑓=𝑙

𝑘

𝑓

|

𝑆

[

𝑓

]

𝜔

𝑘

[

𝑓

]|

𝑢

𝑘

𝑓=𝑙

𝑘

𝑓

formula yordamida hisoblangan ushbu diapazon ostidagi har bir amplituda komponentining
chastotalaridir.

SCM birinchi tartibli yaqinlashishda diapazon ostida energiya taqsimotini qayd etadi.

Og‘irlik funktsiyasi tufayli ikkita signalning har biri turli xil SCF va SCM qiymatlari bilan
ifodalanadi. Diapazon ostining kengligiga nisbatan og‘irlik funksiyasining qiyaligidagi farqni
ham qayd etish mumkin va bu elementlarning turli xil dispersiyalariga olib keladi. O‘rtacha
energiyani

𝑓 = 1

bo‘lganda yuqoridagi tenglama yordamida hisoblash mumkin. Spektral

sentroidning amplitudasi spektral sentroidning chastota holatidagi amplituda bo‘lganligi sababli,
u so‘zlovchini tanib olish uchun foydali bo‘lgan formantlarga tegishli ma’lumotlarni ham olib
yuradi.


background image

190

3-Rasm. 906 Hz markaziy chastotali diapazon osti uchun, diapazon osti spektri,o‘rtacha

energiya, spektral sentroid.

Xulosa.

Xulosa qilib aytish mumkinki, Chiziqli bashoratlash va spektral sentroid usullari

uzoq vaqt davomida nutqni raqamli qayta ishlash vazifalarida asosiy yondashuvlardan biri bo‘lib
qolmoqda. Ushbu usullar yordamida nutqni tanib olishdagi xatolikni bir muncha kamaytirish
mumkin.

Foydalanilgan adabiyotlar ro‘yxati

1.

Крылова И.Ю., Рудакова О.С. Биометрические технологии как механизм

обеспечения информационной безопасности в цифровой экономике // Молодой ученый.
– 2018. – № 45. – С. 74–79.

2.

Фант Г. Акустическая теория речеобразования / пер. с англ. Л.А. Варшавского и

В.И. Медведева ; под ред. В.С. Григорьева. – М.: Наука, 1964. – 284 с.

3.

Фланаган Дж.Л. Анализ, синтез и восприятие речи: пер. с англ. / под ред. А.А.

Пирогова. – М.: Связь, 1968. – 396 с.

4.

Кодзасов С.В., Кривнова О.Ф. Общая фонетика. – М.: Рос. гос. гуманит. ун-т,

2001. – 592 с.

5.

Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов: пер. с англ. /

под ред. М.В. Назарова и Ю.Н. Прохорова. – М.: Радио и связь, 1981. – 496 с.

6.

– Sapporo, Japan, 2014. – P. 300–302.

7.

Investigation of spectral centroid magnitude and frequency for speaker recognition /

J.M.K. Kua, T. Tharmarajah, M. Nosratighods, E. Ambikairajah, J. Epps // Odyssey 2010.
The Speaker and Language Recognition Workshop. – Brno, Czech Republic, 2010. – P. 34–
39.

GISTOLOGIK TASVIR CHEGARASIGA TEGIB TURGAN SOHALARNI OLIB

TASHLASH USULI

t.f.d., k.i.x. Mirzayev Nomaz,

tayanch doktorant Meliyev Farxod Fattoyevich,

stajer tadqiqotchi G'afforov Nuraddin Yorkin o'g'li

Raqamli texnologiyalar va sunʼiy intellektni rivojlantirish ITI

farhodtorg@gmail.com

Annotatsiya:

Mazkur ishda gistologik tasvirlarni boʻsagʻaviy segmentlash usuli tadqiq

qilinib, tasvir chegaralarida boʻlgan va tasvirda toʻliq nomoyon boʻlmagan sohalarni olib
tashlash usuli taklif etilgan. Usul eksperimental tadqiqotlar orqali tekshirib ko’rilgan. Taklif
qilingan usul asosida yaratilgan dasturiy vosita yordamida olib borilgan tajribaviy tadqiqotlar
yoritilgan.

Kalit soʻzlar:

gistologik tasvir, tasvirlarga raqamli ishlov berish, segmentlash,

boʻsagʻaviy funksiya, sinflararo dispersiya.

Kirish

Zamonaviy tibbiy tasvirlarga ishlov berish usullari tashxis aniqligi va samaradorligini

oshirishda, ayniqsa gistologiya sohasida muhim rol oʻynaydi [1]. Hozirgi tibbiy diagnostikada
bemorlarning toʻqimalari va hujayralari haqida maʼlumot olish uchun gistologik tasvirlar keng
qoʻllaniladi. Tibbiyot sohasida tasvirlarni olishning raqamli gistologiya kabi yuqori texnologiyali
usullari paydo boʻlishi bilan olingan maʼlumotlarni qayta ishlash va tahlil qilishning
avtomatlashtirilgan usullariga ehtiyoj ortdi [2,3]. Ushbu sohadagi asosiy muammolardan biri
gistologik tasvirlarda biologik tuzilmalar hajmi va chegaralarini avtomatlashtirilgan tarzda
aniqlashdir. Gistologik tasvirlarda sohalarning oʻlchamini aniqlash maʼlumotlarni tahlil qilish

Библиографические ссылки

Крылова И.Ю., Рудакова О.С. Биометрические технологии как механизм обеспечения информационной безопасности в цифровой экономике // Молодой ученый. -2018,-№45.-С. 74-79.

Фант Г. Акустическая теория рсчсобразования / пер. с англ. Л.А. Варшавского и В.И. Медведева ; под рсд. В.С. Григорьева. - М.: Наука, 1964. - 284 с.

Фланаган Дж.Л. Анализ, синтез и восприятие речи: пер. с англ. / под ред. А.А. Пирогова. - М.: Связь, 1968. - 396 с.

Кодзасов С.В., Кривнова О.Ф. Общая фонетика. - М.: Рос. гос. гуманит. ун-т, 2001.-592 с.

Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов: пер. с англ. / под ред. М.В. Назарова и Ю.Н. Прохорова. - М.: Радио и связь, 1981.-496 с.

- Sapporo, Japan, 2014. - Р. 300-302.

Investigation of spectral centroid magnitude and frequency for speaker recognition / J.M.K. Kua, T. Tharmarajah, M. Nosratighods, E. Ambikairajah, J. Epps П Odyssey 2010. The Speaker and Language Recognition Workshop. - Brno, Czech Republic, 2010. - P. 34-39.