Kalbos emocijų atpažinimas taikant mašininį mokymąsi (Temos vadovas: dr. Andrius Vytautas Misiukas Misiūnas)

Speech emotion recognition using machine learning (Topic supervisor: dr. Andrius Vytautas Misiukas Misiūnas)

Temos nr.: 55

Tema pateikta svarstymui: 2025-08-22 16:03:18

Patvirtinta skelbimui: 2025-08-27

Temos aprašas lietuvių kalba:

Darbo tikslas - atlikti kalbos emocijų atpažinimą garso (arba vaizdo) įrašuose mašinų mokymosi metodais. Darbo metu išbandyti ar pasiūlyti algoritmai turėtų būti pateikti taikomosios programos pavidalu vartotojui patogia forma.

Darbo uždaviniai: 1. Atlikti kalbos emocijų atpažinimo mašininio mokymosi metodais literatūros analizę. 2. Rasti darbui tinkančias duomenų imtis, išskirti aktualius atpažinimui požymius (pvz. intonacija), 3. Ištirti literatūroje pasiūlytų algoritmų efektyvumą kalbos emocijų atpažinimui, esant laiko pasiūlyti patobulinimų, 4. Suprojektuoti ir įgyvendinti taikomąją programą.

Galimi duomenų rinkiniai: Duomenų rinkiniai - RAVDESS https://zenodo.org/records/1188976#.Xpaa3i-caAP ; CREMA-D https://github.com/CheyneyComputerScience/CREMA-D

Preliminarūs literatūros šaltiniai: Keli preliminarūs šaltiniai - https://pmc.ncbi.nlm.nih.gov/articles/PMC7916477/ ; https://link.springer.com/article/10.1007/s10462-024-11065-x ; https://www.mdpi.com/2079-9292/10/10/1163

Preliminarios bibliotekos darbo įgyvendinimui: openSMILE https://github.com/audeering/opensmile-python ; librosa - https://github.com/librosa/librosa ; pyAudioAnalysis https://github.com/tyiannak/pyAudioAnalysis

Temos aprašas anglų kalba:

The aim of the work is to perform speech emotion recognition in audio (or video) recordings using machine learning methods. The algorithms tested or proposed during the work should be presented in the form of an application in a user-friendly form.

Tasks of the work: 1. Perform a literature analysis of speech emotion recognition using machine learning methods. 2. Find data samples suitable for the work, isolate relevant features for recognition (e.g. intonation), 3. Investigate the effectiveness of algorithms proposed in the literature for speech emotion recognition, and suggest improvements if necessary, 4. Design and implement an application.

Available datasets: Datasets - RAVDESS https://zenodo.org/records/1188976#.Xpaa3i-caAP ; CREMA-D https://github.com/CheyneyComputerScience/CREMA-D

Preliminary literature sources: Several preliminary sources - https://pmc.ncbi.nlm.nih.gov/articles/PMC7916477/ ; https://link.springer.com/article/10.1007/s10462-024-11065-x ; https://www.mdpi.com/2079-9292/10/10/1163

Preliminary libraries for the implementation of the work: openSMILE https://github.com/audeering/opensmile-python ; librosa - https://github.com/librosa/librosa ; pyAudioAnalysis https://github.com/tyiannak/pyAudioAnalysis

Temos tipas:

| Bakalauro kursinio darbo | | Bakalauro baigiamojo darbo |

Temų klasifikatorius:

| Paslaugų integracija (moderniųjų informacinių sistemų, paslaugų ar kitų išorinių komponentų integracija pagal taikymo sritį, architektūrinių sprendinių kūrimas bei tyrimai, įskaitant įvairių taikomųjų sričių signalų apdorojimo uždavinius) |

| Duomenų modeliavimas (reliacinių, struktūruotų ir nestruktūruotų duomenų modeliavimas, duomenų valdymo ir specializuotų duomenų bazių taikymai ir tyrimai) |

| Moderniosios interneto paslaugos (moderniųjų interneto paslaugų kūrimas ir jų tyrimai kontekstualizuotose aplinkose, pavyzdžiui, mobiliose, mikro servisuose) |