Darbo tikslas - atlikti kalbos emocijų atpažinimą garso (arba vaizdo) įrašuose mašinų mokymosi metodais. Darbo metu išbandyti ar pasiūlyti algoritmai turėtų būti pateikti taikomosios programos pavidalu vartotojui patogia forma.
Darbo uždaviniai: 1. Atlikti kalbos emocijų atpažinimo mašininio mokymosi metodais literatūros analizę. 2. Rasti darbui tinkančias duomenų imtis, išskirti aktualius atpažinimui požymius (pvz. intonacija), 3. Ištirti literatūroje pasiūlytų algoritmų efektyvumą kalbos emocijų atpažinimui, esant laiko pasiūlyti patobulinimų, 4. Suprojektuoti ir įgyvendinti taikomąją programą.
Galimi duomenų rinkiniai: Duomenų rinkiniai - RAVDESS https://zenodo.org/records/1188976#.Xpaa3i-caAP ; CREMA-D https://github.com/CheyneyComputerScience/CREMA-D
Preliminarūs literatūros šaltiniai: Keli preliminarūs šaltiniai - https://pmc.ncbi.nlm.nih.gov/articles/PMC7916477/ ; https://link.springer.com/article/10.1007/s10462-024-11065-x ; https://www.mdpi.com/2079-9292/10/10/1163
Preliminarios bibliotekos darbo įgyvendinimui: openSMILE https://github.com/audeering/opensmile-python ; librosa - https://github.com/librosa/librosa ; pyAudioAnalysis https://github.com/tyiannak/pyAudioAnalysis
The aim of the work is to perform speech emotion recognition in audio (or video) recordings using machine learning methods. The algorithms tested or proposed during the work should be presented in the form of an application in a user-friendly form.
Tasks of the work: 1. Perform a literature analysis of speech emotion recognition using machine learning methods. 2. Find data samples suitable for the work, isolate relevant features for recognition (e.g. intonation), 3. Investigate the effectiveness of algorithms proposed in the literature for speech emotion recognition, and suggest improvements if necessary, 4. Design and implement an application.
Available datasets: Datasets - RAVDESS https://zenodo.org/records/1188976#.Xpaa3i-caAP ; CREMA-D https://github.com/CheyneyComputerScience/CREMA-D
Preliminary literature sources: Several preliminary sources - https://pmc.ncbi.nlm.nih.gov/articles/PMC7916477/ ; https://link.springer.com/article/10.1007/s10462-024-11065-x ; https://www.mdpi.com/2079-9292/10/10/1163
Preliminary libraries for the implementation of the work: openSMILE https://github.com/audeering/opensmile-python ; librosa - https://github.com/librosa/librosa ; pyAudioAnalysis https://github.com/tyiannak/pyAudioAnalysis
| Bakalauro kursinio darbo | | Bakalauro baigiamojo darbo |
| Paslaugų integracija (moderniųjų informacinių sistemų, paslaugų ar kitų išorinių komponentų integracija pagal taikymo sritį, architektūrinių sprendinių kūrimas bei tyrimai, įskaitant įvairių taikomųjų sričių signalų apdorojimo uždavinius) |
| Duomenų modeliavimas (reliacinių, struktūruotų ir nestruktūruotų duomenų modeliavimas, duomenų valdymo ir specializuotų duomenų bazių taikymai ir tyrimai) |
| Moderniosios interneto paslaugos (moderniųjų interneto paslaugų kūrimas ir jų tyrimai kontekstualizuotose aplinkose, pavyzdžiui, mobiliose, mikro servisuose) |