Šio darbo tikslas - atlikti triukšmo šalinimo iš garso įrašų algoritmų tyrimą ir sukurti taikomąją programą.
Galima literatūra: Spectral Subtraction – klasikinis triukšmo šalinimo metodas: https://arxiv.org/pdf/2302.10313 Hibridiniai metodai – klasikiniai + gilieji neuroniniai tinklai: https://arxiv.org/pdf/2005.07551 Neuroninis modelis – gilusis mokymasis garso triukšmo šalinimui: https://arxiv.org/pdf/2005.07551
Galimi duomenų rinkiniai (datasets): NoisySpeech Database(https://zenodo.org/records/5117901) Sudarytas iš švarių ir triukšmingų kalbos įrašų, skirtas testuoti triukšmo šalinimo algoritmus. LibriSpeech Dataset (https://www.tensorflow.org/datasets/catalog/librispeech) Sudarytas iš švarių kalbos įrašų. Gali būti naudojamas kaip „ground truth“ treniravimo arba palyginimo duomenims. VoiceBank-DEMAND-16k (https://huggingface.co/datasets/JacobLinCool/VoiceBank-DEMAND-16k) Populiarus rinkinys kalbos triukšmo šalinimo tyrimams. Sudarytas iš švarios kalbos (VoiceBank corpus) ir natūralių triukšmų (DEMANDdataset).
Galimos bibliotekos: Triukšmo šalinimui naudojant spektrinį atėmimą (Spectral Subtraction) radau noisereduce biblioteką (https://pypi.org/project/noisereduce/).
The aim of this work is to conduct a study of noise removal algorithms from audio recordings and to develop an application.
Available literature: Spectral Subtraction – classical noise removal method: https://arxiv.org/pdf/2302.10313 Hybrid methods – classical + deep neural networks: https://arxiv.org/pdf/2005.07551 Neural model – deep learning for audio noise removal: https://arxiv.org/pdf/2005.07551
Available datasets: NoisySpeech Database(https://zenodo.org/records/5117901) Consists of clean and noisy speech recordings, intended for testing noise removal algorithms. LibriSpeech Dataset (https://www.tensorflow.org/datasets/catalog/librispeech) Consists of clean speech recordings. Can be used as ground truth for training or comparison data. VoiceBank-DEMAND-16k (https://huggingface.co/datasets/JacobLinCool/VoiceBank-DEMAND-16k) A popular dataset for speech denoising research. Consists of clean speech (VoiceBank corpus) and natural noise (DEMANDdataset).
Available libraries: For denoising using Spectral Subtraction, I found the noisereduce library (https://pypi.org/project/noisereduce/).
| Bakalauro kursinio darbo | | Bakalauro baigiamojo darbo |
| Paslaugų integracija (moderniųjų informacinių sistemų, paslaugų ar kitų išorinių komponentų integracija pagal taikymo sritį, architektūrinių sprendinių kūrimas bei tyrimai, įskaitant įvairių taikomųjų sričių signalų apdorojimo uždavinius) |
| Duomenų modeliavimas (reliacinių, struktūruotų ir nestruktūruotų duomenų modeliavimas, duomenų valdymo ir specializuotų duomenų bazių taikymai ir tyrimai) |
| Moderniosios interneto paslaugos (moderniųjų interneto paslaugų kūrimas ir jų tyrimai kontekstualizuotose aplinkose, pavyzdžiui, mobiliose, mikro servisuose) |