Garso triukšmo pašalinimo algoritmų tyrimas (Temos vadovas: dr. Andrius Vytautas Misiukas Misiūnas)

Research on audio noise removal algorithms (Topic supervisor: dr. Andrius Vytautas Misiukas Misiūnas)

Temos nr.: 45

Tema pateikta svarstymui: 2025-06-26 08:53:01

Patvirtinta skelbimui: 2025-06-27

Temos aprašas lietuvių kalba:

Šio darbo tikslas - atlikti triukšmo šalinimo iš garso įrašų algoritmų tyrimą ir sukurti taikomąją programą.

Galima literatūra: Spectral Subtraction – klasikinis triukšmo šalinimo metodas: https://arxiv.org/pdf/2302.10313 Hibridiniai metodai – klasikiniai + gilieji neuroniniai tinklai: https://arxiv.org/pdf/2005.07551 Neuroninis modelis – gilusis mokymasis garso triukšmo šalinimui: https://arxiv.org/pdf/2005.07551

Galimi duomenų rinkiniai (datasets): NoisySpeech Database(https://zenodo.org/records/5117901) Sudarytas iš švarių ir triukšmingų kalbos įrašų, skirtas testuoti triukšmo šalinimo algoritmus. LibriSpeech Dataset (https://www.tensorflow.org/datasets/catalog/librispeech) Sudarytas iš švarių kalbos įrašų. Gali būti naudojamas kaip „ground truth“ treniravimo arba palyginimo duomenims. VoiceBank-DEMAND-16k (https://huggingface.co/datasets/JacobLinCool/VoiceBank-DEMAND-16k) Populiarus rinkinys kalbos triukšmo šalinimo tyrimams. Sudarytas iš švarios kalbos (VoiceBank corpus) ir natūralių triukšmų (DEMANDdataset).

Galimos bibliotekos: Triukšmo šalinimui naudojant spektrinį atėmimą (Spectral Subtraction) radau noisereduce biblioteką (https://pypi.org/project/noisereduce/).

Temos aprašas anglų kalba:

The aim of this work is to conduct a study of noise removal algorithms from audio recordings and to develop an application.

Available literature: Spectral Subtraction – classical noise removal method: https://arxiv.org/pdf/2302.10313 Hybrid methods – classical + deep neural networks: https://arxiv.org/pdf/2005.07551 Neural model – deep learning for audio noise removal: https://arxiv.org/pdf/2005.07551

Available datasets: NoisySpeech Database(https://zenodo.org/records/5117901) Consists of clean and noisy speech recordings, intended for testing noise removal algorithms. LibriSpeech Dataset (https://www.tensorflow.org/datasets/catalog/librispeech) Consists of clean speech recordings. Can be used as ground truth for training or comparison data. VoiceBank-DEMAND-16k (https://huggingface.co/datasets/JacobLinCool/VoiceBank-DEMAND-16k) A popular dataset for speech denoising research. Consists of clean speech (VoiceBank corpus) and natural noise (DEMANDdataset).

Available libraries: For denoising using Spectral Subtraction, I found the noisereduce library (https://pypi.org/project/noisereduce/).

Temos tipas:

| Bakalauro kursinio darbo | | Bakalauro baigiamojo darbo |

Temų klasifikatorius:

| Paslaugų integracija (moderniųjų informacinių sistemų, paslaugų ar kitų išorinių komponentų integracija pagal taikymo sritį, architektūrinių sprendinių kūrimas bei tyrimai, įskaitant įvairių taikomųjų sričių signalų apdorojimo uždavinius) |

| Duomenų modeliavimas (reliacinių, struktūruotų ir nestruktūruotų duomenų modeliavimas, duomenų valdymo ir specializuotų duomenų bazių taikymai ir tyrimai) |

| Moderniosios interneto paslaugos (moderniųjų interneto paslaugų kūrimas ir jų tyrimai kontekstualizuotose aplinkose, pavyzdžiui, mobiliose, mikro servisuose) |