Data agumentation para la clasificación automática de la calidad vocal

dc.creatorGarcía , Mario Alejandro
dc.creatorDestefanis , Eduardo
dc.date.accessioned2025-10-14T20:17:16Z
dc.date.issued2020
dc.description.abstractSe presenta el estado del plan de tesis “Valoración de la calidad vocal a través de deep scattering spectrum y aprendizaje automático” y se plantean tres transformaciones para incrementar la cantidad de datos de entrenamiento y reducir el sobreajuste. Estas transformaciones realizan un desplazamiento en frecuencia de los datos (audios), una segmentación por tiempo y la inversión del orden temporal (flipping). Como resultado, se obtiene un juego de datos 18 veces mayor al original. Se ejecuta un experimento que consta del el entrenamiento de una red neuronal profunda para evaluar el rendimiento con los datos aumentados. Se concluye que las transformaciones propuestas disminuyen el sobreajuste, mejoran el error de clasificación y se pueden utilizar en el ámbito de este plan de tesis, clasificación de la calidad vocal a partir de audios de vocales sostenidas
dc.description.abstractThe status of the thesis plan "Vocal quality assessment through deep scattering spectrum and machine learning" is presented. Three transformations are proposed in order to increase the amount of training data and reduce overfitting. These transformations perform a frequency shift, time segmentation and flipping. It results in a dataset 18 times larger than the original dataset. An experiment consisting of training a deep neural network is run to evaluate performance with the augmented data. It is concluded that the proposed transformations reduce the overfitting, improve the classification error and it could be useful for the thesis plan scope, classification of vocal quality from sustained vowels.
dc.description.affiliationFil: García, Mario Alejandro. Universidad Tecnológica Nacional. Facultad Regional Córdoba. Grupo de Inteligencia Artificial; Argentina.
dc.description.affiliationFil: Destefanis, Eduardo. Universidad Tecnológica Nacional. Facultad Regional Córdoba. Centro de Investigación en Informática para la Ingeniería; Argentina.
dc.description.peerreviewedPeer Reviewed
dc.formatpdf
dc.identifier.citationAJEA- Actas de Jornadas y Eventos Académicos de UTNDV Jornadas de Intercambio y Disfusión de los Resultados de Investigaciones de los Doctorandos en Ingeniería.
dc.identifier.doihttps://doi.org/10.33414/ajea.5.748.2020
dc.identifier.isbn978-950-42-0200-4
dc.identifier.urihttps://hdl.handle.net/20.500.12272/13973
dc.language.isoes
dc.publisherUniversidad Tecnológica Nacional Regional Córdoba.
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.holderGarcía, Mario Alejandro; Destefanis, Eduardo.
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.usehttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectCalidad vocal
dc.subjectAprendizaje profundo
dc.subjectData augmentation
dc.titleData agumentation para la clasificación automática de la calidad vocal
dc.typeinfo:eu-repo/semantics/article
dc.type.versionpublisherVersion

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Data Augmentation para la Clasificación Automática de la Calidad Vocal..pdf
Size:
568.11 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.63 KB
Format:
Item-specific license agreed upon to submission
Description: