Etiquetado fonético automático al nivel palabra usando la dinámica de cambio de los vectores del libro código
DOI:
https://doi.org/10.13053/cys-24-2-3229Palabras clave:
Etiquetado fonético, reconocimiento de vozResumen
Se describe una solución alternativa referente al etiquetado fonético sobre un conjunto de palabras pronunciadas por un locutor, susceptible de utilizarse en cualquier idioma, según se cumplan las características de la propuesta. El procedimiento se basa en el seguimiento de la dinámica de cambio de los vectores cepstrales asociados a la frecuencia de Mel (MFCCs) que se utilizan para conformar un Libro de Código (LC), extraído a partir de la palabra a etiquetar. Esta dinámica de cambio analiza dónde ocurre una transición de un vector (MFCC) del LC a otro, así como las perturbaciones que ocurren en la zona de cambio debido a la concatenación fonética. Se establecen métricas para considerar el ruido de coarticulación y definir la ubicación de la frontera de separación fonética. Se proponen dos métodos para evaluar la dinámica de cambio de los vectores y entregar el etiquetado más adecuado. Para comprobar si la tarea de etiquetado fue correcta, se hace uso de una tarea de reconocimiento del corpus considerado. Se creó un diccionario de palabras que contiene todos los fonemas considerados, etiquetándose de forma tanto manual como automática; ésta última se obtuvo mediante la propuesta que se presenta en este trabajo. El porciento de reconocimiento obtenido con esta aplicación es del 97.9%; inferior en un 1.06% con respecto al porcentaje de reconocimiento obtenido sobre el mismo corpus de palabras, pero haciendo uso de etiquetado manual, esto es para ambos casos, superior al 90%. Sin embargo, el tiempo utilizado en el etiquetado del corpus de voz de forma automática, es significativamente menor que el estimado de hacerse manualmente, además de eliminar la subjetividad personal en el trabajo de etiquetado. Con lo que se pone de manifiesto la importancia de la propuesta.Descargas
Publicado
Número
Sección
Licencia
Transfiero exclusivamente a la revista “Computación y Sistemas”, editada por el Centro de Investigación en Computación (CIC), los Derechos de Autor del artículo antes mencionado, asimismo acepto que no serán transferidos a ninguna otra publicación, en cualquier formato, idioma, medio existente (incluyendo los electrónicos y multimedios) o por desarrollar.
Certifico que el artículo, no ha sido divulgado previamente o sometido simultáneamente a otra publicación y que no contiene materiales cuya publicación violaría los Derechos de Autor u otros derechos de propiedad de cualquier persona, empresa o institución. Certifico además que tengo autorización de la institución o empresa donde trabajo o estudio para publicar este Trabajo.
El autor, representante acepta la responsabilidad por la publicación del Trabajo en nombre de todos y cada uno de los autores.
Esta Transferencia está sujeta a las siguientes reservas:
- Los autores conservan todos los derechos de propiedad (tales como derechos de patente) de este Trabajo, con excepción de los derechos de publicación transferidos al CIC, mediante este documento.
- Los autores conservan el derecho de publicar el Trabajo total o parcialmente en cualquier libro del que ellos sean autores o editores y hacer uso personal de este trabajo en conferencias, cursos, páginas web personal, etc.