Descubrimiento de conocimiento en bases de datos
Fecha
2019-04-26Autor
Ramos, Lautaro Martín Miguel
Rivera, Ramiro Adolfo
Richard, Cristhian Pablo
Cristaldo, Patricia Raquel
Nuñez, Juan Pablo
Rottoli, Giovanni Daián
Ríos, Juan Manuel
Retamar, María Soledad
Casanova Pietroboni, Carlos Antonio
De Battista, Anabella Cecilia
Cagnina, Leticia
Herrera, Norma Edith
Schab, Esteban Alejandro
Metadatos
Mostrar el registro completo del ítemResumen
En la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.
El ítem tiene asociados los siguientes ficheros de licencia: