FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
4 results
Search Results
Item Determinación de relevancia de palabras para procesos con dominios restringidos(2022-11-03) Rosenbrock, Germán; Trossero, Sebastián; Alvarez, Claudia Mabel; Heit, Fernando; Pascal, Andrés Jorge; López De Luise, María DanielaEn este trabajo se propone un modelo basado en Minería de Textos para la determinación de relevancia que permita la extracción de palabras específicas de un dominio (Domain-Specific Word Extraction). El alcance de la presente propuesta se remite a determinar la importancia de las palabras en el ámbito de regulaciones universitarias, en base a corpus definidos específicamente para evaluar y validar este contexto restringido. Para esto, se emplean cuatro corpus, tres de ellos de dominios relacionados con regulaciones pero aplicados a otros fueros: Regulaciones Universitarias, Regulaciones Impositivas, Regulaciones del Código Civil y un corpus genérico. Se presentan y aplican tests estadísticos pertenecientes a la minería de textos para lenguaje español, y finalmente se comparan las palabras más relevantes del dominio de las regulaciones universitarias con un conjunto de palabras claves extraídas manualmente por especialistas, a fin de validar la propuesta.Item Diseño de aplicación para visualización de tópicos de noticias sobre COVID-19 en lenguaje español(Universidad Tecnológica Nacional, 2020-11-05) La Pietra, Lucas Ezequiel; Schab, Esteban Alejandro; Cristaldo, Patricia Raquel; De Battista, Anabella CeciliaLa evolución de la pandemia de COVID-19 ha tenido gran repercusión en medios periodísticos, en particular en diarios digitales. Las noticias publicadas por los mismos cubren diferentes aspectos relacionados con la evolución de casos y sus diferentes impactos. En este trabajo se presenta la aplicación de técnicas de procesamiento de lenguaje natural para la detección automática de los tópicos principales abordados por medios digitales, y la generación de una aplicación web que permite visualizar los resultados obtenidos en el proceso de topic modeling.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.