FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
8 results
Search Results
Item Laboratorio de ciencia de datos y CTS(2018-11-02) De Battista, Anabella Cecilia; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Retamar, María Soledad; Lepratte, LeandroObjetivos: A partir grandes bases de datos de resultados científicos y tecnológicos, explorar un enfoque de análisis sobre las modalidades de producción y difusión de conocimientos sobre temáticas controversiales. Generar un proceso de transición en la modalidad de producción de conocimientos desde el ámbito académico (Modos 1 y 2) a uno basado en un enfoque de Ciencia Ciudadana.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.Item Minería de datos y visualización de información(2018-11-29) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Herrera, Norma EdithEl procesamiento y análisis de las grandes cantidades de datos que se producen en la actualidad, posibilitan el hallazgo de patrones y tendencias ocultos en los mismos, que impacta directamente en la toma de decisiones en diversas áreas de estudios. Se generan datos a gran velocidad y en grandes cantidades que requieren ser procesados para poder actuar de manera rápida. Como es el caso de la observación de turnos que se generan en entidades bancarias, donde hay momentos del día en que se requiere modificar los esquemas de atención, según la afluencia de determinadas categorías de clientes o el incremento de demandas de determinados servicios. Existen numerosas técnicas de minería de datos aplicables a distintos casos de análisis de datos, que permiten obtener ventajas de esas grandes cantidades de datos almacenados. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos, en el que se investigan tanto temas de minería de datos, como de visualización de información, como herramienta para representar de manera eficiente los resultados obtenidos.Item Minería de datos para la detección de factores de influencia en el test Apgar(2018-11-29) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Nuñez, Juan Pablo; Savoy, Francisco; De Gracia, Laura; De Battista, Anabella CeciliaEn este trabajo se aplicaron técnicas de minería de datos para clasificar los valores del test de Apgar en los nacimientos ocurridos en el hospital público Justo José de Urquiza entre los años 2009 y 2017. Se aplicaron técnicas de selección de atributos para reducir la dimensionalidad en la vista minable, se realizaron experimentos con tres algoritmos de balanceo de clases: Class Balancer, SMOTE y Spread Sub Sampled; y se aplicaron tres modelos de clasificación basados en árboles de decisión: J48, REP Tree y Random Tree. Se compararon los resultados mediante métricas como TPRate, F-Score y matriz de confusión obteniendo mejores resultados con la combinación de Class Balancer y Random Tree. Entre los principales factores resultantes de aplicar el modelo de clasificación se encuentran: la aplicación de oxitócicos durante el trabajo de parto, la posición del niño al nacer, el peso y la edad gestacional del recién nacidoItem Tecnologías de procesamiento de datos masivos(Instituto Tecnológico de Buenos Aires., 2017) Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Costa Martorel, Valentín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; De Battista, Anabella Cecilia; Herrera, Norma EdithLas grandes cantidades de datos que se producen en la actualidad, sumadas a su heterogeneidad y la velocidad con que se generan, hacen que las herramientas tradicionales de análisis de datos no resulten adecuadas para su recopilación, almacenamiento, gestión y análisis. En este contexto surge el término Big Data, en referencia a características como gran volumen, velocidad y variedad de producción de los datos, y a las herramientas que se utilizan para encontrar valor en los mismos. La posibilidad de hallar patrones y tendencias en estas grandes cantidades de datos impacta directamente en la toma de decisiones en áreas tan diversas como salud, genética, agro, predicciones climáticas, redes sociales, marketing, finanzas, educación, entre otras. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos.Item Minería de datos aplicada a datos masivos(2016-04-14) De Battista, Anabella Cecilia; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Nuñez, Juan Pablo; Retamar, María Soledad; Bouzenard, Daniel; Herrera, Norma EdithLas grandes cantidades de datos que se producen en la actualidad, sumadas a su heterogeneidad, hacen que las herramientas tradicionales de análisis de datos no resulten adecuadas para su recopilación, almacenamiento, gestión y an'slisis. En este contexto se comienza a hablar del término Big Data, haciendo referencia a características como gran volumen, velocidad y variedad de producción de los datos, y a las herramientas que se utilizan para encontrar valor en las mismas. La posibilidad de hallar patrones y tendencias en estas grandes cantidades de datos impacta directamente en la toma de decisiones en areas tan diversas como salud, genética, agro, predicciones climáticas, redes sociales, marketing, finanzas, educación, entre otras. Otro aspecto de interés en este tipo de análisis, es la aplicación de metodologías de gestión de proyectos de enfoque ágil en los proyectos de minería de datos, en este caso, se aplicarán metodologías específicas con el objetivo de comparar características y restricciones de cada una. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos.