FRCU - GIBD : Grupo de Investigación en Bases de Datos

Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774

Browse

Search Results

Now showing 1 - 8 of 8
  • Thumbnail Image
    Item
    Laboratorio de ciencia de datos y CTS
    (2018-11-02) De Battista, Anabella Cecilia; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Retamar, María Soledad; Lepratte, Leandro
    Objetivos: A partir grandes bases de datos de resultados científicos y tecnológicos, explorar un enfoque de análisis sobre las modalidades de producción y difusión de conocimientos sobre temáticas controversiales. Generar un proceso de transición en la modalidad de producción de conocimientos desde el ámbito académico (Modos 1 y 2) a uno basado en un enfoque de Ciencia Ciudadana.
  • Thumbnail Image
    Item
    Análisis de sentimientos en Twitter : una implementación sobre Cloudera
    (2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma Edith
    Debido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.
  • Thumbnail Image
    Item
    Descubrimiento de conocimiento en bases de datos
    (Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban Alejandro
    En la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.
  • Thumbnail Image
    Item
    Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting
    (2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith
    La Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.
  • Thumbnail Image
    Item
    Minería de datos y visualización de información
    (2018-11-29) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Herrera, Norma Edith
    El procesamiento y análisis de las grandes cantidades de datos que se producen en la actualidad, posibilitan el hallazgo de patrones y tendencias ocultos en los mismos, que impacta directamente en la toma de decisiones en diversas áreas de estudios. Se generan datos a gran velocidad y en grandes cantidades que requieren ser procesados para poder actuar de manera rápida. Como es el caso de la observación de turnos que se generan en entidades bancarias, donde hay momentos del día en que se requiere modificar los esquemas de atención, según la afluencia de determinadas categorías de clientes o el incremento de demandas de determinados servicios. Existen numerosas técnicas de minería de datos aplicables a distintos casos de análisis de datos, que permiten obtener ventajas de esas grandes cantidades de datos almacenados. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos, en el que se investigan tanto temas de minería de datos, como de visualización de información, como herramienta para representar de manera eficiente los resultados obtenidos.
  • Thumbnail Image
    Item
    Minería de datos para la detección de factores de influencia en el test Apgar
    (2018-11-29) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Nuñez, Juan Pablo; Savoy, Francisco; De Gracia, Laura; De Battista, Anabella Cecilia
    En este trabajo se aplicaron técnicas de minería de datos para clasificar los valores del test de Apgar en los nacimientos ocurridos en el hospital público Justo José de Urquiza entre los años 2009 y 2017. Se aplicaron técnicas de selección de atributos para reducir la dimensionalidad en la vista minable, se realizaron experimentos con tres algoritmos de balanceo de clases: Class Balancer, SMOTE y Spread Sub Sampled; y se aplicaron tres modelos de clasificación basados en árboles de decisión: J48, REP Tree y Random Tree. Se compararon los resultados mediante métricas como TPRate, F-Score y matriz de confusión obteniendo mejores resultados con la combinación de Class Balancer y Random Tree. Entre los principales factores resultantes de aplicar el modelo de clasificación se encuentran: la aplicación de oxitócicos durante el trabajo de parto, la posición del niño al nacer, el peso y la edad gestacional del recién nacido
  • Thumbnail Image
    Item
    Tecnologías de procesamiento de datos masivos
    (Instituto Tecnológico de Buenos Aires., 2017) Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Costa Martorel, Valentín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; De Battista, Anabella Cecilia; Herrera, Norma Edith
    Las grandes cantidades de datos que se producen en la actualidad, sumadas a su heterogeneidad y la velocidad con que se generan, hacen que las herramientas tradicionales de análisis de datos no resulten adecuadas para su recopilación, almacenamiento, gestión y análisis. En este contexto surge el término Big Data, en referencia a características como gran volumen, velocidad y variedad de producción de los datos, y a las herramientas que se utilizan para encontrar valor en los mismos. La posibilidad de hallar patrones y tendencias en estas grandes cantidades de datos impacta directamente en la toma de decisiones en áreas tan diversas como salud, genética, agro, predicciones climáticas, redes sociales, marketing, finanzas, educación, entre otras. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos.
  • Thumbnail Image
    Item
    Minería de datos aplicada a datos masivos
    (2016-04-14) De Battista, Anabella Cecilia; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Nuñez, Juan Pablo; Retamar, María Soledad; Bouzenard, Daniel; Herrera, Norma Edith
    Las grandes cantidades de datos que se producen en la actualidad, sumadas a su heterogeneidad, hacen que las herramientas tradicionales de análisis de datos no resulten adecuadas para su recopilación, almacenamiento, gestión y an'slisis. En este contexto se comienza a hablar del término Big Data, haciendo referencia a características como gran volumen, velocidad y variedad de producción de los datos, y a las herramientas que se utilizan para encontrar valor en las mismas. La posibilidad de hallar patrones y tendencias en estas grandes cantidades de datos impacta directamente en la toma de decisiones en areas tan diversas como salud, genética, agro, predicciones climáticas, redes sociales, marketing, finanzas, educación, entre otras. Otro aspecto de interés en este tipo de análisis, es la aplicación de metodologías de gestión de proyectos de enfoque ágil en los proyectos de minería de datos, en este caso, se aplicarán metodologías específicas con el objetivo de comparar características y restricciones de cada una. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos.