FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
49 results
Search Results
Item Uso estratégico de las infraestructuras de datos espaciales para la toma de decisiones en el ámbito universitario(2017-05) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Pascal, Andrés JorgeLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Laboratorio de ciencia de datos y CTS(2018-11-02) De Battista, Anabella Cecilia; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Retamar, María Soledad; Lepratte, LeandroObjetivos: A partir grandes bases de datos de resultados científicos y tecnológicos, explorar un enfoque de análisis sobre las modalidades de producción y difusión de conocimientos sobre temáticas controversiales. Generar un proceso de transición en la modalidad de producción de conocimientos desde el ámbito académico (Modos 1 y 2) a uno basado en un enfoque de Ciencia Ciudadana.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Uso del lenguaje R en recuperación de información aplicado a análisis bibliométrico(2018-10-25) Ramos, Lautaro Emilio; Retamar, María Soledad; Rapesta, Natalia Daniela; De Battista, Anabella Cecilia; Lepratte, Leandro; Herrera, Norma EdithLos indicadores bibliométricos son instrumentos que permiten medir la producción científica y se utilizan para identificar, a partir del análisis de la literatura científica y tecnológica publicada, los outputs del sistema científico, en términos de performance y estructura del conocimiento. Para realizar análisis de dichos indicadores se emplean herramientas computacionales para la obtención, el tratamiento y el análisis de datos. Este trabajo presenta el uso de distintas librerías de R (R Project n.d.) y herramientas de visualización de información en el análisis de la producción de conocimiento, tomando como caso de estudio publicaciones científicas de Argentina y el resto de mundo que incluyen la palabra clave pesticidas.Item Indexación y búsqueda sobre datos no estructurados(Universidad Nacional del Nordeste, 2018-04-26) Herrera, Norma Edith; Ruano, Darío; Azar, Paola; De Battista, Anabella Cecilia; Pascal, Andrés JorgeLas bases de datos han incluido la capacidad de almacenar datos no estructurados tales como imágenes, sonido, texto, video, etc. La problemática de almacenamiento y búsqueda en estos tipos de base de datos difiere de las bases de datos clásicas,dado que no es posible organizarlos en registros y campos, y aun cuando pudiera hacerse, la búsqueda exacta carece de interés. Es en este contexto donde surgen nuevos modelos de bases de datos capaces de cubrir las necesidades de almacenamiento y búsqueda de estas aplicaciones. Nuestro interés se basa en el diseño de índices eficientes para estas nuevas bases de datos.Item Utilización de R para análisis bibliométrico(2018-09) De Battista, Anabella Cecilia; Rapesta, Natalia Daniela; Ramos, Lautaro Emilio; Lepratte, LeandroLos indicadores bibliométricos son instrumentos que permiten medir la producción científica, es decir, averiguar el impacto causado por un trabajo científico a partir del análisis de la literatura científica y tecnológica publicada. Este trabajo presenta el uso de distintas librerías de R en el análisis de la producción de conocimiento basado en publicaciones científicas de Argentina y el resto de mundo, utilizando como palabra clave de búsqueda “pesticidas”. Las publicaciones científicas analizadas se obtuvieron mediante la API de Scopus [1]. Los resultados permiten considerar diferentes indicadores de la producción de conocimiento conforme al Modo 1 [2, 3] tales como: cantidad de publicaciones que incluyen el término “pesticidas”, clasificación de publicaciones por autor, tipo de publicación, qué palabras aparecen con más frecuencia relacionadas con el término de búsqueda.Item Implementación de data stream mining(2018-09) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Ríos, Juan Manuel; Casanova Pietroboni, Carlos Antonio; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDesde hace décadas las organizaciones utilizan información histórica propia para construir data warehouses y, mediante la aplicación de técnicas de descubrimiento de conocimiento, descubrir patrones que guíen la toma de decisiones.Actualmente, es una oportunidad para las organizaciones tomar decisiones en tiempo real basadas en información que puede provenir de múltiples fuentes, con diversos formatos y que se genera a gran velocidad. Como respuesta a esta necesidad surge Data Stream Mining (DSM), un subárea específica de la Minería de Datos definida como el proceso de extraer conocimiento en estructuras de datos continuas y con rápidas transiciones. Dicho análisis aporta a las organizaciones visibilidad del negocio y de sus clientes en tiempo real y les permite responder ágilmente ante los cambios. En este trabajo se presenta la vinculación del GIBD de la UTN-FRCU con la empresa Sidesys IT Solutions con el objetivo de implementar Data Stream Mining en la empresa.Item Propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de minería de datos(2018-10-25) Cristaldo, Patricia Raquel; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; De Battista, Anabella Cecilia; Herrera, Norma EdithEste trabajo propone una metodologia de enfoque “híbrido” para la gestión de proyectos de minería de datos, enmarcada en los aspectos relevantes de la gestión tradicional y ágil, que toma como punto de partida los factores críticos de éxito de la gestión de proyectos de minería de datos y de la gestión ágil de proyectos, de forma tal de lograr un conjunto unificado de criterios que debería cumplir una metodologia de gestión de proyectos en este entorno. Se especifican los criterios para orientar las decisiones, las etapas definidas en la metodologia, los resultados obtenidos y las conclusiones alcanzadasItem Enfoques de optimización multi-objetivo basados en preferencias en la ingeniería de software(2018-07-03) Arrúa, Martín Nahuel; Bracco, Luciano Joaquín; Rottoli, Giovanni Daián; Schab, Esteban Alejandro; Tournoud, Adrián Alberto; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella CeciliaLa Ingeniería de Software Basada en Búsqueda (ISBB) estudia la aplicación de técnicas de optimización metaheurística a problemas de la Ingeniería de Software (IS). Una vez que una tarea de la IS se enmarca en un problema de búsqueda existen multitud de algoritmos que pueden aplicarse para resolver ese problema. La mayoría del trabajo existente trata a los problemas de la IS desde un punto de vista mono-objetivo. Sin embargo, muchos de estos problemas poseen múltiples objetivos en conflicto que deben ser optimizados. El número de objetivos a considerar es, en general, alto (esto es, más de tres objetivos). Si bien la comunidad científica ha propuesto varios enfoques de solución para atacar la optimización multi-objetivo, muchos de estos enfoques nos se han aplicado aún en la ISBB. Uno de estos enfoques es el llamado “basado en preferencias”, el cual permite incorporar las preferencias entre los objetivos del tomador de decisiones, restringiendo el frente Paretoóptimo a una zona de interés específica, facilitando de esta manera la tarea de tomar una decisión.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.