FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
11 results
Search Results
Item Uso estratégico de las infraestructuras de datos espaciales para la toma de decisiones en el ámbito universitario(2017-05) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Pascal, Andrés JorgeLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Minería de datos y visualización de información(2018-11-29) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Herrera, Norma EdithEl procesamiento y análisis de las grandes cantidades de datos que se producen en la actualidad, posibilitan el hallazgo de patrones y tendencias ocultos en los mismos, que impacta directamente en la toma de decisiones en diversas áreas de estudios. Se generan datos a gran velocidad y en grandes cantidades que requieren ser procesados para poder actuar de manera rápida. Como es el caso de la observación de turnos que se generan en entidades bancarias, donde hay momentos del día en que se requiere modificar los esquemas de atención, según la afluencia de determinadas categorías de clientes o el incremento de demandas de determinados servicios. Existen numerosas técnicas de minería de datos aplicables a distintos casos de análisis de datos, que permiten obtener ventajas de esas grandes cantidades de datos almacenados. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos, en el que se investigan tanto temas de minería de datos, como de visualización de información, como herramienta para representar de manera eficiente los resultados obtenidos.Item Minería de datos para la detección de factores de influencia en el test Apgar(2018-11-29) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Nuñez, Juan Pablo; Savoy, Francisco; De Gracia, Laura; De Battista, Anabella CeciliaEn este trabajo se aplicaron técnicas de minería de datos para clasificar los valores del test de Apgar en los nacimientos ocurridos en el hospital público Justo José de Urquiza entre los años 2009 y 2017. Se aplicaron técnicas de selección de atributos para reducir la dimensionalidad en la vista minable, se realizaron experimentos con tres algoritmos de balanceo de clases: Class Balancer, SMOTE y Spread Sub Sampled; y se aplicaron tres modelos de clasificación basados en árboles de decisión: J48, REP Tree y Random Tree. Se compararon los resultados mediante métricas como TPRate, F-Score y matriz de confusión obteniendo mejores resultados con la combinación de Class Balancer y Random Tree. Entre los principales factores resultantes de aplicar el modelo de clasificación se encuentran: la aplicación de oxitócicos durante el trabajo de parto, la posición del niño al nacer, el peso y la edad gestacional del recién nacidoItem Tecnologías de procesamiento de datos masivos(Instituto Tecnológico de Buenos Aires., 2017) Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Costa Martorel, Valentín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; De Battista, Anabella Cecilia; Herrera, Norma EdithLas grandes cantidades de datos que se producen en la actualidad, sumadas a su heterogeneidad y la velocidad con que se generan, hacen que las herramientas tradicionales de análisis de datos no resulten adecuadas para su recopilación, almacenamiento, gestión y análisis. En este contexto surge el término Big Data, en referencia a características como gran volumen, velocidad y variedad de producción de los datos, y a las herramientas que se utilizan para encontrar valor en los mismos. La posibilidad de hallar patrones y tendencias en estas grandes cantidades de datos impacta directamente en la toma de decisiones en áreas tan diversas como salud, genética, agro, predicciones climáticas, redes sociales, marketing, finanzas, educación, entre otras. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos.Item Sistemas de información geográfica en la gestión de instituciones universitarias(2014-11-14) De Battista, Anabella Cecilia; Retamar, María Soledad; Pascal, Andrés Jorge; Nuñez, Juan Pablo; Savoy, Francisco; Herrera, Norma EdithUn sistema de información geográfica es una he-rramienta que permite analizar, visualizar e interpretar hechos relativos a la superficie terrestre, siendo de gran utilidad para la resolución de problemas complejos de planificación y gestión. Existen múltiples aplicaciones donde los sistemas de información geográfica son de suma utilidad, una de ellas es la gestión de instituciones. En este trabajo presentamos una aplicación de los sistemas de información geográfica en la gestión de una institución universitaria, con el objetivo de generar una herramienta que brinde soporte a la toma de decisiones en la implementación de estrategias de promoción y difusión de carreras dictadas en la institución.Item Consultas en nuevos modelos de bases de datos(2014-05-07) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoPor la capacidad de almacenar datos estructurados que poseen las bases de datos tradicionales se aplica en este modelo el concepto de búsqueda exacta, es decir consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre los datos almacenados en registros de tama˜no fijo compuestos por campos comparables. Al surgir la posibilidad de almacenar en una base otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, hace necesaria la definicion de nuevas operaciones y capacidad de almacenamiento en las bases de datos. Se espera poder realizar en estos modelos busquedas eficientemente, teniendo en cuenta cuestiones como que la búsqueda exacta no resulta de interes y que en ciertas ocasiones se requiere mantener los distintos estados de la base de datos a través de tiempo y no solo el más reciente, a fin de poder realizar consultas de información histórica. Como respuesta a estos requerimientos han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que brindan funcionalidades de persitencia y manipulación de estos tipos de datos. El tema de estudio del Grupo de Investigación en Bases de Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Infraestructura de datos espaciales en el ámbito universitario(2015-11-19) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Monetta, Agustín Ignacio; Herrera, Norma EdithLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Indexación y búsquedas en bases de datos(2015-04-16) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Gutierrez, GilbertoEn la actualidad se utilizan nuevos modelos de bases de datos en los que no es aplicable el concepto de búsqueda exacta que se emplea en las bases de datos tradicionales. La causa principal es que estos nuevos modelos de bases de datos permiten gestionar tipos de datos con características que difieren de los datos clásicos: no es posible establecer un orden entre ellos y, en general, no pueden estructurarse por lo que no pueden almacenarse en registros ni campos. Estos tipo de datos pueden ser sonidos, imágenes, videos, entre otros, y para realizar consultas sobre los mismos se emplea el concepto de búsqueda por similitud. También resulta de interés en algunas aplicaciones poder consultar estados pasados de la base de datos y no solamente el estado actual. A raíz de estas situaciones, se plantean nuevas estrategias para el almacenamiento y la consulta en las bases de datos, entre los más conocidos podemos mencionar los modelos de espacios métricos, métrico-temporal, espacial, temporal, espacio-temporal. En este artículo se presentan los tópicos de interés del Grupo de Investigación en Bases de Datos (GIBD): modelado de objetos no estructurados y procesamiento eficiente de consultas sobre estos tipos de datos.