FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
37 results
Search Results
Item Extracción de características utilizando redes siamesas y aumentación aplicada a las búsquedas por similitud de marcas de ganado(2022-11-04) Pascal, Andrés Jorge; Herrera, Norma Edith; Planas, Adrián Nicolás; Lederhos, FedericoLas Búsquedas por Similitud constituyen un importante campo de estudio en el presente. Un ejemplo de su aplicación es la búsqueda de marcas de ganado, necesaria ante la solicitud de alta de una nueva marca al Departamento de Registro Ganadero. Para calcular su similitud, se suelen utilizar funciones de distancia métrica aplicadas a vectores de características extraídas a partir de su imagen. Existen varios métodos de extracción de características, a los cuales en la última década se le han sumado las Redes Neuronales Profundas Convolucionales (CNN). En este artículo se muestra el uso de una CNN entrenada mediante Redes Siamesas y con técnicas estándares de Aumentación de datos, a las cuales se le añade una técnica propia para mejorar la eficacia de la extracción de características aplicadas a las Búsquedas por Similitud de Marcas de Ganado. Además, se evalúa experimentalmente su performance.Item Uso estratégico de las infraestructuras de datos espaciales para la toma de decisiones en el ámbito universitario(2017-05) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Pascal, Andrés JorgeLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Bases de datos métrico-temporales: indexación en memoria secundaria(Universidad Tecnológica Nacional, 2020-11-05) Azar, Paola; De Battista, Anabella Cecilia; Herrera, Norma Edith; Ruano, DaríoActualmente las bases de datos han incluido la capacidad de almacenar datos tales como imágenes,sonido, texto, video, datos geométricos, etc. Es en este contexto donde surgen nuevos modelos de bases de datos. El modelo métrico-temporal surge bajo la necesidad de poder manipular objetos no estructurados con tiempos de vigencia asociados y realizar consultas por similitud y por tiempo en forma simultánea. Varios índices mérico-temporales se han propuesto en este ámbito, todos estos índices fueron desarrollados para ser eficientes en memoria principal. En este trabajo abordamos el estudio del índice Historical FHQT(H-FHQT), con el fin de proponer una técnica de paginación que sea eficiente para el manejo del mismo en memoria secundaria.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Uso del lenguaje R en recuperación de información aplicado a análisis bibliométrico(2018-10-25) Ramos, Lautaro Emilio; Retamar, María Soledad; Rapesta, Natalia Daniela; De Battista, Anabella Cecilia; Lepratte, Leandro; Herrera, Norma EdithLos indicadores bibliométricos son instrumentos que permiten medir la producción científica y se utilizan para identificar, a partir del análisis de la literatura científica y tecnológica publicada, los outputs del sistema científico, en términos de performance y estructura del conocimiento. Para realizar análisis de dichos indicadores se emplean herramientas computacionales para la obtención, el tratamiento y el análisis de datos. Este trabajo presenta el uso de distintas librerías de R (R Project n.d.) y herramientas de visualización de información en el análisis de la producción de conocimiento, tomando como caso de estudio publicaciones científicas de Argentina y el resto de mundo que incluyen la palabra clave pesticidas.Item Indexación y búsqueda sobre datos no estructurados(Universidad Nacional del Nordeste, 2018-04-26) Herrera, Norma Edith; Ruano, Darío; Azar, Paola; De Battista, Anabella Cecilia; Pascal, Andrés JorgeLas bases de datos han incluido la capacidad de almacenar datos no estructurados tales como imágenes, sonido, texto, video, etc. La problemática de almacenamiento y búsqueda en estos tipos de base de datos difiere de las bases de datos clásicas,dado que no es posible organizarlos en registros y campos, y aun cuando pudiera hacerse, la búsqueda exacta carece de interés. Es en este contexto donde surgen nuevos modelos de bases de datos capaces de cubrir las necesidades de almacenamiento y búsqueda de estas aplicaciones. Nuestro interés se basa en el diseño de índices eficientes para estas nuevas bases de datos.Item Implementación de data stream mining(2018-09) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Ríos, Juan Manuel; Casanova Pietroboni, Carlos Antonio; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDesde hace décadas las organizaciones utilizan información histórica propia para construir data warehouses y, mediante la aplicación de técnicas de descubrimiento de conocimiento, descubrir patrones que guíen la toma de decisiones.Actualmente, es una oportunidad para las organizaciones tomar decisiones en tiempo real basadas en información que puede provenir de múltiples fuentes, con diversos formatos y que se genera a gran velocidad. Como respuesta a esta necesidad surge Data Stream Mining (DSM), un subárea específica de la Minería de Datos definida como el proceso de extraer conocimiento en estructuras de datos continuas y con rápidas transiciones. Dicho análisis aporta a las organizaciones visibilidad del negocio y de sus clientes en tiempo real y les permite responder ágilmente ante los cambios. En este trabajo se presenta la vinculación del GIBD de la UTN-FRCU con la empresa Sidesys IT Solutions con el objetivo de implementar Data Stream Mining en la empresa.Item Propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de minería de datos(2018-10-25) Cristaldo, Patricia Raquel; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; De Battista, Anabella Cecilia; Herrera, Norma EdithEste trabajo propone una metodologia de enfoque “híbrido” para la gestión de proyectos de minería de datos, enmarcada en los aspectos relevantes de la gestión tradicional y ágil, que toma como punto de partida los factores críticos de éxito de la gestión de proyectos de minería de datos y de la gestión ágil de proyectos, de forma tal de lograr un conjunto unificado de criterios que debería cumplir una metodologia de gestión de proyectos en este entorno. Se especifican los criterios para orientar las decisiones, las etapas definidas en la metodologia, los resultados obtenidos y las conclusiones alcanzadasItem Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.