FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
Item 10mo. Congreso Nacional de Ingeniería Informática y Sistemas de Información CoNaIISI(Universidad Tecnológica Nacional. Facultad Regional Concepción del Uruguay., 2022-11-03) Callejas, Adrián Oscar; Cristaldo, Patricia RaquelEl 10mo Congreso Nacional de Ingeniería Informática y Sistemas de Información (CoNaIISI), organizado por la Facultad Regional Concepción del Uruguay de la Universidad Tecnológica Nacional (UTN-FRCU). Esta edición tuvo su sede en la ciudad de Concepción del Uruguay, Entre Ríos, durante los días 3 y 4 de noviembre de 2022 y fue realizada en formato híbrido. El CoNaIISI es la instancia anual nacional, organizada por la Red de Carreras de Ingeniería en Informática / Sistemas de Información del CONFEDI (RIISIC), donde profesionales de esta especialidad se reúnen para compartir sus avances y generar vínculos que fructifiquen en nuevos desarrollos. También los estudiantes en formación toman contacto directo, quizás por primera vez, con el mundo de la investigación científica, pudiendo también compartir sus trabajos y recibir feedback, de parte de sus pares y de referentes de la disciplina. Esta edición presentó un desafío adicional por su modalidad híbrida, luego de las dos ediciones que se realizaron de manera virtual debido a la pandemia de COVID-19. En este contexto, la Comisión Organizadora de la UTN FRCU realizó un esfuerzo por volver a poner en valor la misión comunicacional de los congresos, que busca propiciar un ámbito de intercambio entre los asistentes sobre aspectos relevantes o novedosos relacionados con la actividad científica, la investigación, la docencia y la práctica dentro de un área del conocimiento y de una actividad profesional.Item Adecuación de una propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de ciencia de datos(2018-11-30) Cristaldo, Patricia Raquel; Schab, Esteban Alejandro; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; De Battista, Anabella Cecilia; Retamar, María Soledad; Herrera, Norma EdithLa aplicación de metodologías de gestión de proyectos conlleva a contribuir con los factores de éxito en la gestión de los mismos. Esta propuesta se deriva de un trabajo anterior y considera los aspectos relevantes de la gestión tradicional y ágil, permitiendo la alineación de los objetivos de un proyecto de ciencia de datos con los resultados del mismo. Este trabajo presenta la adecuación y posterior validación de una propuesta metodológica de enfoque “híbrido” a un proyecto de ciencia de datos, considerando el cumplimiento de los factores de éxito afectados a este tipo de proyectos.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Aproximación a las prácticas docentes en la carrera de ingeniería en sistemas de información(2022-11-03) Muñoz, Roberto Miguel; Soria, Mercedes; Cristaldo, Patricia Raquel; Odetti, María Alejandra; Casanova Pietroboni, Carlos AntonioEste trabajo se inscribe en el marco de un proyecto de investigación asociativo y multi facultades con el objetivo de mostrar el grado de avance en la búsqueda de mejores prácticas docentes mediadas tecnológicamente en las carreras de ingeniería en sistemas de información. Se procesó y analizó una encuesta docente en relación a cuatro bloques: generalidades, mediación pedagógica, tecnológica y evaluación. Para ello se codificaron 251 respuestas docentes, se realizó una estadística descriptiva a los fines de poder caracterizar las prácticas que se desarrollan en las cuatro instituciones bajo estudio, y se aplicaron técnicas de minería de datos para hallar relaciones entre variables a partir de reglas de asociación. Los primeros resultados, desde la autopercepción docente, indican que algunas prácticas que favorecen el modelo de formación por competencias comienzan a emerger en la cotidianeidad de las aulas, que hay diversidad de tecnologías presentes en el proceso educativo y que tanto el uso de rúbricas como alternativas y simultaneidad de formas de evaluación comienzan a posicionarse positivamente en las unidades académicas. Por otro lado, con lenguaje Python se modeló una ecuación que permitió puntuar las prácticas con cierto grado de objetividad para poder seleccionar los primeros casos de estudio donde avanzar con otras técnicas de profundización sobre el objeto de investigación.Item Bases de datos de objetos no estructurados(2013-04-10) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gancharov Díaz, Pablo Alejandro; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoEn las bases de datos tradicionales es frecuente el procesamiento de consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre datos estructurados en registros de tamaño fijo compuestos por campos comparables. La necesidad de almacenar otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, obligó a extender las capacidades de las bases de datos; pero en la mayoría de los casos sólo se permiten el almacenamiento y alguna funcionalidad adicional. Por ello resulta necesario desarrollar nuevos enfoques para almacenar y la buscar objetos no estructurados eficientemente. En estos nuevos modelos la búsqueda exacta carece de interés y en muchos casos se requiere mantener los distintos estados de la base de datos a través de tiempo y no sólo el más reciente, para poder consultar información histórica. Como solución han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que permiten representar y manipular estos tipos de datos. El tema de estudio del Grupo de Investigación en Basesde Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Bases de datos espacio-temporales aplicadas en la gestión de emergencias(2017-11) Aballay, Marcela; De Battista, Anabella Cecilia; Gagliardi, Edilma OlindaEn este trabajo se presenta la implementación de un índice métrico-temporal en una aplicación que tiene como objetivo gestionar móviles destinados a la atención de emergencias en la vía pública. Esta aplicación fue desarrollada en el marco de una tesis de maestría para el Municipio de la localidad de Córdoba, Argentina. Se detalla la implementación del índice, la combinación del modelo de bases de datos relacional y espacio-temporal y la resolución de las principales consultas requeridas para la aplicación, fundamentalmente la consulta de trayectoria de los móviles en la atención de un eventoItem Bases de datos métrico-temporales(2009-05-07) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Herrera, Norma Edith; Gutierrez, GilbertoEl presente trabajo se desarrolla en el ámbito del Grupo de Investigación en Bases de Datos (Proy. Nro 25- D040) perteneciente al Departamento de Sistemas de la Universidad Tecnológica Nacional, Facultad Regional Concepción del Uruguay, cuyo objetivo principal es el estudio de m´etodos de acceso, procesamiento de consultas y aplicaciones de bases de datos no tradicionales. Las bases de datos métrico-temporales constituyen un nuevo modelo de bases de datos orientado al procesamiento de consultas por similitud en un intervalo o instante de tiempo. Este modelo está basado en la combinación de espacios métricos con bases de datos temporales. Para resolver eficientemente consultas métrico-temporales, se han propuesto varios índices cuyas evaluaciones empíricas demuestran que son competitivos. En este trabajo estamos interesado en el diseño de índices eficientes para el procesamiento de consultas métricos temporales.Item Bases de datos métrico-temporales: indexación en memoria secundaria(Universidad Tecnológica Nacional, 2020-11-05) Azar, Paola; De Battista, Anabella Cecilia; Herrera, Norma Edith; Ruano, DaríoActualmente las bases de datos han incluido la capacidad de almacenar datos tales como imágenes,sonido, texto, video, datos geométricos, etc. Es en este contexto donde surgen nuevos modelos de bases de datos. El modelo métrico-temporal surge bajo la necesidad de poder manipular objetos no estructurados con tiempos de vigencia asociados y realizar consultas por similitud y por tiempo en forma simultánea. Varios índices mérico-temporales se han propuesto en este ámbito, todos estos índices fueron desarrollados para ser eficientes en memoria principal. En este trabajo abordamos el estudio del índice Historical FHQT(H-FHQT), con el fin de proponer una técnica de paginación que sea eficiente para el manejo del mismo en memoria secundaria.Item Búsqueda en bases de datos métricas-temporales(2006-06-01) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gutierrez, Gilberto; Herrera, Norma EdithLas bases de datos clásicas se organizan basándose en el concepto de b´usqueda exacta sobre datos estructurados, capturando sólo un estado de la realidad modelizada. Actualmente las bases de datos han incluido la capacidad de almacenar otro tipos de datos tales como imágenes, sonido, texto, video, datos geométricos, entre otros. La problemática de almacenamiento y búsquedas sobre estos datos di ere de las bases de datos clásicas y por lo tanto se necesitan nuevos modelos capaces de abordarlos. Entre estos nuevos modelos se encuentran las bases de datos espacios-temporales y los espacios métricos, que han recibido un creciente interés de parte de la comunidad de bases de datos. En este trabajo nos proponemos estudiar el problema de búsquedas por similitud sobre objetos que pueden variar su identidad, su posición y/o su forma en el tiempo.Item Búsqueda por similitud de marcas de ganado vacuno(Universidad Nacional del Nordeste. Facultad de Ciencias Exactas y Naturales y Agrimensura., 2016-11-04) Pascal, Andrés Jorge; Romani, Rita Marisa; Michel, Lucrecia AnalíaSimilarity searching is an important field of study in the present days. An example of its application is the process of seeking cattle brands that is required during the registration of a trademark. In the present article, a method of similarity searching of cattle brands is presented. This method uses a variation of the Hausdorff distance that improve the precision of the resultsItem Búsqueda por similitud de objetos no estructurados : rostros, pinturas, huellas digitales, cadenas de texto, logos, marcas, banderas, sonidos, texto, etc.(2023-09-28) Pascal, Andrés Jorge; Dutra, Francisco; Retamero, Marcos Sebastián; Silveyra, Gonzalo Nahuel; Suárez, Pablo; Olivera, Eduardo Maximiliano; Korell Benedetti, Agustín; Martinelli, Iara; Fernández, María Emilia; Davezac, Luciano EmmanuelBúsqueda de Reglamentación utilizando técnicas de Procesamiento del Lenguaje Natural en ISI.Item Búsqueda por similitud de posiciones de ajedrez(Universidad Nacional de San Luis. Red de Universidades con Carreras en Informática., 2016-10-03) González, Diego; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithLas búsquedas por similitud constituyen un campo de estudio de gran importancia en la actualidad. En el presente trabajo se propone una función distancia para consultar por similitud posiciones de ajedrez sobre bases de datos de partidas, ya que actualmente estas consultas están limitadas a búsquedas exactas. Se evalúa su comportamiento mediante distintos tipos de pruebas sobre las fases del juego.Item Búsqueda por similitud para recuperación de imágenes(2011-11-03) Planas, Adrián Nicolás; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Díaz, Alejandra Alcira; Herrera, Norma EdithEn la búsqueda de imágenes por similitud en grandes bases de datos, es tan importante la eficiencia del sistema como su eficacia. La eficacia depende principalmente del preprocesamiento de las imágenes, de la técnica de extracción de características y de la función de distancia o disimilitud que se emplee. Por otro lado, los factores de mayor relevancia para la eficiencia del proceso son el costo de la función de distancia y el tipo de índice que se utilice para acelerar la búsqueda. En este trabajo se propone y evalúa experimentalmente una implementación completa orientada al uso de índices métricos para la búsqueda de imágenes por similitud, que adapta métodos y técnicas existentes para integrar en forma eficiente y eficaz estos elementos.Item Búsquedas por similitud de logos: extracción de características usando IA en escenarios de datos escasos(2023-11-03) Pascal, Andrés Jorge; Bonti, Agustina; Vidal Leiva, Florencia Zoe; Bonti, Iván Federico; Tonelotto, Lucas FranciscoEn el panorama actual, las Búsquedas por Similitud emergen como un ámbito de profundo interés. La evaluación de la similitud entre objetos generalmente involucra el empleo de funciones métricas de distancia aplicadas a vectores que representan características extraídas a partir de los mismos. Este artículo se enfoca en la extracción de características aplicada a imágenes de logos de clubes, utilizando técnicas modernas de aprendizaje automático; en particular, Redes Neuronales Profundas Convolucionales (CNN), Redes Siamesas y Transfer Learning/Fine Tuning. Si bien estas técnicas son muy potentes, su aplicación conlleva en algunos casos el desafío del entrenamiento ante datos escasos (One Shot Learning, en este caso). En este estudio comparamos dos enfoques de extracción de características en el contexto de escasez de datos, proponemos un método eficaz de preprocesamiento, y evaluamos experimentalmente el rendimiento de ambos métodos aplicados a la búsqueda por similitud de logos.Item Chatterbot inteligente para asesoramiento jurídico(2016-06-15) López De Luise, María Daniela; Carrilero, Patricio; Pascal, Andrés Jorge; Malgor, Rafael; Alvarez, Claudia Mabel; Díaz, Joaquín; Pescio, Pablo; Saad Correa, Ben RaúlThis paper presents the first results of a functional prototype implementing a linguistic model focused on regulations in Spanish. Its global architecture, the reasoning model, a case-study and short statistics are provided for the prototype named PTAH. It mainly has a conversational robot linked to an Expert System by a module with many intelligent linguistic filters, implementing the reasoning model of an expert. It is focused in bylaws, regulations, jurisprudence and customized background representing entity mission, vision and profile. This structure and model are generic enough to self adapt to any regulatory environment, but as a first step, it was limited to academic field. This way it is possible to limit the slang and data number. The foundations of the linguistic model and the way the architecture implements the key features of the behavior, are also outlined. The cases presented are a few just to show the usability, flexibility and prospectives of this proposal.Item Ciencia de datos aplicada al análisis de la evolución del COVID-19(2020-09-17) De Battista, Anabella Cecilia; Retamar, María SoledadEste trabajo fue realizado con el objetivo de aportar información sobre la evolución de la pandemia del COVID-19. A partir de fuentes de datos oficiales y mediante la aplicación de técnicas de analítica de datos y visualización de información, se presentan distintos análisis que permiten comprender la evolución de casos. Link de la aplicación web: https://gibd.github.io/covid/Item Co-location rules discovery process focused on reference spatial features using decision tree learning(2017) Rottoli, Giovanni Daián; Merlino, Hernán Daniel; García Martínez, RamónThe co-location discovery process serves to find subsets of spatial features frequently located together. Many algorithms and methods have been designed in recent years; however, finding this kind of patterns around specific spatial features is a task in which the existing solutions provide incorrect results. Throughout this paper we propose a knowledge discovery process to find co-location patterns focused on reference features using decision tree learning algorithms on transactional data generated using maximal cliques. A validation test of this process is provided.Item Construcción de una función de distancia para consultar por similitud caracteres de hueso de oráculo(2023-11-03) Pascal, Andrés Jorge; Planas, Adrián Nicolás; Castiglioni, León; Stauber, Federico J.; López, Martín RodrigoLos caracteres de hueso de oráculo (OBC) de la antigua China representan el sistema de escritura antiguo más renombrado a nivel mundial. El estudio e identificación de los OBC y su desciframiento se erigen como uno de los aspectos más cruciales dentro de la esfera de investigación de estos artefactos históricos. Entre los desafíos que enfrenta esta investigación, destaca el hecho de que la revisión de la literatura al respecto suele demandar considerables recursos temporales y de mano de obra. En consecuencia, la digitalización de la literatura OBC surge como una dirección inevitable para el desarrollo futuro de este campo. Por otro lado, durante la última década las Redes Neuronales Profundas Convolucionales (CNN) han demostrado un alto rendimiento en el procesamiento automático de imágenes. Este artículo presenta un enfoque que combina preprocesamiento, aumento de datos y modelos CNN para aprender una función de distancia para buscar por similitud caracteres OBC en un escenario Few-Shot Learning, utilizando una arquitectura de Redes Siamesas en su proceso de entrenamiento. La principal ventaja de utilizar Búsquedas por Similitud en lugar de modelos de clasificación, es que el sistema permite el agregado de nuevos elementos (clases) sin modificación del modelo ni reentrenamiento.Item Consultas en nuevos modelos de bases de datos(2014-05-07) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoPor la capacidad de almacenar datos estructurados que poseen las bases de datos tradicionales se aplica en este modelo el concepto de búsqueda exacta, es decir consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre los datos almacenados en registros de tama˜no fijo compuestos por campos comparables. Al surgir la posibilidad de almacenar en una base otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, hace necesaria la definicion de nuevas operaciones y capacidad de almacenamiento en las bases de datos. Se espera poder realizar en estos modelos busquedas eficientemente, teniendo en cuenta cuestiones como que la búsqueda exacta no resulta de interes y que en ciertas ocasiones se requiere mantener los distintos estados de la base de datos a través de tiempo y no solo el más reciente, a fin de poder realizar consultas de información histórica. Como respuesta a estos requerimientos han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que brindan funcionalidades de persitencia y manipulación de estos tipos de datos. El tema de estudio del Grupo de Investigación en Bases de Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Consultas métrico-temporales(2012-11-21) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma Edith; Gutierrez, GilbertoEl modelo de bases de datos métricotemporal permite abordar aquellas situaciones en las que resulta necesario realizar búsquedas por similitud teniendo en cuenta también un componente temporal. En este artículo presentamos los tipos de consultas métricotemporales más relevantes sobre este modelo, y en particular se propone un algoritmo para resolver las búsquedas por similitud de los k vecinos más cercanos restringidas a un intervalo o instante temporal. Además se presentan resultados experimentales que comparan la eficiencia de este algoritmo versus la solución trivial.