FRCU - GIBD : Grupo de Investigación en Bases de Datos - Comunicaciones a congresos
Permanent URI for this collectionhttp://48.217.138.120/handle/20.500.12272/793
Browse
Item Adecuación de una propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de ciencia de datos(2018-11-30) Cristaldo, Patricia Raquel; Schab, Esteban Alejandro; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; De Battista, Anabella Cecilia; Retamar, María Soledad; Herrera, Norma EdithLa aplicación de metodologías de gestión de proyectos conlleva a contribuir con los factores de éxito en la gestión de los mismos. Esta propuesta se deriva de un trabajo anterior y considera los aspectos relevantes de la gestión tradicional y ágil, permitiendo la alineación de los objetivos de un proyecto de ciencia de datos con los resultados del mismo. Este trabajo presenta la adecuación y posterior validación de una propuesta metodológica de enfoque “híbrido” a un proyecto de ciencia de datos, considerando el cumplimiento de los factores de éxito afectados a este tipo de proyectos.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Aproximación a las prácticas docentes en la carrera de ingeniería en sistemas de información(2022-11-03) Muñoz, Roberto Miguel; Soria, Mercedes; Cristaldo, Patricia Raquel; Odetti, María Alejandra; Casanova Pietroboni, Carlos AntonioEste trabajo se inscribe en el marco de un proyecto de investigación asociativo y multi facultades con el objetivo de mostrar el grado de avance en la búsqueda de mejores prácticas docentes mediadas tecnológicamente en las carreras de ingeniería en sistemas de información. Se procesó y analizó una encuesta docente en relación a cuatro bloques: generalidades, mediación pedagógica, tecnológica y evaluación. Para ello se codificaron 251 respuestas docentes, se realizó una estadística descriptiva a los fines de poder caracterizar las prácticas que se desarrollan en las cuatro instituciones bajo estudio, y se aplicaron técnicas de minería de datos para hallar relaciones entre variables a partir de reglas de asociación. Los primeros resultados, desde la autopercepción docente, indican que algunas prácticas que favorecen el modelo de formación por competencias comienzan a emerger en la cotidianeidad de las aulas, que hay diversidad de tecnologías presentes en el proceso educativo y que tanto el uso de rúbricas como alternativas y simultaneidad de formas de evaluación comienzan a posicionarse positivamente en las unidades académicas. Por otro lado, con lenguaje Python se modeló una ecuación que permitió puntuar las prácticas con cierto grado de objetividad para poder seleccionar los primeros casos de estudio donde avanzar con otras técnicas de profundización sobre el objeto de investigación.Item Bases de datos de objetos no estructurados(2013-04-10) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gancharov Díaz, Pablo Alejandro; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoEn las bases de datos tradicionales es frecuente el procesamiento de consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre datos estructurados en registros de tamaño fijo compuestos por campos comparables. La necesidad de almacenar otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, obligó a extender las capacidades de las bases de datos; pero en la mayoría de los casos sólo se permiten el almacenamiento y alguna funcionalidad adicional. Por ello resulta necesario desarrollar nuevos enfoques para almacenar y la buscar objetos no estructurados eficientemente. En estos nuevos modelos la búsqueda exacta carece de interés y en muchos casos se requiere mantener los distintos estados de la base de datos a través de tiempo y no sólo el más reciente, para poder consultar información histórica. Como solución han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que permiten representar y manipular estos tipos de datos. El tema de estudio del Grupo de Investigación en Basesde Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Bases de datos espacio-temporales aplicadas en la gestión de emergencias(2017-11) Aballay, Marcela; De Battista, Anabella Cecilia; Gagliardi, Edilma OlindaEn este trabajo se presenta la implementación de un índice métrico-temporal en una aplicación que tiene como objetivo gestionar móviles destinados a la atención de emergencias en la vía pública. Esta aplicación fue desarrollada en el marco de una tesis de maestría para el Municipio de la localidad de Córdoba, Argentina. Se detalla la implementación del índice, la combinación del modelo de bases de datos relacional y espacio-temporal y la resolución de las principales consultas requeridas para la aplicación, fundamentalmente la consulta de trayectoria de los móviles en la atención de un eventoItem Bases de datos métrico-temporales(2009-05-07) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Herrera, Norma Edith; Gutierrez, GilbertoEl presente trabajo se desarrolla en el ámbito del Grupo de Investigación en Bases de Datos (Proy. Nro 25- D040) perteneciente al Departamento de Sistemas de la Universidad Tecnológica Nacional, Facultad Regional Concepción del Uruguay, cuyo objetivo principal es el estudio de m´etodos de acceso, procesamiento de consultas y aplicaciones de bases de datos no tradicionales. Las bases de datos métrico-temporales constituyen un nuevo modelo de bases de datos orientado al procesamiento de consultas por similitud en un intervalo o instante de tiempo. Este modelo está basado en la combinación de espacios métricos con bases de datos temporales. Para resolver eficientemente consultas métrico-temporales, se han propuesto varios índices cuyas evaluaciones empíricas demuestran que son competitivos. En este trabajo estamos interesado en el diseño de índices eficientes para el procesamiento de consultas métricos temporales.Item Bases de datos métrico-temporales: indexación en memoria secundaria(Universidad Tecnológica Nacional, 2020-11-05) Azar, Paola; De Battista, Anabella Cecilia; Herrera, Norma Edith; Ruano, DaríoActualmente las bases de datos han incluido la capacidad de almacenar datos tales como imágenes,sonido, texto, video, datos geométricos, etc. Es en este contexto donde surgen nuevos modelos de bases de datos. El modelo métrico-temporal surge bajo la necesidad de poder manipular objetos no estructurados con tiempos de vigencia asociados y realizar consultas por similitud y por tiempo en forma simultánea. Varios índices mérico-temporales se han propuesto en este ámbito, todos estos índices fueron desarrollados para ser eficientes en memoria principal. En este trabajo abordamos el estudio del índice Historical FHQT(H-FHQT), con el fin de proponer una técnica de paginación que sea eficiente para el manejo del mismo en memoria secundaria.Item Búsqueda en bases de datos métricas-temporales(2006-06-01) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gutierrez, Gilberto; Herrera, Norma EdithLas bases de datos clásicas se organizan basándose en el concepto de b´usqueda exacta sobre datos estructurados, capturando sólo un estado de la realidad modelizada. Actualmente las bases de datos han incluido la capacidad de almacenar otro tipos de datos tales como imágenes, sonido, texto, video, datos geométricos, entre otros. La problemática de almacenamiento y búsquedas sobre estos datos di ere de las bases de datos clásicas y por lo tanto se necesitan nuevos modelos capaces de abordarlos. Entre estos nuevos modelos se encuentran las bases de datos espacios-temporales y los espacios métricos, que han recibido un creciente interés de parte de la comunidad de bases de datos. En este trabajo nos proponemos estudiar el problema de búsquedas por similitud sobre objetos que pueden variar su identidad, su posición y/o su forma en el tiempo.Item Búsqueda por similitud de marcas de ganado vacuno(Universidad Nacional del Nordeste. Facultad de Ciencias Exactas y Naturales y Agrimensura., 2016-11-04) Pascal, Andrés Jorge; Romani, Rita Marisa; Michel, Lucrecia AnalíaSimilarity searching is an important field of study in the present days. An example of its application is the process of seeking cattle brands that is required during the registration of a trademark. In the present article, a method of similarity searching of cattle brands is presented. This method uses a variation of the Hausdorff distance that improve the precision of the resultsItem Búsqueda por similitud de objetos no estructurados : rostros, pinturas, huellas digitales, cadenas de texto, logos, marcas, banderas, sonidos, texto, etc.(2023-09-28) Pascal, Andrés Jorge; Dutra, Francisco; Retamero, Marcos Sebastián; Silveyra, Gonzalo Nahuel; Suárez, Pablo; Olivera, Eduardo Maximiliano; Korell Benedetti, Agustín; Martinelli, Iara; Fernández, María Emilia; Davezac, Luciano EmmanuelBúsqueda de Reglamentación utilizando técnicas de Procesamiento del Lenguaje Natural en ISI.Item Búsqueda por similitud de posiciones de ajedrez(Universidad Nacional de San Luis. Red de Universidades con Carreras en Informática., 2016-10-03) González, Diego; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithLas búsquedas por similitud constituyen un campo de estudio de gran importancia en la actualidad. En el presente trabajo se propone una función distancia para consultar por similitud posiciones de ajedrez sobre bases de datos de partidas, ya que actualmente estas consultas están limitadas a búsquedas exactas. Se evalúa su comportamiento mediante distintos tipos de pruebas sobre las fases del juego.Item Búsqueda por similitud para recuperación de imágenes(2011-11-03) Planas, Adrián Nicolás; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Díaz, Alejandra Alcira; Herrera, Norma EdithEn la búsqueda de imágenes por similitud en grandes bases de datos, es tan importante la eficiencia del sistema como su eficacia. La eficacia depende principalmente del preprocesamiento de las imágenes, de la técnica de extracción de características y de la función de distancia o disimilitud que se emplee. Por otro lado, los factores de mayor relevancia para la eficiencia del proceso son el costo de la función de distancia y el tipo de índice que se utilice para acelerar la búsqueda. En este trabajo se propone y evalúa experimentalmente una implementación completa orientada al uso de índices métricos para la búsqueda de imágenes por similitud, que adapta métodos y técnicas existentes para integrar en forma eficiente y eficaz estos elementos.Item Búsquedas por similitud de logos: extracción de características usando IA en escenarios de datos escasos(2023-11-03) Pascal, Andrés Jorge; Bonti, Agustina; Vidal Leiva, Florencia Zoe; Bonti, Iván Federico; Tonelotto, Lucas FranciscoEn el panorama actual, las Búsquedas por Similitud emergen como un ámbito de profundo interés. La evaluación de la similitud entre objetos generalmente involucra el empleo de funciones métricas de distancia aplicadas a vectores que representan características extraídas a partir de los mismos. Este artículo se enfoca en la extracción de características aplicada a imágenes de logos de clubes, utilizando técnicas modernas de aprendizaje automático; en particular, Redes Neuronales Profundas Convolucionales (CNN), Redes Siamesas y Transfer Learning/Fine Tuning. Si bien estas técnicas son muy potentes, su aplicación conlleva en algunos casos el desafío del entrenamiento ante datos escasos (One Shot Learning, en este caso). En este estudio comparamos dos enfoques de extracción de características en el contexto de escasez de datos, proponemos un método eficaz de preprocesamiento, y evaluamos experimentalmente el rendimiento de ambos métodos aplicados a la búsqueda por similitud de logos.Item Chatterbot inteligente para asesoramiento jurídico(2016-06-15) López De Luise, María Daniela; Carrilero, Patricio; Pascal, Andrés Jorge; Malgor, Rafael; Alvarez, Claudia Mabel; Díaz, Joaquín; Pescio, Pablo; Saad Correa, Ben RaúlThis paper presents the first results of a functional prototype implementing a linguistic model focused on regulations in Spanish. Its global architecture, the reasoning model, a case-study and short statistics are provided for the prototype named PTAH. It mainly has a conversational robot linked to an Expert System by a module with many intelligent linguistic filters, implementing the reasoning model of an expert. It is focused in bylaws, regulations, jurisprudence and customized background representing entity mission, vision and profile. This structure and model are generic enough to self adapt to any regulatory environment, but as a first step, it was limited to academic field. This way it is possible to limit the slang and data number. The foundations of the linguistic model and the way the architecture implements the key features of the behavior, are also outlined. The cases presented are a few just to show the usability, flexibility and prospectives of this proposal.Item Ciencia de datos aplicada al análisis de la evolución del COVID-19(2020-09-17) De Battista, Anabella Cecilia; Retamar, María SoledadEste trabajo fue realizado con el objetivo de aportar información sobre la evolución de la pandemia del COVID-19. A partir de fuentes de datos oficiales y mediante la aplicación de técnicas de analítica de datos y visualización de información, se presentan distintos análisis que permiten comprender la evolución de casos. Link de la aplicación web: https://gibd.github.io/covid/Item Construcción de una función de distancia para consultar por similitud caracteres de hueso de oráculo(2023-11-03) Pascal, Andrés Jorge; Planas, Adrián Nicolás; Castiglioni, León; Stauber, Federico J.; López, Martín RodrigoLos caracteres de hueso de oráculo (OBC) de la antigua China representan el sistema de escritura antiguo más renombrado a nivel mundial. El estudio e identificación de los OBC y su desciframiento se erigen como uno de los aspectos más cruciales dentro de la esfera de investigación de estos artefactos históricos. Entre los desafíos que enfrenta esta investigación, destaca el hecho de que la revisión de la literatura al respecto suele demandar considerables recursos temporales y de mano de obra. En consecuencia, la digitalización de la literatura OBC surge como una dirección inevitable para el desarrollo futuro de este campo. Por otro lado, durante la última década las Redes Neuronales Profundas Convolucionales (CNN) han demostrado un alto rendimiento en el procesamiento automático de imágenes. Este artículo presenta un enfoque que combina preprocesamiento, aumento de datos y modelos CNN para aprender una función de distancia para buscar por similitud caracteres OBC en un escenario Few-Shot Learning, utilizando una arquitectura de Redes Siamesas en su proceso de entrenamiento. La principal ventaja de utilizar Búsquedas por Similitud en lugar de modelos de clasificación, es que el sistema permite el agregado de nuevos elementos (clases) sin modificación del modelo ni reentrenamiento.Item Consultas en nuevos modelos de bases de datos(2014-05-07) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoPor la capacidad de almacenar datos estructurados que poseen las bases de datos tradicionales se aplica en este modelo el concepto de búsqueda exacta, es decir consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre los datos almacenados en registros de tama˜no fijo compuestos por campos comparables. Al surgir la posibilidad de almacenar en una base otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, hace necesaria la definicion de nuevas operaciones y capacidad de almacenamiento en las bases de datos. Se espera poder realizar en estos modelos busquedas eficientemente, teniendo en cuenta cuestiones como que la búsqueda exacta no resulta de interes y que en ciertas ocasiones se requiere mantener los distintos estados de la base de datos a través de tiempo y no solo el más reciente, a fin de poder realizar consultas de información histórica. Como respuesta a estos requerimientos han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que brindan funcionalidades de persitencia y manipulación de estos tipos de datos. El tema de estudio del Grupo de Investigación en Bases de Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Consultas métrico-temporales(2012-11-21) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma Edith; Gutierrez, GilbertoEl modelo de bases de datos métricotemporal permite abordar aquellas situaciones en las que resulta necesario realizar búsquedas por similitud teniendo en cuenta también un componente temporal. En este artículo presentamos los tipos de consultas métricotemporales más relevantes sobre este modelo, y en particular se propone un algoritmo para resolver las búsquedas por similitud de los k vecinos más cercanos restringidas a un intervalo o instante temporal. Además se presentan resultados experimentales que comparan la eficiencia de este algoritmo versus la solución trivial.Item Convergencia tecnológica en Centros de Excelencia Científica : análisis de casos en Argentina(2019-11-14) Lepratte, Leandro; De Battista, Anabella Cecilia; Blanc, Rafael Luján; Rodríguez, María Alejandra; Retamar, María Soledad; Gastal, ValeriaEl presente trabajo, expone los avances metodológicos de una propuesta de estudio sobre imaginarios sociotécnicos y modelos de gestión de Centros de Excelencia Científico – Tecnológicas (CECyT) orientados a Convergencia Tecnológica en Argentina. El objetivo principal de este trabajo, es analizar y explicar las características y modalidades de relaciones entre los imaginarios sociotécnicos sobre Convergencia Tecnológica y los modelos de gestión del conocimiento y la innovación en una serie de CECYT de Argentina. Una reciente literatura en el campo de estudios sociales de la ciencia y la tecnología, enfatiza el papel de los “imaginarios sociotécnicos” en la conformación de las políticas, instrumentos e instituciones de los diferentes países, en particular en el modo de entender a la convergencia tecnológica. Diversos estudios a escala de países (Kim, 2018), sectores (Jasanoff & Kim, 2013), como así también institucionales (Jasanoff & Kim, 2015), vienen explorando esta cuestión en relación a la categoría de Convergencia Tecnológica y su adaptación a diferentes contextos. En América Latina, diversos estudiosos del campo CTS han considerado las tensiones permanentes en la producción de conocimientos y desarrollo de innovaciones tecnológicas entre lo local y lo global. Se han efectuado estudios sobre las dificultades de trasladar a nuestra región los modelos de gobernanza de la ciencia y la tecnología tal como se plantean en países desarrollados, como el caso de los sistemas de innovación (Dagnino & Thomas, 2001). Cómo así también, el carácter periférico y globalizado a la vez de los centros de producción de conocimientos de excelencia en nuestro continente. En este marco contextual, el presente estudio, en su etapa de diseño metodológico, busca echar luz sobre estas cuestiones tomando como fenómenos para analizar a los imaginarios sociotécnicos y los modelos de gestión del conocimiento y la innovación en CECYT de Argentina.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.
- «
- 1 (current)
- 2
- 3
- »