Browsing by Author "Herrera, Norma Edith"
Now showing 1 - 20 of 40
- Results Per Page
- Sort Options
Item Adecuación de una propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de ciencia de datos(2018-11-30) Cristaldo, Patricia Raquel; Schab, Esteban Alejandro; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; De Battista, Anabella Cecilia; Retamar, María Soledad; Herrera, Norma EdithLa aplicación de metodologías de gestión de proyectos conlleva a contribuir con los factores de éxito en la gestión de los mismos. Esta propuesta se deriva de un trabajo anterior y considera los aspectos relevantes de la gestión tradicional y ágil, permitiendo la alineación de los objetivos de un proyecto de ciencia de datos con los resultados del mismo. Este trabajo presenta la adecuación y posterior validación de una propuesta metodológica de enfoque “híbrido” a un proyecto de ciencia de datos, considerando el cumplimiento de los factores de éxito afectados a este tipo de proyectos.Item Algoritmo de clasificación para datos masivos(Universidad Tecnológica Nacional. Facultad Regional Concepción del Uruguay., 2017) Retamar, María Soledad; Leguizamón, Mario Guillermo; Herrera, Norma EdithEn esta tesis se propone desarrollar un algoritmo de clasificación para datos masivos inspirado en el tradicional algoritmo C4.5 que demuestre un desempeño eficiente implementado en las tecnologías existentes para el tratamiento de datos masivos.Item Análisis de sentimientos en Twitter : una implementación sobre Cloudera(2016-11-17) Retamar, María Soledad; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDebido al crecimiento exponencial de las fuentes de información disponibles, en la actualidad resulta necesario contar con técnicas y herramientas diferentes a las tradicionales para abordar el procesamiento y análisis de los datos. En este trabajo se presentan las principales herramientas ofrecidas por la distribución de Cloudera del ecosistema Hadoop y el Lenguaje R para implementar un caso de estudio de análisis de sentimiento de tweets sobre la opinión de usuarios de esta red social sobre el proyecto de Ley Antidespidos discutido recientemente en el Congreso de la Nación Argentina.Item Bases de datos de objetos no estructurados(2013-04-10) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gancharov Díaz, Pablo Alejandro; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoEn las bases de datos tradicionales es frecuente el procesamiento de consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre datos estructurados en registros de tamaño fijo compuestos por campos comparables. La necesidad de almacenar otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, obligó a extender las capacidades de las bases de datos; pero en la mayoría de los casos sólo se permiten el almacenamiento y alguna funcionalidad adicional. Por ello resulta necesario desarrollar nuevos enfoques para almacenar y la buscar objetos no estructurados eficientemente. En estos nuevos modelos la búsqueda exacta carece de interés y en muchos casos se requiere mantener los distintos estados de la base de datos a través de tiempo y no sólo el más reciente, para poder consultar información histórica. Como solución han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que permiten representar y manipular estos tipos de datos. El tema de estudio del Grupo de Investigación en Basesde Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Bases de datos métrico-temporales(2009-05-07) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Herrera, Norma Edith; Gutierrez, GilbertoEl presente trabajo se desarrolla en el ámbito del Grupo de Investigación en Bases de Datos (Proy. Nro 25- D040) perteneciente al Departamento de Sistemas de la Universidad Tecnológica Nacional, Facultad Regional Concepción del Uruguay, cuyo objetivo principal es el estudio de m´etodos de acceso, procesamiento de consultas y aplicaciones de bases de datos no tradicionales. Las bases de datos métrico-temporales constituyen un nuevo modelo de bases de datos orientado al procesamiento de consultas por similitud en un intervalo o instante de tiempo. Este modelo está basado en la combinación de espacios métricos con bases de datos temporales. Para resolver eficientemente consultas métrico-temporales, se han propuesto varios índices cuyas evaluaciones empíricas demuestran que son competitivos. En este trabajo estamos interesado en el diseño de índices eficientes para el procesamiento de consultas métricos temporales.Item Bases de datos métrico-temporales: indexación en memoria secundaria(Universidad Tecnológica Nacional, 2020-11-05) Azar, Paola; De Battista, Anabella Cecilia; Herrera, Norma Edith; Ruano, DaríoActualmente las bases de datos han incluido la capacidad de almacenar datos tales como imágenes,sonido, texto, video, datos geométricos, etc. Es en este contexto donde surgen nuevos modelos de bases de datos. El modelo métrico-temporal surge bajo la necesidad de poder manipular objetos no estructurados con tiempos de vigencia asociados y realizar consultas por similitud y por tiempo en forma simultánea. Varios índices mérico-temporales se han propuesto en este ámbito, todos estos índices fueron desarrollados para ser eficientes en memoria principal. En este trabajo abordamos el estudio del índice Historical FHQT(H-FHQT), con el fin de proponer una técnica de paginación que sea eficiente para el manejo del mismo en memoria secundaria.Item Búsqueda en bases de datos métricas-temporales(2006-06-01) De Battista, Anabella Cecilia; Pascal, Andrés Jorge; Gutierrez, Gilberto; Herrera, Norma EdithLas bases de datos clásicas se organizan basándose en el concepto de b´usqueda exacta sobre datos estructurados, capturando sólo un estado de la realidad modelizada. Actualmente las bases de datos han incluido la capacidad de almacenar otro tipos de datos tales como imágenes, sonido, texto, video, datos geométricos, entre otros. La problemática de almacenamiento y búsquedas sobre estos datos di ere de las bases de datos clásicas y por lo tanto se necesitan nuevos modelos capaces de abordarlos. Entre estos nuevos modelos se encuentran las bases de datos espacios-temporales y los espacios métricos, que han recibido un creciente interés de parte de la comunidad de bases de datos. En este trabajo nos proponemos estudiar el problema de búsquedas por similitud sobre objetos que pueden variar su identidad, su posición y/o su forma en el tiempo.Item Búsqueda por similitud de posiciones de ajedrez(Universidad Nacional de San Luis. Red de Universidades con Carreras en Informática., 2016-10-03) González, Diego; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithLas búsquedas por similitud constituyen un campo de estudio de gran importancia en la actualidad. En el presente trabajo se propone una función distancia para consultar por similitud posiciones de ajedrez sobre bases de datos de partidas, ya que actualmente estas consultas están limitadas a búsquedas exactas. Se evalúa su comportamiento mediante distintos tipos de pruebas sobre las fases del juego.Item Búsqueda por similitud para recuperación de imágenes(2011-11-03) Planas, Adrián Nicolás; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Díaz, Alejandra Alcira; Herrera, Norma EdithEn la búsqueda de imágenes por similitud en grandes bases de datos, es tan importante la eficiencia del sistema como su eficacia. La eficacia depende principalmente del preprocesamiento de las imágenes, de la técnica de extracción de características y de la función de distancia o disimilitud que se emplee. Por otro lado, los factores de mayor relevancia para la eficiencia del proceso son el costo de la función de distancia y el tipo de índice que se utilice para acelerar la búsqueda. En este trabajo se propone y evalúa experimentalmente una implementación completa orientada al uso de índices métricos para la búsqueda de imágenes por similitud, que adapta métodos y técnicas existentes para integrar en forma eficiente y eficaz estos elementos.Item Búsquedas por similitud sobre objetos dinámicos(Universidad Tecnológica Nacional. Facultad Regional Concepción del Uruguay., 2008-11-21) De Battista, Anabella Cecilia; Herrera, Norma Edith; Gutiérrez Retamal, GilbertoEn esta tesis se aborda el estudio de las consultas métrico-temporales con el fin de diseñar nuevos modelos que permitan resolverlas eficientemente. El objetivo principal de este trabajo es el diseño y la evaluación de algoritmos orientados a búsquedas en bases de datos métricas que consideran objetos dinámicos, es decir, objetos que pueden cambiar sus atributos en distintos instantes de tiempo. La propuesta es formular nuevos métodos de acceso métricos-temporales y desarrollar algoritmos que utilicen las estructuras de datos subyacentes de dichos métodos para procesar este nuevo tipo de consultas.Item Consultas en nuevos modelos de bases de datos(2014-05-07) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Arguello, Melisa; Saliwonczyk, Christian Martín; Herrera, Norma Edith; Gutierrez, GilbertoPor la capacidad de almacenar datos estructurados que poseen las bases de datos tradicionales se aplica en este modelo el concepto de búsqueda exacta, es decir consultas por exactitud o por rango de valores suceptibles de ser ordenados, sobre los datos almacenados en registros de tama˜no fijo compuestos por campos comparables. Al surgir la posibilidad de almacenar en una base otros tipos de datos tales como los objetos multimediales (imágenes, video, texto) y el hecho de que estos datos no puedan estructurarse, hace necesaria la definicion de nuevas operaciones y capacidad de almacenamiento en las bases de datos. Se espera poder realizar en estos modelos busquedas eficientemente, teniendo en cuenta cuestiones como que la búsqueda exacta no resulta de interes y que en ciertas ocasiones se requiere mantener los distintos estados de la base de datos a través de tiempo y no solo el más reciente, a fin de poder realizar consultas de información histórica. Como respuesta a estos requerimientos han surgido modelos como el espacial, temporal, espacio-temporal, espacios métricos y el modelo métrico-temporal, que brindan funcionalidades de persitencia y manipulación de estos tipos de datos. El tema de estudio del Grupo de Investigación en Bases de Datos (GIBD), es el modelado de objetos no estructurados y el procesamiento eficiente de consultas sobre estos tipos de datos.Item Consultas métrico-temporales(2012-11-21) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma Edith; Gutierrez, GilbertoEl modelo de bases de datos métricotemporal permite abordar aquellas situaciones en las que resulta necesario realizar búsquedas por similitud teniendo en cuenta también un componente temporal. En este artículo presentamos los tipos de consultas métricotemporales más relevantes sobre este modelo, y en particular se propone un algoritmo para resolver las búsquedas por similitud de los k vecinos más cercanos restringidas a un intervalo o instante temporal. Además se presentan resultados experimentales que comparan la eficiencia de este algoritmo versus la solución trivial.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Una extensión del FHQT temporal para distancias continuas(2013-10-21) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma Edith; Gutierrez, GilbertoEl modelo de bases de datos métrico-temporal permite abordar aquellas situaciones en las que resulta necesario realizar búsquedas por similitud teniendo en cuenta también la componente temporal. En este artículo presentamos una mejora al índice métrico-temporal FHQT-Temporal, que soporta valores continuos de la funci´on de distancia, manteniendo la eficiencia ante cambios de valores del radio de búsqueda e incrementos de los intervalos de tiempo. Además se muestran resultados de la verificación experimental de esta estructura para un conjunto de datos determinado.Item Extracción de características utilizando redes siamesas y aumentación aplicada a las búsquedas por similitud de marcas de ganado(2022-11-04) Pascal, Andrés Jorge; Herrera, Norma Edith; Planas, Adrián Nicolás; Lederhos, FedericoLas Búsquedas por Similitud constituyen un importante campo de estudio en el presente. Un ejemplo de su aplicación es la búsqueda de marcas de ganado, necesaria ante la solicitud de alta de una nueva marca al Departamento de Registro Ganadero. Para calcular su similitud, se suelen utilizar funciones de distancia métrica aplicadas a vectores de características extraídas a partir de su imagen. Existen varios métodos de extracción de características, a los cuales en la última década se le han sumado las Redes Neuronales Profundas Convolucionales (CNN). En este artículo se muestra el uso de una CNN entrenada mediante Redes Siamesas y con técnicas estándares de Aumentación de datos, a las cuales se le añade una técnica propia para mejorar la eficacia de la extracción de características aplicadas a las Búsquedas por Similitud de Marcas de Ganado. Además, se evalúa experimentalmente su performance.Item Geocodificación : caso de estudio del sector comercial de Concepción del Uruguay(2012-08-12) Planas, Adrián Nicolás; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Díaz, Alejandra Alcira; Herrera, Norma EdithUn sistema de información geográfica permite capturar, almacenar, manipular, analizar y mostrar información geográficamente referenciada a fin de resolver problemas complejos de planificación y gestión. En el marco de un estudio del sector comercial de la ciudad de Concepción del Uruguay se presen-tó el problema de modelado e implementación de la información a través de un SIG, y particularmente la problemática de la geocodificación de los datos rele-vados. Si bien existen métodos genéricos de geocodificación, cada caso posee características particulares. En este trabajo se presenta la solución de geocodifi-cación de puntos que se aplicó al estudio del perfil y las características del sec-tor comercial de la ciudad para la ubicación espacial de los comercios releva-dos.Item Geocodificación de comercios, industrias y profesionales del Municipio de Urdinarrain(Universidad Nacional del Nordeste. Facultad de Ciencias Exactas, 2016-11-05) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithAn Geographic Information System (GIS) allows to capture, store, manipulate , analyze and display geographically referenced information to solve complex problems of planning and management. As part of a study of commercial, industrial and professional sectors of the city of Urdinarrain, Entre Rios, modeling and implementation of a GIS is proposed to represent the spatial distribution of these sectors. It was necessary to develop a method of geocoding of data collected and an application that allows modification and the incorporation of new elements automating its geocoding. While there are generic methods geocoding, given the complexity of the problem and the lack of updated maps, we had to design a specific method for the case. This paper present the geocoding solution we are design.Item Implementación de data stream mining(2018-09) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Ríos, Juan Manuel; Casanova Pietroboni, Carlos Antonio; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDesde hace décadas las organizaciones utilizan información histórica propia para construir data warehouses y, mediante la aplicación de técnicas de descubrimiento de conocimiento, descubrir patrones que guíen la toma de decisiones.Actualmente, es una oportunidad para las organizaciones tomar decisiones en tiempo real basadas en información que puede provenir de múltiples fuentes, con diversos formatos y que se genera a gran velocidad. Como respuesta a esta necesidad surge Data Stream Mining (DSM), un subárea específica de la Minería de Datos definida como el proceso de extraer conocimiento en estructuras de datos continuas y con rápidas transiciones. Dicho análisis aporta a las organizaciones visibilidad del negocio y de sus clientes en tiempo real y les permite responder ágilmente ante los cambios. En este trabajo se presenta la vinculación del GIBD de la UTN-FRCU con la empresa Sidesys IT Solutions con el objetivo de implementar Data Stream Mining en la empresa.Item Indexación y búsqueda sobre datos no estructurados(Universidad Nacional del Nordeste, 2018-04-26) Herrera, Norma Edith; Ruano, Darío; Azar, Paola; De Battista, Anabella Cecilia; Pascal, Andrés JorgeLas bases de datos han incluido la capacidad de almacenar datos no estructurados tales como imágenes, sonido, texto, video, etc. La problemática de almacenamiento y búsqueda en estos tipos de base de datos difiere de las bases de datos clásicas,dado que no es posible organizarlos en registros y campos, y aun cuando pudiera hacerse, la búsqueda exacta carece de interés. Es en este contexto donde surgen nuevos modelos de bases de datos capaces de cubrir las necesidades de almacenamiento y búsqueda de estas aplicaciones. Nuestro interés se basa en el diseño de índices eficientes para estas nuevas bases de datos.