FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
36 results
Search Results
Item Técnicas de análisis de sentimientos aplicadas a la valoración de opiniones en el lenguaje español(2021-10-08) Rosenbrock, Germán; Trossero, Sebastián; Pascal, Andrés JorgeEn el presente existen grandes cantidades de datos en formato de texto escritos en el lenguaje natural, disponibles principalmente en sitios web y redes sociales, que crece día a día. El análisis manual de estos volúmenes de información es actualmente impráctico y costoso, por lo cual se hace necesario el uso de técnicas automatizadas para su procesamiento y análisis. La Minería de Opinión o Análisis de Sentimientos estudia la extracción de información a partir de datos subjetivos y es relativamente reciente. En los últimos años se han propuesto varios modelos de procesamiento del lenguaje natural para resolver el problema particular de clasificación de sentimientos. En este trabajo examinamos el rendimiento de varios de estos modelos aplicados a un caso donde los textos están escritos en el lenguaje castellano coloquial, lo que representa un desafío adicional. El caso propuesto es un conjunto de más de 50.000 reseñas de películas, extraídas del sitio www.cinesargentinos.com.ar.Item Mejorando la identificación de marcas de ganado vacuno : redes siamesas en el aprendizaje de funciones de distancia(2023-10-12) Pascal, Andrés Jorge; Planas, Adrián Nicolás; Stauber, Federico J.Las Búsquedas por Similitud son importantes en diversas aplicaciones, incluyendo la identificación de marcas de ganado vacuno para el registro ganadero. Para calcular la similitud entre estas marcas, se utilizan funciones de distancia que miden dicha similitud en base a sus características, o en forma directa a partir de las imágenes correspondientes. En esta última década, las Redes Neuronales Profundas Convolucionales (CNN) han alcanzado muy buena performance en el procesamiento de imágenes. En este artículo se propone un método de preprocesamiento, aumentación de datos y modelos de CNN para aprender una función de distancia en un escenario de One-Shot learning utilizando una arquitectura de Redes Siamesas como mecanismo de entrenamiento.Item Construcción de una función de distancia para consultar por similitud caracteres de hueso de oráculo(2023-11-03) Pascal, Andrés Jorge; Planas, Adrián Nicolás; Castiglioni, León; Stauber, Federico J.; López, Martín RodrigoLos caracteres de hueso de oráculo (OBC) de la antigua China representan el sistema de escritura antiguo más renombrado a nivel mundial. El estudio e identificación de los OBC y su desciframiento se erigen como uno de los aspectos más cruciales dentro de la esfera de investigación de estos artefactos históricos. Entre los desafíos que enfrenta esta investigación, destaca el hecho de que la revisión de la literatura al respecto suele demandar considerables recursos temporales y de mano de obra. En consecuencia, la digitalización de la literatura OBC surge como una dirección inevitable para el desarrollo futuro de este campo. Por otro lado, durante la última década las Redes Neuronales Profundas Convolucionales (CNN) han demostrado un alto rendimiento en el procesamiento automático de imágenes. Este artículo presenta un enfoque que combina preprocesamiento, aumento de datos y modelos CNN para aprender una función de distancia para buscar por similitud caracteres OBC en un escenario Few-Shot Learning, utilizando una arquitectura de Redes Siamesas en su proceso de entrenamiento. La principal ventaja de utilizar Búsquedas por Similitud en lugar de modelos de clasificación, es que el sistema permite el agregado de nuevos elementos (clases) sin modificación del modelo ni reentrenamiento.Item Búsquedas por similitud de logos: extracción de características usando IA en escenarios de datos escasos(2023-11-03) Pascal, Andrés Jorge; Bonti, Agustina; Vidal Leiva, Florencia Zoe; Bonti, Iván Federico; Tonelotto, Lucas FranciscoEn el panorama actual, las Búsquedas por Similitud emergen como un ámbito de profundo interés. La evaluación de la similitud entre objetos generalmente involucra el empleo de funciones métricas de distancia aplicadas a vectores que representan características extraídas a partir de los mismos. Este artículo se enfoca en la extracción de características aplicada a imágenes de logos de clubes, utilizando técnicas modernas de aprendizaje automático; en particular, Redes Neuronales Profundas Convolucionales (CNN), Redes Siamesas y Transfer Learning/Fine Tuning. Si bien estas técnicas son muy potentes, su aplicación conlleva en algunos casos el desafío del entrenamiento ante datos escasos (One Shot Learning, en este caso). En este estudio comparamos dos enfoques de extracción de características en el contexto de escasez de datos, proponemos un método eficaz de preprocesamiento, y evaluamos experimentalmente el rendimiento de ambos métodos aplicados a la búsqueda por similitud de logos.Item Inteligencia artificial en la búsqueda de imágenes(2023-09-28) Pascal, Andrés Jorge; Planas, Adrián Nicolás; Bonti, Agustina; Castiglioni, León; Stauber, Federico J.; Lederhos, Federico; Bonti, Iván Federico; Tonelotto, Lucas Francisco; López, Martín Rodrigo; Vidal Leiva, Florencia ZoePresentación en el marco de la semana de la ciencia del Grupo GBD sobre el uso de la IA en búsqueda de imágenes por similitud.Item Búsqueda por similitud de objetos no estructurados : rostros, pinturas, huellas digitales, cadenas de texto, logos, marcas, banderas, sonidos, texto, etc.(2023-09-28) Pascal, Andrés Jorge; Dutra, Francisco; Retamero, Marcos Sebastián; Silveyra, Gonzalo Nahuel; Suárez, Pablo; Olivera, Eduardo Maximiliano; Korell Benedetti, Agustín; Martinelli, Iara; Fernández, María Emilia; Davezac, Luciano EmmanuelBúsqueda de Reglamentación utilizando técnicas de Procesamiento del Lenguaje Natural en ISI.Item Extracción de características utilizando redes siamesas y aumentación aplicada a las búsquedas por similitud de marcas de ganado(2022-11-04) Pascal, Andrés Jorge; Herrera, Norma Edith; Planas, Adrián Nicolás; Lederhos, FedericoLas Búsquedas por Similitud constituyen un importante campo de estudio en el presente. Un ejemplo de su aplicación es la búsqueda de marcas de ganado, necesaria ante la solicitud de alta de una nueva marca al Departamento de Registro Ganadero. Para calcular su similitud, se suelen utilizar funciones de distancia métrica aplicadas a vectores de características extraídas a partir de su imagen. Existen varios métodos de extracción de características, a los cuales en la última década se le han sumado las Redes Neuronales Profundas Convolucionales (CNN). En este artículo se muestra el uso de una CNN entrenada mediante Redes Siamesas y con técnicas estándares de Aumentación de datos, a las cuales se le añade una técnica propia para mejorar la eficacia de la extracción de características aplicadas a las Búsquedas por Similitud de Marcas de Ganado. Además, se evalúa experimentalmente su performance.Item Determinación de relevancia de palabras para procesos con dominios restringidos(2022-11-03) Rosenbrock, Germán; Trossero, Sebastián; Alvarez, Claudia Mabel; Heit, Fernando; Pascal, Andrés Jorge; López De Luise, María DanielaEn este trabajo se propone un modelo basado en Minería de Textos para la determinación de relevancia que permita la extracción de palabras específicas de un dominio (Domain-Specific Word Extraction). El alcance de la presente propuesta se remite a determinar la importancia de las palabras en el ámbito de regulaciones universitarias, en base a corpus definidos específicamente para evaluar y validar este contexto restringido. Para esto, se emplean cuatro corpus, tres de ellos de dominios relacionados con regulaciones pero aplicados a otros fueros: Regulaciones Universitarias, Regulaciones Impositivas, Regulaciones del Código Civil y un corpus genérico. Se presentan y aplican tests estadísticos pertenecientes a la minería de textos para lenguaje español, y finalmente se comparan las palabras más relevantes del dominio de las regulaciones universitarias con un conjunto de palabras claves extraídas manualmente por especialistas, a fin de validar la propuesta.Item Uso estratégico de las infraestructuras de datos espaciales para la toma de decisiones en el ámbito universitario(2017-05) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Pascal, Andrés JorgeLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Indexación y búsqueda sobre datos no estructurados(Universidad Nacional del Nordeste, 2018-04-26) Herrera, Norma Edith; Ruano, Darío; Azar, Paola; De Battista, Anabella Cecilia; Pascal, Andrés JorgeLas bases de datos han incluido la capacidad de almacenar datos no estructurados tales como imágenes, sonido, texto, video, etc. La problemática de almacenamiento y búsqueda en estos tipos de base de datos difiere de las bases de datos clásicas,dado que no es posible organizarlos en registros y campos, y aun cuando pudiera hacerse, la búsqueda exacta carece de interés. Es en este contexto donde surgen nuevos modelos de bases de datos capaces de cubrir las necesidades de almacenamiento y búsqueda de estas aplicaciones. Nuestro interés se basa en el diseño de índices eficientes para estas nuevas bases de datos.