FRCU - GIBD : Grupo de Investigación en Bases de Datos
Permanent URI for this communityhttp://48.217.138.120/handle/20.500.12272/774
Browse
31 results
Search Results
Item Técnicas de análisis de sentimientos aplicadas a la valoración de opiniones en el lenguaje español(2021-10-08) Rosenbrock, Germán; Trossero, Sebastián; Pascal, Andrés JorgeEn el presente existen grandes cantidades de datos en formato de texto escritos en el lenguaje natural, disponibles principalmente en sitios web y redes sociales, que crece día a día. El análisis manual de estos volúmenes de información es actualmente impráctico y costoso, por lo cual se hace necesario el uso de técnicas automatizadas para su procesamiento y análisis. La Minería de Opinión o Análisis de Sentimientos estudia la extracción de información a partir de datos subjetivos y es relativamente reciente. En los últimos años se han propuesto varios modelos de procesamiento del lenguaje natural para resolver el problema particular de clasificación de sentimientos. En este trabajo examinamos el rendimiento de varios de estos modelos aplicados a un caso donde los textos están escritos en el lenguaje castellano coloquial, lo que representa un desafío adicional. El caso propuesto es un conjunto de más de 50.000 reseñas de películas, extraídas del sitio www.cinesargentinos.com.ar.Item Extracción de características utilizando redes siamesas y aumentación aplicada a las búsquedas por similitud de marcas de ganado(2022-11-04) Pascal, Andrés Jorge; Herrera, Norma Edith; Planas, Adrián Nicolás; Lederhos, FedericoLas Búsquedas por Similitud constituyen un importante campo de estudio en el presente. Un ejemplo de su aplicación es la búsqueda de marcas de ganado, necesaria ante la solicitud de alta de una nueva marca al Departamento de Registro Ganadero. Para calcular su similitud, se suelen utilizar funciones de distancia métrica aplicadas a vectores de características extraídas a partir de su imagen. Existen varios métodos de extracción de características, a los cuales en la última década se le han sumado las Redes Neuronales Profundas Convolucionales (CNN). En este artículo se muestra el uso de una CNN entrenada mediante Redes Siamesas y con técnicas estándares de Aumentación de datos, a las cuales se le añade una técnica propia para mejorar la eficacia de la extracción de características aplicadas a las Búsquedas por Similitud de Marcas de Ganado. Además, se evalúa experimentalmente su performance.Item Determinación de relevancia de palabras para procesos con dominios restringidos(2022-11-03) Rosenbrock, Germán; Trossero, Sebastián; Alvarez, Claudia Mabel; Heit, Fernando; Pascal, Andrés Jorge; López De Luise, María DanielaEn este trabajo se propone un modelo basado en Minería de Textos para la determinación de relevancia que permita la extracción de palabras específicas de un dominio (Domain-Specific Word Extraction). El alcance de la presente propuesta se remite a determinar la importancia de las palabras en el ámbito de regulaciones universitarias, en base a corpus definidos específicamente para evaluar y validar este contexto restringido. Para esto, se emplean cuatro corpus, tres de ellos de dominios relacionados con regulaciones pero aplicados a otros fueros: Regulaciones Universitarias, Regulaciones Impositivas, Regulaciones del Código Civil y un corpus genérico. Se presentan y aplican tests estadísticos pertenecientes a la minería de textos para lenguaje español, y finalmente se comparan las palabras más relevantes del dominio de las regulaciones universitarias con un conjunto de palabras claves extraídas manualmente por especialistas, a fin de validar la propuesta.Item Uso estratégico de las infraestructuras de datos espaciales para la toma de decisiones en el ámbito universitario(2017-05) De Battista, Anabella Cecilia; Nuñez, Juan Pablo; Retamar, María Soledad; Herrera, Norma Edith; Pascal, Andrés JorgeLa necesidad de contar con Información Geográfica para la mayoría de las actividades humanas ha derivado en la realización de innumerables esfuerzos para su captura, almacenamiento, tratamiento, análisis y visualización. El advenimiento de los Sistemas de Información Geográfica facilitó su gestión y la necesidad de compartirla favoreció el desarrollo de estándares, políticas y herramientas para su publicación en la web, dando lugar al surgimiento de las Infraestructuras de Datos Espaciales. En este trabajo se presenta la instalación de un Servidor de Mapas Interactivo con dos objetivos principales: formular una iniciativa para la futura participación en la IDE de la provincia de Entre Ríos y democratizar la información geográfica generada en organismos públicos a fin de evitar la duplicación de esfuerzos.Item Indexación y búsqueda sobre datos no estructurados(Universidad Nacional del Nordeste, 2018-04-26) Herrera, Norma Edith; Ruano, Darío; Azar, Paola; De Battista, Anabella Cecilia; Pascal, Andrés JorgeLas bases de datos han incluido la capacidad de almacenar datos no estructurados tales como imágenes, sonido, texto, video, etc. La problemática de almacenamiento y búsqueda en estos tipos de base de datos difiere de las bases de datos clásicas,dado que no es posible organizarlos en registros y campos, y aun cuando pudiera hacerse, la búsqueda exacta carece de interés. Es en este contexto donde surgen nuevos modelos de bases de datos capaces de cubrir las necesidades de almacenamiento y búsqueda de estas aplicaciones. Nuestro interés se basa en el diseño de índices eficientes para estas nuevas bases de datos.Item Intelligent chatter bot for regulation search(2016) López De Luise, María Daniela; Pascal, Andrés Jorge; Malgor, Rafael; Saad Correa, Ben Raúl; Pescio, Pablo; Carrilero, PatricioThis communication presents a functional prototype implementing a linguistic model focused on regulations in Spanish. Its global architecture, the reasoning model and short statistics are provided for the prototype named PTAH. It mainly has a conversational robot linked to an Expert System by a module with many intelligent linguistic filters, implementing the reasoning model of an expert. It is focused in bylaws, regulations, jurisprudence and customized background representing entity mission, vision and profile. This Structure and model are generic enough to self-adapt to any regulatory environment, but as a first step, it was limited to academic field. This way it is possible to limit the slang and data number. The foundations of the linguistic model are also outlined and the way the architecture implements the key features of the behavior.Item Geocodificación de comercios, industrias y profesionales del Municipio de Urdinarrain(Universidad Nacional del Nordeste. Facultad de Ciencias Exactas, 2016-11-05) Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithAn Geographic Information System (GIS) allows to capture, store, manipulate , analyze and display geographically referenced information to solve complex problems of planning and management. As part of a study of commercial, industrial and professional sectors of the city of Urdinarrain, Entre Rios, modeling and implementation of a GIS is proposed to represent the spatial distribution of these sectors. It was necessary to develop a method of geocoding of data collected and an application that allows modification and the incorporation of new elements automating its geocoding. While there are generic methods geocoding, given the complexity of the problem and the lack of updated maps, we had to design a specific method for the case. This paper present the geocoding solution we are design.Item Búsqueda por similitud de marcas de ganado vacuno(Universidad Nacional del Nordeste. Facultad de Ciencias Exactas y Naturales y Agrimensura., 2016-11-04) Pascal, Andrés Jorge; Romani, Rita Marisa; Michel, Lucrecia AnalíaSimilarity searching is an important field of study in the present days. An example of its application is the process of seeking cattle brands that is required during the registration of a trademark. In the present article, a method of similarity searching of cattle brands is presented. This method uses a variation of the Hausdorff distance that improve the precision of the resultsItem Búsqueda por similitud de posiciones de ajedrez(Universidad Nacional de San Luis. Red de Universidades con Carreras en Informática., 2016-10-03) González, Diego; Pascal, Andrés Jorge; De Battista, Anabella Cecilia; Herrera, Norma EdithLas búsquedas por similitud constituyen un campo de estudio de gran importancia en la actualidad. En el presente trabajo se propone una función distancia para consultar por similitud posiciones de ajedrez sobre bases de datos de partidas, ya que actualmente estas consultas están limitadas a búsquedas exactas. Se evalúa su comportamiento mediante distintos tipos de pruebas sobre las fases del juego.Item Chatterbot inteligente para asesoramiento jurídico(2016-06-15) López De Luise, María Daniela; Carrilero, Patricio; Pascal, Andrés Jorge; Malgor, Rafael; Alvarez, Claudia Mabel; Díaz, Joaquín; Pescio, Pablo; Saad Correa, Ben RaúlThis paper presents the first results of a functional prototype implementing a linguistic model focused on regulations in Spanish. Its global architecture, the reasoning model, a case-study and short statistics are provided for the prototype named PTAH. It mainly has a conversational robot linked to an Expert System by a module with many intelligent linguistic filters, implementing the reasoning model of an expert. It is focused in bylaws, regulations, jurisprudence and customized background representing entity mission, vision and profile. This structure and model are generic enough to self adapt to any regulatory environment, but as a first step, it was limited to academic field. This way it is possible to limit the slang and data number. The foundations of the linguistic model and the way the architecture implements the key features of the behavior, are also outlined. The cases presented are a few just to show the usability, flexibility and prospectives of this proposal.