Browsing by Author "Schab, Esteban Alejandro"
Now showing 1 - 20 of 21
- Results Per Page
- Sort Options
Item Adecuación de una propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de ciencia de datos(2018-11-30) Cristaldo, Patricia Raquel; Schab, Esteban Alejandro; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; De Battista, Anabella Cecilia; Retamar, María Soledad; Herrera, Norma EdithLa aplicación de metodologías de gestión de proyectos conlleva a contribuir con los factores de éxito en la gestión de los mismos. Esta propuesta se deriva de un trabajo anterior y considera los aspectos relevantes de la gestión tradicional y ágil, permitiendo la alineación de los objetivos de un proyecto de ciencia de datos con los resultados del mismo. Este trabajo presenta la adecuación y posterior validación de una propuesta metodológica de enfoque “híbrido” a un proyecto de ciencia de datos, considerando el cumplimiento de los factores de éxito afectados a este tipo de proyectos.Item Aplicación de inteligencia computacional y computación de alto desempeño en el desarrollo de un modelo de predicción de las condiciones predisponentes al quemado del arroz (Pyricularia oryzae)(Red de Universidades con Carreras en Informática, 2023-04-13) Asselborn, Miriam; Escalante, Julián; Lopresti, Olga Mariela; Miranda, Natalia Carolina; Schab, Esteban Alejandro; Cedaro, Karina Elizabeth; Fontanini, Pablo; Martínez, Malvina; Casanova Pietroboni, Carlos Antonio; Pedraza, María Virginia; Piccoli, María FabianaUn sistema complejo o crítico con toma de decisiones se caracteriza por la imposibilidad de reproducir para su estudio un escenario sin consecuencias reales, o cuando su resolución implica gran cantidad de recursos para obtener resultados en un tiempo prudencial. La complejidad puede darse por las características del problema o por la cantidad de datos con los que se trabaja. Tomar decisiones en estos contextos debe conjugar dos atributos usualmente contrapuestos: calidad y velocidad. En este trabajo proponemos una línea de investigación enfocada en analíticas, principalmente las prescriptivas, capaces de determinar acciones a ser ejecutadas en el momento (decisiones operativas) o en el futuro (decisiones tácticas: corto y mediano plazo, decisiones estratégicas: largo plazo) para lograr un objetivo deseado. A esta línea se suman investigaciones en Inteligencia Computacional y Computación de Alto Desempeño con el fin de obtener, de forma colaborativa, calidad y velocidad en las decisiones.Item Aproximación del frente pareto-óptimo de un problema NRP bi-objetivo mediante un algoritmo basado en enjambres de partículas(2018-10-26) Rottoli, Giovanni Daián; Schab, Esteban Alejandro; De Battista, Anabella Cecilia; Tournoud, Adrián Alberto; Bracco, Luciano Joaquín; Pereyra Rausch, Fernando Nahuel; Casanova Pietroboni, Carlos AntonioEn este trabajo se presenta un método novedoso basado en Enjambres de Partículas para la aproximación del frente Pareto-óptimo de un problema de optimización bi-objetivo, el problema del Next Release (NRP). Se define el problema en sus versiones mono y bi-objetivo, presentando una representación con Programación Lineal Entera. El método utiliza la teoría de Conjuntos Difusos para componer una función abstracta de aptitud, la cual es especializada por distintas partículas para realizar la búsqueda en distintos lugares del frente. Se realiza una prueba de concepto, aplicando el método a una instancia del problema y se compara con otra metaheurística del estado del arte. Finalmente, se concluye resaltando los resultados más importantes.Item Desarrollo de aplicación para la recolección de tweets para proyecto de agenda setting(2018-11-30) Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; Ramos, Lautaro Martín Miguel; Cristaldo, Patricia Raquel; Retamar, María Soledad; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma EdithLa Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos logran o no instalar temáticas en usuarios de redes sociales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.Item Descubrimiento de conocimiento en bases de datos(Universidad Nacional de San Juan, 2019-04-26) Ramos, Lautaro Martín Miguel; Rivera, Ramiro Adolfo; Richard, Cristhian Pablo; Cristaldo, Patricia Raquel; Nuñez, Juan Pablo; Rottoli, Giovanni Daián; Ríos, Juan Manuel; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Cagnina, Leticia; Herrera, Norma Edith; Schab, Esteban AlejandroEn la actualidad se generan diariamente grandes cantidades de datos de diversos tipos (e.g. textos, imágenes, audios y videos) generando nuevas fuentes de información que pueden ser aprovechadas para agregar valor al trabajo de las organizaciones. Particularmente el análisis automático de textos (análisis de sentimientos, minería de opinión) ha ganado terreno como alternativa o complemento a las fuentes de datos tradicionales de información de las organizaciones, cobrando relevancia las técnicas de Minería de Textos. La mayoría de los algoritmos, herramientas y recursos disponibles para Minería de Textos han sido probados y/o desarrollados para el idioma inglés, y por tanto presentan dificultades al ser empleados sobre textos escritos en otros idiomas como el español. Es por esta razón que es necesario trabajar en la elaboración de recursos específicos y en la adaptación de algoritmos y herramientas que contemplen las particularidades del idioma español con el fin de poder conseguir resultados de mayor calidad. En este artículo se presentan los tópicos de interés del proyecto Descubrimiento de Conocimiento en Bases de Datos, en el que se investigan técnicas de minería de textos aplicables al procesamiento de textos en lenguaje español. En particular, se realizará el estudio, análisis y comparación de algoritmos de minería de textos utilizando corpus de textos en lenguaje español, para posteriormente proponer adaptaciones o mejoras a los mismos. Asimismo, se pretende evaluar el desempeño de técnicas de minería de datos sobre conjuntos de datos tradicionales complementados con información extraída a partir de textos relacionados.Item Diseño de aplicación para visualización de tópicos de noticias sobre COVID-19 en lenguaje español(Universidad Tecnológica Nacional, 2020-11-05) La Pietra, Lucas Ezequiel; Schab, Esteban Alejandro; Cristaldo, Patricia Raquel; De Battista, Anabella CeciliaLa evolución de la pandemia de COVID-19 ha tenido gran repercusión en medios periodísticos, en particular en diarios digitales. Las noticias publicadas por los mismos cubren diferentes aspectos relacionados con la evolución de casos y sus diferentes impactos. En este trabajo se presenta la aplicación de técnicas de procesamiento de lenguaje natural para la detección automática de los tópicos principales abordados por medios digitales, y la generación de una aplicación web que permite visualizar los resultados obtenidos en el proceso de topic modeling.Item Enfoques de optimización multi-objetivo basados en preferencias en la ingeniería de software(2018-07-03) Arrúa, Martín Nahuel; Bracco, Luciano Joaquín; Rottoli, Giovanni Daián; Schab, Esteban Alejandro; Tournoud, Adrián Alberto; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella CeciliaLa Ingeniería de Software Basada en Búsqueda (ISBB) estudia la aplicación de técnicas de optimización metaheurística a problemas de la Ingeniería de Software (IS). Una vez que una tarea de la IS se enmarca en un problema de búsqueda existen multitud de algoritmos que pueden aplicarse para resolver ese problema. La mayoría del trabajo existente trata a los problemas de la IS desde un punto de vista mono-objetivo. Sin embargo, muchos de estos problemas poseen múltiples objetivos en conflicto que deben ser optimizados. El número de objetivos a considerar es, en general, alto (esto es, más de tres objetivos). Si bien la comunidad científica ha propuesto varios enfoques de solución para atacar la optimización multi-objetivo, muchos de estos enfoques nos se han aplicado aún en la ISBB. Uno de estos enfoques es el llamado “basado en preferencias”, el cual permite incorporar las preferencias entre los objetivos del tomador de decisiones, restringiendo el frente Paretoóptimo a una zona de interés específica, facilitando de esta manera la tarea de tomar una decisión.Item Exploración a posteriori basada en clustering del frente pareto- óptimo aplicado al problema del próximo lanzamiento(2019-11-15) Rottoli, Giovanni Daián; Casanova Pietroboni, Carlos Antonio; Schab, Esteban Alejandro; De Battista, Anabella CeciliaLa ingeniería de software basada en búsqueda propone la formulación de problemas de la ingeniería de software como problemas de optimización, generalmente con múltiples objetivos. Para estos problemas existen múltiples soluciones que deben ser analizadas por los tomadores de decisiones para seleccionar aquella que más se adecúe a sus necesidades, pudiendo este no tener preferencias previas sobre la mejor solución a ser seleccionada. Para ello, este artículo propone un acercamiento basado en agrupamiento que permite la exploración a posteriori del espacio de soluciones, describiendo las mismas no solo utilizando el valor de sus objetivos, sino también la configuración de los elementos que conforman las mismas. Se presenta una prueba de concepto del método propuesto utilizando el frente Pareto Óptimo solución de una instancia del Problema del Próximo Lanzamiento.Item Fuzzy bi-objective particle swarm optimization for next release poblem(2019-07-10) Casanova Pietroboni, Carlos Antonio; Rottoli, Giovanni Daián; Schab, Esteban Alejandro; Bracco, Luciano Joaquín; Pereyra Rausch, Fernando Nahuel; De Battista, Anabella CeciliaIn search-based software engineering (SBSE), software engineers usually have to select one among many quasi-optimal solutions with different values for the objectives of interest for a particular problem domain. Because of this, a metaheuristic algorithm is needed to explore a larger extension of the Pareto optimal front to provide a bigger set of possible solutions. In this regard the Fuzzy Multi-Objective Particle Swarm Optimization (FMOPSO), a novel a posteriori algorithm, is proposed in this paper and compared with other state-of-the-art algorithms. The results show that FMOPSO is adequate for finding very detailed Pareto Fronts.Item Graph representations for reinforcement learning(Universidad Nacional de La Plata. Facultad de Informática., 2024-04) Schab, Esteban Alejandro; Casanova Pietroboni, Carlos Antonio; Piccoli, María FabianaGraph analysis is becoming increasingly important due to the expressive power of graph models and the efficient algorithms available for processing them. Reinforcement Learning is one domain that could ben- efit from advancements in graph analysis, given that a learning agent may be integrated into an environ- ment that can be represented as a graph. Nevertheless, the structural irregularity of graphs and the lack of prior labels make it difficult to integrate such a model into modern Reinforcement Learning frameworks that rely on artificial neural networks. Graph embedding enables the learning of low-dimensional vector representations that are more suited for machine learning algorithms, while retaining essential graph features. This paper presents a framework for evaluating graph embedding algorithms and their ability to preserve the structure and relevant features of graphs by means of an internal validation metric, without resorting to subsequent tasks that require labels for training. Based on this framework, three defined algorithms that meet the necessary requirements for solving a specific problem of Reinforcement Learningin graphs are selected, analyzed, and compared. These algorithms are Graph2Vec, GL2Vec, and Wavelet Characteristics, with the latter two demonstrating superior performance.Item Hierarchical clustering-based framework for a posteriori exploration of pareto fronts : application on the bi-objective next release problem(Hector Florez, Universidad Distrital Francisco Jose de Caldas, Colombia., 2023-05-24) Casanova Pietroboni, Carlos Antonio; Schab, Esteban Alejandro; Prado, Lucas Martín; Rottoli, Giovani DaianWhen solving multi-objective combinatorial optimization problems using a search algorithm without a priori information, the result is a Pareto front. Selecting a solution from it is a laborious task if the number of solutions to be analyzed is large. This task would benefit from a systematic approach that facilitates the analysis, comparison and selection of a solution or a group of solutions based on the preferences of the decision makers. In the last decade, the research and development of algorithms for solving multi-objective combinatorial optimization problems has been growing steadily. In contrast, efforts in the a posteriori exploration of non-dominated solutions are still scarce.Item Implementación de data stream mining(2018-09) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Ríos, Juan Manuel; Casanova Pietroboni, Carlos Antonio; Cristaldo, Patricia Raquel; De Battista, Anabella Cecilia; Herrera, Norma EdithDesde hace décadas las organizaciones utilizan información histórica propia para construir data warehouses y, mediante la aplicación de técnicas de descubrimiento de conocimiento, descubrir patrones que guíen la toma de decisiones.Actualmente, es una oportunidad para las organizaciones tomar decisiones en tiempo real basadas en información que puede provenir de múltiples fuentes, con diversos formatos y que se genera a gran velocidad. Como respuesta a esta necesidad surge Data Stream Mining (DSM), un subárea específica de la Minería de Datos definida como el proceso de extraer conocimiento en estructuras de datos continuas y con rápidas transiciones. Dicho análisis aporta a las organizaciones visibilidad del negocio y de sus clientes en tiempo real y les permite responder ágilmente ante los cambios. En este trabajo se presenta la vinculación del GIBD de la UTN-FRCU con la empresa Sidesys IT Solutions con el objetivo de implementar Data Stream Mining en la empresa.Item Jornada CyT 28-9-2023 : reconocimiento GUI y ACO"(2023-09-28) Casanova Pietroboni, Carlos Antonio; Schab, Esteban Alejandro; Prado, Lucas Martín; Rottoli, Giovanni Daián; Hoet, Leonardo Alfonso; Forni, Lucas; Grandi, Tobías Andrés; Chichi, Manuel; Pereyra Rausch, Fernando NahuelPresentación en el marco de la semana de la ciencia del Grupo GIICIS sobre las líneas de investigación del grupo.Item Minería de datos y visualización de información(2018-11-29) Schab, Esteban Alejandro; Rivera, Ramiro Adolfo; Bracco, Luciano Joaquín; Coto, Facundo; Cristaldo, Patricia Raquel; Ramos, Lautaro Martín Miguel; Rapesta, Natalia Daniela; Nuñez, Juan Pablo; Retamar, María Soledad; Casanova Pietroboni, Carlos Antonio; De Battista, Anabella Cecilia; Herrera, Norma EdithEl procesamiento y análisis de las grandes cantidades de datos que se producen en la actualidad, posibilitan el hallazgo de patrones y tendencias ocultos en los mismos, que impacta directamente en la toma de decisiones en diversas áreas de estudios. Se generan datos a gran velocidad y en grandes cantidades que requieren ser procesados para poder actuar de manera rápida. Como es el caso de la observación de turnos que se generan en entidades bancarias, donde hay momentos del día en que se requiere modificar los esquemas de atención, según la afluencia de determinadas categorías de clientes o el incremento de demandas de determinados servicios. Existen numerosas técnicas de minería de datos aplicables a distintos casos de análisis de datos, que permiten obtener ventajas de esas grandes cantidades de datos almacenados. En este artículo se presentan los tópicos de interés del proyecto Minería de Datos: su aplicación a repositorios de datos masivos, en el que se investigan tanto temas de minería de datos, como de visualización de información, como herramienta para representar de manera eficiente los resultados obtenidos.Item Modelo prescriptivo dinámico para un sistema de eventos complejo(Red de Universidades con Carreras en Informática, 2021-04-15) Schab, Esteban Alejandro; Casanova Pietroboni, Carlos Antonio; Piccoli, María FabianaLa toma de decisiones en contextos dominados por grandes volúmenes de datos debe conjugar dos atributos usualmente contrapuestos: calidad y velocidad. La disponibilidad de información generada por personas y dispositivos abre nuevos desafíos en el diseño de mecanismos que puedan aprovecharla, de tal manera de que sean capaces de determinar las decisiones de mayor utilidad sujetas a ventanas temporales que garanticen su factibilidad. Uno de estos mecanismos lo constituyen las analíticas en sus distintos tipos, las cuales buscan transformar los datos en información a través de técnicas diversas. En este trabajo proponemos una línea de investigación enfocada en la analítica prescriptiva, capaz de determinar acciones a ser ejecutadas en el momento (decisiones operativas) o en el futuro (decisiones tácticas para corto y mediano plazo, decisiones estratégicas para largo plazo) para lograr un objetivo deseado. Para componerlas se propone la utilización de desarrollos provenientes de la Inteligencia Computacional y de la Computación de Alto Desempeño con el fin de obtener, de forma colaborativa, calidad y velocidad en las decisiones.Item Optimización multiobjetivo basada en preferencias para problemas de la ingeniería de software(Universidad Nacional de San Juan, 2019-04-25) Casanova Pietroboni, Carlos Antonio; Arrúa, Martín Nahuel; Bracco, Luciano Joaquín; Pereyra Rausch, Fernando Nahuel; Rottoli, Giovanni Daián; Schab, Esteban Alejandro; Tournoud, Adrián Alberto; De Battista, Anabella CeciliaLa Ingeniería de Software Basada en Búsqueda (ISBB) se sustenta en la aplicación de técnicas de optimización heurística para resolver problemas de la Ingeniería de Software (IS). Las tarea de la IS se enmarcan en un problema de búsqueda, con lo cual es posible utilizar multitud de algoritmos para resolverlos. En su mayoría, los trabajos existentes tratan a los problemas de la IS desde un punto de vista mono-objetivo. Sin embargo, muchos de estos problemas poseen múltiples objetivos en conflicto que deben ser optimizados de forma simultánea. Si bien la comunidad científica ha propuesto varios enfoques de solución para atacar la optimización multi-objetivo, muchos de estos enfoques no se han aplicado aún en la ISBB. Uno de estos enfoques es el llamado “basado en preferencias”, el cual permite capturar e incorporar las preferencias entre los objetivos del tomador de decisiones, de manera de poder restringir el frente Pareto-óptimo a una zona de interés específica, con el objetivo de facilitar la tarea de tomar una decisión.Item Optimización multiobjetivo difusa mediante enjambre de partículas aplicada al problema del próximo lanzamiento(2019-05-02) Casanova Pietroboni, Carlos Antonio; Rottoli, Giovanni Daián; Schab, Esteban Alejandro; De Battista, Anabella Cecilia; Tournoud, Adrián Alberto; Bracco, Luciano Joaquín; Pereyra Rausch, Fernando NahuelEn este trabajo se presenta un método novedoso basado en Enjambres de Partículas y Lógica Difusa para optimización multiobjetivo: el FMOPSO (Fuzzy Multi-Objective Particle Swarm Optimization). Este método se presenta en el contexto de la resolución de un problema clásico de la Ingeniería de Software Basada en Búsqueda: el Problema del Próximo Lanzamiento (Next Release Problem). Se realiza una prueba de concepto aplicando este algoritmo a una instancia bi-objetivo del problema mencionado anteriormente, y se lo compara con otra metaheurística del estado del arte. Finalmente, se concluye resaltando los resultados más importantes.Item Propuesta metodológica de enfoque “híbrido” para la gestión de proyectos de minería de datos(2018-10-25) Cristaldo, Patricia Raquel; Richard, Cristhian Pablo; Rivera, Ramiro Adolfo; Schab, Esteban Alejandro; De Battista, Anabella Cecilia; Herrera, Norma EdithEste trabajo propone una metodologia de enfoque “híbrido” para la gestión de proyectos de minería de datos, enmarcada en los aspectos relevantes de la gestión tradicional y ágil, que toma como punto de partida los factores críticos de éxito de la gestión de proyectos de minería de datos y de la gestión ágil de proyectos, de forma tal de lograr un conjunto unificado de criterios que debería cumplir una metodologia de gestión de proyectos en este entorno. Se especifican los criterios para orientar las decisiones, las etapas definidas en la metodologia, los resultados obtenidos y las conclusiones alcanzadasItem Toma de decisiones científica en la ingeniería de software mediante inteligenica computacional y análisis de datos(Red de Universidades con Carreras en Informática, 2021-04) Casanova Pietroboni, Carlos Antonio; Chichi, Manuel; Hoet, Leonardo Alfonso; Pereyra Rausch, Fernando Nahuel; Prado, Lucas Martín; Rottoli, Giovani Daián; Schab, Esteban Alejandro; De Battista, Anabella CeciliaLa adopción de herramientas formales que complementen la experiencia y el buen juicio en las distintas actividades de un proceso de desarrollo de software todavía es un pendiente dentro la industria del software. La falta de conocimientos respecto de enfoques realistas para resolver problemas de la IS y la falta de herramientas software que auxilien a los tomadores de decisiones utilizando tales enfoques son dos carencias que pueden explicar las dificultades en esta adopción. Las líneas de investigación aquí propuestas tienden a suplir ambas. Para esta tarea se propone la utilización de tanto técnicas comprendidas en lo que se conoce como Inteligencia Computacional (IC), dentro de las cuales se encuentran la teoría de conjuntos difusos, las redes neuronales y la computación evolutiva, como también de herramientas de la Ciencia de Datos, incluyendo técnicas de aprendizaje automático, estadísticas y visualización de datos, entre otros. Estas técnicas son capaces de brindar la flexibilidad necesaria para crear métodos y modelos que sean tolerantes a la imprecisión, la falta de información y la aproximación, características que le son propias a los contextos de decisión en la IS.Item Toma de decisiones en sistemas de eventos mediante inteligencia computacional y computación de alto desempeño(Red de Universidades con Carreras en Informática, 2022-04) Schab, Esteban Alejandro; Lopresti, Olga Mariela; Miranda , Natalia Carolina; Casanova Pietroboni, Carlos Antonio; Piccoli, María FabianaLa toma de decisiones en contextos dominados por grandes volúmenes de datos debe conjugar dos atributos usualmente contrapuestos: calidad y velocidad. La disponibilidad de información generada por personas y dispositivos abre nuevos desafíos en el diseño de mecanismos para aprovecharla. Estos deben ser capaces de determinar las decisiones de mayor utilidad sujetas a ventanas temporales que garanticen su factibilidad. Uno de estos mecanismos lo constituyen las distintas analíticas, las cuales buscan transformar los datos en información a través de técnicas diversas. En este trabajo proponemos dos líneas de investigación, una enfocada en la analítica prescriptiva, capaz de determinar acciones a ser ejecutadas en el momento (decisiones operativas) o en el futuro (decisiones tácticas para corto y mediano plazo, decisiones estratégicas para largo plazo) para lograr un objetivo deseado; la otra relacionada con las técnicas de aprendizaje supervisado y la recuperación de información no estructurada. En ambos, se propone la utilización de desarrollos provenientes de la Inteligencia Computacional y de la Computación de Alto Desempeño con el fin de obtener, de forma colaborativa, calidad y velocidad en las decisiones.