Estrategia de recomendación por similitud semántica en repositorios con grande volúmenes de datos de medición y evaluación
Resumen
La medición es una actividad común a diversas disciplinas, lo que permite
determinar el estado actual de un concepto bajo estudio. La evaluación consiste en
interpretar los valores medidos a la luz de ciertos criterios para poder concluir (o
estimar) sobre su estado. Por tal, el hecho de poder definir proyectos de medición y
evaluación es común a diferentes disciplinas, con las particularidades de cada campo de
aplicación.
Diversas alternativas se han propuesto para medir en forma remota diferentes
conceptos, desarrollando actividades de telemetría sobre ordenadores de placa única
(en inglés, Single Board Computers -SBC). El bajo costo y disponibilidad de sensores
relacionado con el Internet de las Cosas (IoC) ha permitido masificar la automatización
de procesos de medición con una aceptable relación costo-beneficio.
Sin embargo, IoC se caracteriza por la heterogeneidad de las fuentes de datos, y el
solo hecho de obtener un valor desde un sensor no aporta demasiado, salvo que exista
una lógica embebida en una aplicación o lo interprete una persona con conocimiento en
particular.
Por tal, los “framework” de medición y evaluación basados en ontologías permiten
incorporar conocimiento específico de los conceptos medidos, sus características, cómo
cuantificarlas e interpretarlas. En este sentido, el “framework” C-INCAMI (en inglés
Context - Information Need, Concepts, Attributes, Metrics, and Indicators) es un marco
conceptual con una ontología subyacente, la cual define los conceptos, términos y
relaciones necesarias para especificar un proceso de medición y evaluación (M&E). De
este modo y mediante su utilización, se logra un entendimiento común sobre el
concepto de lo que representa una entidad, su caracterización a través de atributos, la
cuantificación de atributos mediante métricas y la interpretación de los atributos a
través de indicadores con su correspondiente criterio de decisión asociados.
La ontología de CINCAMI fue extendida para incorporar la posibilidad de discriminar
estados de entidad y escenarios, para extender la definición de los criterios de decisión
y su interpretación en función del contexto. De este modo, la estrategia de
procesamiento del flujo de datos, es capaz de soportar definiciones de escenarios,
análisis de las transiciones en conjunto con la posibilidad de ajustar los criterios de
decisión de cada indicador a cada escenario en particular.
Basado en la ontología extendida, se extendió la estrategia GOCAME (Goal -
Oriented Context-aware Measurement and Evaluation) derivando en GOCAME -ESVI
(Gocame-Entity States, Scenarios, and Visualization Guidelines). La misma permite
definir consistentemente un proyecto de medición, especificándolo en un archivo auto contenido, factible de ser intercambiado entre diferentes SBC para su interpretación y
emparejamiento con los sensores. Un componente software denominado adaptador de
mediciones (localizado en SBC o dispositivos móviles) es responsable de emparejar la
definición de proyectos con los sensores. De este modo, cada sensor tiene asociación
con una métrica directa en el proyecto, y por ende sus medidas serán procesadas en
consecuencia.
Al momento de procesar e interpretar las medidas de múltiples métricas guiado por
sus metadatos (ejemplo, el ID de cada una), un índice de similitud compuesto permite
identificar recomendaciones similares, incluso cuando el proyecto no las posea. Basado
en la ontología C-INCAMI extendida, se propuso un índice que evalúa la similitud
estructural y comportamental de entidades bajo monitoreo y su contexto a partir de la
definición del proyecto de medición y su flujo de medidas. Esto permite proveer
recomendaciones ante situaciones similares a la actual aun cuando no se cuente con
conocimiento específico.
Un esquema de interpretación basado en criterios de decisión soportado por
escenario y estados de entidad, es autocontenido en BriefPD. Dado que las fuentes de
datos son distribuidas por naturaleza, se planteó una articulación basada en
microservicios y arquitectura blockchain para soportar transmisiones indirectas y
recomendaciones in-situ.
Complementariamente, se aprovecha la extensión de la ontología de medición para
incorporar controles de integridad de datos basados en Merkle Tree a los efectos de
poder determinar el origen de los mismos (sin necesidad de que dispositivos de
capacidades limitadas deban almacenar los datos transmitidos).
De este modo, se ha logrado integrar en la Arquitectura de Procesamiento basada
en Metadatos de Mediciones (en inglés Processing Architecture based on Measurement
Metadata - PAbMM), desde la captación de los datos hasta el esquema de
recomendación. PAbMM es un motor de procesamiento de flujos de mediciones basada
en topologías de Apache Storm, que está especializada en el monitoreo de entidades
(físicas o no) en proyectos de medición y evaluación basados en C-INCAMI extendido.
Aquí se ha extendido la ontología original (por ejemplo, incorporando escenarios y
estados de entidad) y por ende actualizado la arquitectura en consecuencia.
Así, aquí se introduce una estrategia que permite brindar recomendaciones en
tiempo real ante situaciones tipificadas basado en los criterios de decisión de los
indicadores y en las entidades monitoreadas
El ítem tiene asociados los siguientes ficheros de licencia: