Determinación de relevancia de palabras para procesos con dominios restringidos

Abstract

En este trabajo se propone un modelo basado en Minería de Textos para la determinación de relevancia que permita la extracción de palabras específicas de un dominio (Domain-Specific Word Extraction). El alcance de la presente propuesta se remite a determinar la importancia de las palabras en el ámbito de regulaciones universitarias, en base a corpus definidos específicamente para evaluar y validar este contexto restringido. Para esto, se emplean cuatro corpus, tres de ellos de dominios relacionados con regulaciones pero aplicados a otros fueros: Regulaciones Universitarias, Regulaciones Impositivas, Regulaciones del Código Civil y un corpus genérico. Se presentan y aplican tests estadísticos pertenecientes a la minería de textos para lenguaje español, y finalmente se comparan las palabras más relevantes del dominio de las regulaciones universitarias con un conjunto de palabras claves extraídas manualmente por especialistas, a fin de validar la propuesta.

Description

Keywords

Minería de textos, Procesamiento de lenguaje natural, Regulaciones universitarias, Extracción de palabras

Citation

10 º Congreso Nacional de Ingeniería Informática / Sistemas de Información (2022)

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as openAccess