Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
Keywords:
Multi-etiqueta, clasificación de textos, representación de textos, transformación del problema, ponderación de términosAbstract
La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas de las organizaciones. La clasificación automática de textos es la tarea de clasificar documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática, ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de texto por multi-etiquetados ha sido típicamente abordada por medio de métodos de clasificación de etiqueta simple, por medio de transformar el problema estudiado para aplicar técnicas binarias, o al adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este paper evaluamos un factor de ponderación de términos en el modelo booleano para representación de texto en clasificación multi-etiqueta usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. El rendimiento fue testeado con cuatro conocidas conjuntos de datos y comparado con técnicas alternativas en términos de tres medidas de evaluación bien conocidas. Resultados experimentales muestras mejoras en todos los casos.Downloads
Additional Files
Published
How to Cite
Issue
Section
License
Copyright agreement:
Authors who have a manuscript accepted for publication in this journal agree to the following terms:
Authors will retain their copyright and grant the journal the right of first publication of their work by means of this copyright agreement document, which is subject to the Creative Commons Acknowledgment License that allows third parties to share the work provided that its author and first publication in this journal are indicated.
Authors may adopt other non-exclusive license agreements for distribution of the published version of the work (e.g., depositing it in an institutional repository or publishing it in a monographic volume) as long as the initial publication in this journal is indicated.
Authors are allowed and encouraged to disseminate their work via the internet (e.g., in institutional publications or on their website) before and during the submission process, which can lead to interesting exchanges and increase citations of the published work (read more here).