Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
Palabras clave:
Multi-etiqueta, clasificación de textos, representación de textos, transformación del problema, ponderación de términosResumen
La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas de las organizaciones. La clasificación automática de textos es la tarea de clasificar documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática, ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de texto por multi-etiquetados ha sido típicamente abordada por medio de métodos de clasificación de etiqueta simple, por medio de transformar el problema estudiado para aplicar técnicas binarias, o al adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este paper evaluamos un factor de ponderación de términos en el modelo booleano para representación de texto en clasificación multi-etiqueta usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. El rendimiento fue testeado con cuatro conocidas conjuntos de datos y comparado con técnicas alternativas en términos de tres medidas de evaluación bien conocidas. Resultados experimentales muestras mejoras en todos los casos.Archivos adicionales
Publicado
2020-12-01
Cómo citar
Alfaro Arancibia, R. M., & Allende O., H. (2020). Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta. Revista Signos. Estudios De Lingüística, 53(104). Recuperado a partir de https://revistasignos.cl/index.php/signos/article/view/63
Número
Sección
Artículos
Licencia
Aquellos autores que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra por medio de este documento de cesión de derechos de autoría, el cuál estará simultáneamente sujeto a la licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un repositorio institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores difundir su obra a través de Internet (p. ej.: en publicaciones institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase el efecto del acceso abierto).