Verificación de autoría, clasificación por vecindad

Autores/as

  • Daniel Castro Desarrollo de Aplicaciones, Tecnología y Sistemas (DATYS)
  • Yaritza Adame Desarrollo de Aplicaciones, Tecnología y Sistemas (DATYS)
  • María Pelaez Desarrollo de Aplicaciones, Tecnología y Sistemas (DATYS)
  • Rafael Muñoz Universidad de Alicante, España, Departamento de Lenguajes y Sistemas Informáticos

DOI:

https://doi.org/10.13053/cys-21-2-2733

Palabras clave:

Análisis de autoría, verificación de autoría, funciones de comparación, rasgos lingüísticos

Resumen

El análisis de autoría se ha convertido en una herramienta determinante para el análisis de documentos digitales en las ciencias forenses. Proponemos un método de Verificación de Autoría mediante el análisis de las semejanzas entre documentos de un autor por vecindad, sin estimar umbrales a partir de un entrenamiento, implementamos dos estrategias de representación de los documentos de un autor, una basada en instancias y otra en el cálculo del centroide. Evaluamos colecciones según el número de muestras, los géneros textuales y el tema abordado. Realizamos un análisis del aporte de cada función de comparación y de cada rasgo empleado así como una combinación por mayoría de los votos de cada par función-rasgo empleado en la semejanza entre documentos. Las pruebas se realizaron usando las colecciones públicas de las competencias PAN 2014 y 2015. Los resultados obtenidos son prometedores y nos permiten evaluar nuestra propuesta y la identificación del trabajo futuro a desarrollar.

Descargas

Archivos adicionales

Publicado

2017-06-30