Detección de destacados eventos en un corpus grande combinando técnicas para PLN y minería de datos

Autores/as

  • Delphine Battistelli STIH, Université Paris Sorbonne, France
  • Thierry Charnois GREYC, Université de Caen, France MoDyCo, UMR 7114, Université Paris Ouest Nanterre La Défense, France
  • Jean Luc Minel GREYC, Université de Caen, France
  • Charles Teissèdre STIH, Université Paris Sorbonne, France

DOI:

https://doi.org/10.13053/cys-17-2-1527

Palabras clave:

Fechas, adverbiales temporales, extracción de eventos, patrón secuencial.

Resumen

En este trabajo se presenta el marco y el sistema para extracción de los eventos "destacados" relevantes a una pregunta de una gran colección de documentos, el cual también permite ubicar los eventos a lo largo de la línea de tiempo. Cada evento se representa por una frase extraída de la colección. Se han realizado unos experimentos que muestran el interés del método para este problema. El método propuesto se basa en la combinación del modelado lingüístico (con respecto a significados adverbiales temporales), las técnicas simbólicas de procesamiento de lenguaje natural (usando cascadas de transductores morfo-léxicos) y técnicas de minería de datos (la minería de patrones secuenciales bajo restricciones). El sistema ha sido aplicado a un corpus de noticias en idioma francés proporcionado por la Agencia France Presse (AFP). La evaluación se realizó en colaboración con periodistas de agencias francesas de noticias.

Descargas

Publicado

2013-06-29