Detección de plagio de documentos. Sistema externo monolingüe de altas prestaciones basado en n-gramas contextuales

  1. Rodríguez Torrejón, Diego Antonio
  2. Martín Ramos, José Manuel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2010

Número: 45

Páginas: 49-58

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo se presenta una propuesta de sistema de detección de plagio externo monolingüe basada en una modificación del concepto de n-grama (“n-grama contextual”), un nuevo motor de búsqueda basado en dicho concepto, y una nueva estrategia de determinación del plagio y sus límites (“monotonía referencial”). Los resultados de evaluación obtenidos son comparables a los del primer clasificado en la PAN'09, aunque obtenidos con un muy inferior coste computacional (tiempo de ejecución entre 30 y 45 minutos en un PC portátil sin uso de programación concurrente), lo que lo convierte en una muy interesante alternativa a explotar.

Referencias bibliográficas

  • Barrón-Cedeño A. 2008. Detección automática ́ de plagio en texto. Tesis de Máster - Universidad de Valencia.
  • Barrón-Cedeño A. y Rosso P. 2009a. On Automatic Plagiarism Detection based on n-grams Comparison. Proc. European Conference on Information Retrieval, ECIR-2009,Springer-Verlag, LNCS (5478) páginas 696-700.
  • Barrón-Cedeño, A. y Rosso P. 2009b. On the Relevance of Search Space Reduction in Automatic Plagiarism Detection. Procesamiento del Lenguaje Natural, 43:141-149.
  • Clough P. 2003. Measuring Text Reuse. PhD Thesis - University of Sheffield.
  • Grozea, C., Gehl C. y Popescu M. N. 2009. ENCOPLOT pairwise sequence matching linear time plagiarism detection (PAN'09 papers).
  • Potthast M., Barrón-Cedeño A., Stein B., Rosso P. 2010 (en prensa). Cross-Language Plagiarism Detection. Languages Resources and Evaluation (Special Issue on Plagiarism and Authorship Analysis). DOI: 10.1007/s10579- 009-9114-z.
  • Potthast M., Stein A., Eiselt A., Barrón-Cedeño A., Rosso P. 2009. Overview of the 1st International Competition on Plagiarism Detection. En:
  • Stein B., Rosso P., Stamatatos E., Koppel M., and Agirre E., editors. SEPLN 2009 Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse (PAN 09), pp. 1-9, Donostia-San Sebastian, Spain, September 2009. CEUR-WS.org. ISSN 163-0073.