Detección de plagio de documentos. Sistema externo monolingüe de altas prestaciones basado en n-gramas contextuales
- Rodríguez Torrejón, Diego Antonio
- Martín Ramos, José Manuel
ISSN: 1135-5948
Year of publication: 2010
Issue: 45
Pages: 49-58
Type: Article
More publications in: Procesamiento del lenguaje natural
Abstract
En este artículo se presenta una propuesta de sistema de detección de plagio externo monolingüe basada en una modificación del concepto de n-grama (“n-grama contextual”), un nuevo motor de búsqueda basado en dicho concepto, y una nueva estrategia de determinación del plagio y sus límites (“monotonía referencial”). Los resultados de evaluación obtenidos son comparables a los del primer clasificado en la PAN'09, aunque obtenidos con un muy inferior coste computacional (tiempo de ejecución entre 30 y 45 minutos en un PC portátil sin uso de programación concurrente), lo que lo convierte en una muy interesante alternativa a explotar.
Bibliographic References
- Barrón-Cedeño A. 2008. Detección automática ́ de plagio en texto. Tesis de Máster - Universidad de Valencia.
- Barrón-Cedeño A. y Rosso P. 2009a. On Automatic Plagiarism Detection based on n-grams Comparison. Proc. European Conference on Information Retrieval, ECIR-2009,Springer-Verlag, LNCS (5478) páginas 696-700.
- Barrón-Cedeño, A. y Rosso P. 2009b. On the Relevance of Search Space Reduction in Automatic Plagiarism Detection. Procesamiento del Lenguaje Natural, 43:141-149.
- Clough P. 2003. Measuring Text Reuse. PhD Thesis - University of Sheffield.
- Grozea, C., Gehl C. y Popescu M. N. 2009. ENCOPLOT pairwise sequence matching linear time plagiarism detection (PAN'09 papers).
- Potthast M., Barrón-Cedeño A., Stein B., Rosso P. 2010 (en prensa). Cross-Language Plagiarism Detection. Languages Resources and Evaluation (Special Issue on Plagiarism and Authorship Analysis). DOI: 10.1007/s10579- 009-9114-z.
- Potthast M., Stein A., Eiselt A., Barrón-Cedeño A., Rosso P. 2009. Overview of the 1st International Competition on Plagiarism Detection. En:
- Stein B., Rosso P., Stamatatos E., Koppel M., and Agirre E., editors. SEPLN 2009 Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse (PAN 09), pp. 1-9, Donostia-San Sebastian, Spain, September 2009. CEUR-WS.org. ISSN 163-0073.