Un método eficaz de indexación para la recuperación de imágenes en archivos en formato pdf

  1. Mata Vázquez, Jacinto
  2. Crespo Azcárate, Mariano
  3. Maña López, Manuel Jesús
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2010

Número: 45

Páginas: 21-30

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Una de las áreas que más interés está despertando actualmente entre los investigadores y usuarios de sistemas de Recuperación de Información es la recuperación de documentos que contengan imágenes relevantes a una necesidad de información. En este caso, el principal objetivo no es la recuperación de los documentos relevantes a la necesidad de información del usuario sino la obtención de las imágenes relevantes a dicha necesidad. En la actualidad, las colecciones de documentos se pueden encontrar en diversos formatos (html, xml, pdf, etc.). En este artículo presentamos un método eficaz para indexar una colección de documentos en formato pdf para mejorar la recuperación de imágenes contenidas en los documentos. Los experimentos realizados prueban que el método presentado obtiene mejores resultados que si se realizara una indexación del texto completo.

Referencias bibliográficas

  • Christiansen, A., D. Lee y Y. Chang. 2007. Finding relevant PDF medical journal articles by the content of their figures. En Proc. SPIE Vol. 6516
  • Cutting, D., M. Busch, D. Cohen, O. Gospodnetic, E. Hatcher, C. Hostetter, G. Ingersoll, M. McCandless, B. Messer, D. Naber y Y. Seeley. 2008. Apache Lucene. http://apache.lucene.org.
  • Divoli, A., Michael A. Wooldridge, Marti A. Hearst. 2010. Full Text and Figure Display Improves Bioscience Literature Search. PLoS ONE 5(4): e9619.
  • Hearst, M., A. Divoli, H. Guturu, A. Ksikes, P. Nakov, M.A. Wooldridge y J. Ye. 2007. BioText Search Engine: beyond abstract search. Bioinformatics 23(16): 2196-2197.
  • Kahn, C.H. Jr. y C. Thao. 2007. GoldMiner: A Radiology Image Search Engine. American Journal of Roentgenology 188:1475-1478
  • Van Rijsbergen, CJ. 1979. Information Retrieval. Second Edition. Ed. Butterworths. Londres.
  • Xu, S., J. McCusker y M. Krauthammer. 2008. Yale Image Finder (YIF): a new search engine for retrieving biomedical images. Bioinformatics 24(17): 1968-1970.
  • Yu, H. y M. Lee. 2006. Accessing bioscience images from abstract sentences. Bioinformatics 22(14): e547–56.
  • Yu, H., S. Agarwal, M. Johnston y A. Cohen. 2009 Are figure legends sufficient? Evaluating the contribution of associated text to biomedical figure comprehension. J Biomed Discov Collab 4: 1.