La Wikipedia como fuente multilingüe de corpus comparables

  1. Isaac González López 1
  2. Pablo Gamallo Otero 1
  1. 1 Universidade de Santiago de Compostela
    info

    Universidade de Santiago de Compostela

    Santiago de Compostela, España

    ROR https://ror.org/030eybx10

Libro:
Language Windowing through Corpora
  1. Isabel Moskowich-Spiegel Fandiño (coord.)
  2. Begoña Crespo García (coord.)
  3. Inés Lareo Martín (coord.)
  4. Paula Lojo Sandino (coord.)

Editorial: Servizo de Publicacións ; Universidade da Coruña

ISBN: 978-84-9749-401-4

Año de publicación: 2010

Título del volumen: Part I, A-K

Volumen: 1

Páginas: 369-378

Congreso: International Conference on Corpus Linguistics (2. 2010. A Coruña)

Tipo: Aportación congreso

Resumen

En este artículo se describe un método automático de selección de corpus comparables a partir de laWikipedia, utilizando categorías temáticas como elementos restrictivos. Nuestra estrategia sefundamenta en dos propiedades de la Wikipedia: el ser un recurso multilingüe y el tratarse de unaenciclopedia libre disponible para descarga en formato XML. Las herramientas y los corpus generadosdispondrán de licencia libre GPL (General Public License)