La Wikipedia como fuente multilingüe de corpus comparables
- Isaac González López 1
- Pablo Gamallo Otero 1
-
1
Universidade de Santiago de Compostela
info
- Isabel Moskowich-Spiegel Fandiño (coord.)
- Begoña Crespo García (coord.)
- Inés Lareo Martín (coord.)
- Paula Lojo Sandino (coord.)
Editorial: Servizo de Publicacións ; Universidade da Coruña
ISBN: 978-84-9749-401-4
Año de publicación: 2010
Título del volumen: Part I, A-K
Volumen: 1
Páginas: 369-378
Congreso: International Conference on Corpus Linguistics (2. 2010. A Coruña)
Tipo: Aportación congreso
Resumen
En este artículo se describe un método automático de selección de corpus comparables a partir de laWikipedia, utilizando categorías temáticas como elementos restrictivos. Nuestra estrategia sefundamenta en dos propiedades de la Wikipedia: el ser un recurso multilingüe y el tratarse de unaenciclopedia libre disponible para descarga en formato XML. Las herramientas y los corpus generadosdispondrán de licencia libre GPL (General Public License)