O processo de lematização no Tesouro do léxico patrimonial galego e português

  1. Álvarez de la Granja, María
  2. Negro Romero, Marta
Actas:
Lexicografia dialetal na era digital: o tesouro do léxico patrimonial galego e português

Editorial: Universidade Estadual de Londrina

ISBN: 978-85-7846-344-1

Ano de publicación: 2015

Tipo: Achega congreso

DOI: 10347/13948 GOOGLE SCHOLAR lock_openMINERVA editor

Resumo

O Tesouro do Léxico Patrimonial Galego e Português é uma base de dados léxica que permite o acesso à informação contida em trabalhos de léxico dialetal do galego, do português de Portugal e do português do Brasil. Os dados das fontes originais oferecem-se completos e organizados a partir de variantes, lemas, classificadores semânticos, categorias gramaticais e localização geográfica. Neste trabalho apresentam-se os principais critérios aplicados no processo de lematização, que implica a atribuição de lemas e de categorias gramaticais às variantes, quer dizer, às unidades léxicas registradas nas fontes. Os lemas têm como finalidade agrupar as diferentes variantes flexivas, ortográficas ou fônicas que se encontram nas obras introduzidas na base, já, as categorias servem para unificar a diversidade de etiquetas e de informação gramatical que se encontra nelas. Além disso, apresentam-se as duas vias de ampliação do projeto: o estabelecimento de geossinônimos e a conexão dos geossinônimos e dos lemários galegos e portugueses