Herramientas y dificultades en el análisis del grupo nominal en francés para su procesamiento computacional

  1. Valcárcel Riveiro, Carlos 1
  2. Pino Serrano, Laura 2
  1. 1 Universidade de Vigo
    info

    Universidade de Vigo

    Vigo, España

    ROR https://ror.org/05rdf8595

  2. 2 Universidade de Santiago de Compostela
    info

    Universidade de Santiago de Compostela

    Santiago de Compostela, España

    ROR https://ror.org/030eybx10

Revista:
RILEX Revista sobre investigaciones léxicas

ISSN: 2605-3136

Ano de publicación: 2023

Título do exemplar: Desarrollo de aplicaciones para la generación automática del lenguaje

Número: 1

Páxinas: 107-138

Tipo: Artigo

DOI: 10.17561/RILEX.6.3.8392 DIALNET GOOGLE SCHOLAR lock_openAcceso aberto editor

Outras publicacións en: RILEX Revista sobre investigaciones léxicas

Resumo

This paper presents the work carried out on the French language within the multilingual lexicographic portal PORTLEX. In particular, the article focuses on the tools used by the teams working on French in three research projects: the PORTLEX dictionary and the development of prototypes for the automatic generation of noun phrases within MultiGenera and MultiComb projects. The resources used are described in detail, distinguishing between reference tools (dictionaries, grammars) and computational tools (corpora, databases). In addition, the main difficulties associated with the use of each tool or resource are described and the choices made to resolve or minimise them are explained.

Referencias bibliográficas

  • Abeillé, A. & Godard, D. (dirs.) (2021). La grande grammaire du français. Actes Sud.
  • Alonso-Ramos, M. (2004). Diccionario de colocaciones del español (DICE). http://www.dicesp.com/paginas
  • Alonso-Ramos, M. (2017). Diccionarios combinatorios. Estudios de Lingüística del Español, 38, 173–201. https://doi.org/10.36950/elies.2017.38.8651
  • Barrios Rodríguez, M. A. (2010). El dominio de las funciones léxicas en el marco de la Teoría Sentido-Texto. Estudios de Lingüística del español (ELiEs), 30. http://elies.rediris.es/elies30/index30.html
  • Blanco, X. (1997). De las clases de objetos a las clases de predicados. Verba, 24, 371–385.
  • Blanco, X. (1999). Lexicographie bilingue français-espagnol et classes d'objets. Universitat Autònoma de Barcelona.
  • Cerquiglini, B. (dir.) (1999). Femme, j’écris ton nom… Guide d’aide à la féminisation des noms de métiers, titres, grades et fonctions. Centre National de la Recherche Scientifique & Institut de la Langue Française. https://medias.vie-publique.fr/data_storage_s3/rapport/pdf/994001174.pdf
  • Charaudeau, P. (1992). Grammaire du sens et de l'expression. Hachette-Éducation.
  • Condette, M. H., Marín, R. & Merlo, A. (2012). La structure argumentale des noms déverbaux: du corpus au lexique et du lexique au corpus. En F. Neveu, V. M. Toke, P. Blumenthal, T. Klingler, P. Ligas, S. Prévost & S. Teston-Bonnard (eds.), Actes du 3ème Congrès Mondial de Linguistique Française, Lyon, France, 4-7 juillet 2012 (pp. 845–858). SHS Web of conferences. https://doi.org/10.1051/shsconf/20120100271.
  • Dendien, J. (2020). Le TLFi Trésor de la langue française informatisé. Analyse et traitement informatique de la langue française. http://atilf.atilf.fr/tlfv3.htm
  • Domínguez Vázquez, M.ª J. (2011). Kontrastive Grammatik und Lexikographie: spanisch-deutsches Wörterbuch zur Valenz des Nomens. Iudicium
  • Domínguez Vázquez, M.ª J. (2018). Was sind Valenzwörterbücher? Sprachwissenschaft, 43(3), 309–342.
  • Domínguez Vázquez, M.ª J., Bardanca Outeiriño, D. & Simões, A. (2021). Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Post-editing Lexicography – Elex 2021. Proceedings of the eLex 2021 conference (pp. 269–287). European Lexicographic Infrastructure. https://elex.link/elex2021/wp-content/uploads/eLex_2021-proceedings.pdf
  • Domínguez Vázquez, M.ª J., Solla Portela, M. A. & Valcárcel Riveiro, C. (2019). Resources interoperability: exploiting lexicographic data to automatically generate dictionary examples. En I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreira, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1-3 October 2019, Sintra, Portugal (pp. 51–71). Lexical Computing CZ, s.r.o.
  • Domínguez Vázquez, M.ª J. & Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 135–158). De Gruyter. https://doi.org/10.1515/9783110607659-008
  • Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Bardanca Outeiriño, D. (2021), Ontología léxica. Santiago de Compostela. http://portlex.usc.gal/ontologia
  • Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Lindemann, D. (2018). Multilingual Generation of Noun Valency Patterns for Extracting Syntactic-Semantical Knowledge from Corpora (MultiGenera). En J. Čibej, V. Gorjanc, I. Kosem & S. Krek (eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, Ljubljana, Slovenia (pp. 847–854). Ljubljana University Press.
  • Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. Iudicium.
  • Gómez Guinovart, X. & Solla Portela, M. A. (2018). Building the Galician WordNet: methods and applications. Language Resources & Evaluation 52(1), 317–339. https://doi.org/10.1515/9783110607659-010
  • Gómez Guinovart, X. & Solla Portela, M. A. (2020). Construction of a WordNet-based multilingual lexical ontology for Galician. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 179–196). De Gruyter.
  • Grevisse, M. & Goosse, A. (2008). Le bon usage. Grammaire française. De Boeck-Duculot.
  • Gross, G. (1991). Syntaxe du complément de nom. Linguisticae Investigationes, 15, 255–284. https://doi.org/10.1075/li.15.2.02gro
  • Gross, G. (2002). Analyse de compléments du nom en termes de classes d’objets. Le français moderne, 70(2), 187–209.
  • Gross, G. (2004). Réflexions sur le traitement automatique des langues. En G. Purnelle, C. Fairon & A. Dister (eds.), Le Poids des mots. Actes des 7es Journées internationales d’Analyse Statistique des Données Textuelles (JADT 2004) (545–556). Presses Universitaires de Louvain.
  • Gross, G. (2008). Les classes d’objets. Lalies, 28, 111–165.
  • Gross, G. (2012). Manuel d’analyse linguistique. Presses Universitaires du Septentrion. https://doi.org/10.4000/books.septentrion.115128
  • Iordanskaja, L., Kim, M. & Polguère, A. (1996). Some Procedural Problems in the Implementation of Lexical Functions for Text Generation. En L. Wanner (ed.), Lexical functions in lexicography and natural language processing (pp. 279–297). John Benjamins.
  • Jakubíček, M., Kilgarriff, A., Kovář, V., Rychlý, P. & Suchomel, V. (2013). The Tenten Corpus Family. En A. Hardie & R. Love (eds.), Proceedings of the 7th International Corpus Linguistics Conference CL (pp. 125–127). Lancaster University. https://www.sketchengine.eu/wp-content/uploads/The_TenTen_Corpus_2013.pdf
  • Lazard, G. (1988). Définition des actants dans les langues européennes. En J. Feuillet (ed.), Actance et valence dans les langues de l’Europe (pp. 11–146). Mouton de Gruyter. https://doi.org/10.1515/9783110804485.11
  • Lazard, G. (1994). L’actance. Presses Universitaires de France.
  • Lexical Computing (2023a). CQL - Corpus Query Language. Sketch Engine. https://www.sketchengine.eu/documentation/corpus-querying/
  • Lexical Computing (2023b). Concordance - a tool to search corpus. Sketch Engine. https://www.sketchengine.eu/guide/concordance-a-tool-to-search-a-corpus/
  • Mel’čuk, I. (1997). Vers une linguistique Sens-Texte. Leçon inaugurale. Collège de France. http://olst.ling.umontreal.ca/pdf/melcukColldeFr.pdf
  • Mel′čuk, I., Arbatchewsky-Jumarie, N., Iordanskaja, L., Mantha, S. & Polguère, A. (eds.) (1984-1999). Dictionnaire explicatif et combinatoire du français contemporain: recherches lexico-sémantiques I-IV. Presses de l’Université de Montréal. https://doi.org/10.2307/j.ctv69t5n2
  • Mel′čuk, I., Clas, A. & Polguère, A. (1995). Introduction à la lexicologie explicative et combinatoire. Éditions Duculot.
  • Mel′čuk, I. & Milićević, J. (2014). Introduction à la linguistique. Volume 1. Éditions Hermann.
  • Mel′čuk, I. & Polguère, A. (2007). Lexique actif du français: l'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français. De Boeck.
  • Miller, G. A., Beckwith, R., Fellbaum, C, Gross, D & Miller, K. J. (1990). Introduction to WordNet: An On-line Lexical Database. International Journal of Lexicography, 3(4), 235–244. https://doi.org/10.1093/ijl/3.4.235
  • Montémont, V. (2020). De Frantext 1 à Frantext 2: la cure de jouvence d’une vieille dame. En D. Aquino-Weber & Y. Greub (eds.), La lexicographie informatisée: les vocabulaires nationaux dans un contexte européen (pp. 41–66). Académie suisse des sciences humaines et sociales.
  • Padró, L. & Stanilovsky, E. (2012). FreeLing 3.0: Towards Wider Multilinguality. En N. Calzolari, K. Choukri, T. Declerck, M. U. Doğan, B Maegaard, J. Mariani, A. Moreno, J. Odijk & S. Piperidis (eds.), Proceedings of the Language Resources and Evaluation Conference (LREC 2012). European Language Resources Association. https://nlp.lsi.upc.edu/publications/papers/padro12.pdf
  • Picallo, M. C. (1999). La estructura del sintagma nominal: las nominalizaciones y otros sustantivos con complementos argumentales. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 363–393). Espasa Calpe.
  • Pierrel, J. M. (2003). Un ensemble de ressources de référence pour l’étude du français: TLFI, FRANTEXT et le logiciel STELLA. Revue québécoise de linguistique, 32, 155–176. https://doi.org/10.7202/012248ar
  • Riegel M., Pellat, J.C. & Rioul, R. (2009). Grammaire méthodique du français. Presses Universitaires de France.
  • Rigau, G. (1999). La estructura del sintagma nominal: los modificadores del nombre. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 311–362). Espasa Calpe.
  • Sagot, B. & Fišer, D. (2008). Building a free French wordnet from multilingual resources. En N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis & D. Tapias (eds.), Proceedings of the Sixth International Language Resources and Evaluation (LREC’08). European Language Resources Association. https://inria.hal.science/inria-00614708/document
  • Stage, L. (1994). La valence des noms en français, En M. Herslund (ed.), Noun Phrase Structures (pp. 93–131). Samfundslitteratur.
  • Stage, L. (1997). La transposition des actants dans le syntagme nominal. Étude sur la nominalisation nucléaire et l’emploi des prépositions. Revue Romane, 32(1), 51–86.
  • Tesnière, L. (1959). Éléments de syntaxe structurale. Klincksieck.
  • Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En M.ª J. Domínguez Vázquez & S. Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía (pp. 193–207). De Gruyter. https://doi.org/10.1515/9783110420784-015
  • Valcárcel Riveiro, C. & Pino Serrano, L. (2023). Application d’une méthodologie d’analyse des prédicats nominaux: l’exemple du lexème ᴍᴏʀᴛ1. Çédille. Revista de estudios franceses, 24 (en prensa).
  • Vossen, P. (ed.) (1999). EuroWordNet. General Document 1, Final. University of Amsterdam. https://archive.illc.uva.nl/EuroWordNet/docs/GeneralDocDOC.zip
  • Wilmet, M. (1997). Grammaire critique du français. Duculot.