Contribución de la semántica combinatoria al desarrollo de herramientas digitales multilingües

  1. Domínguez Vázquez, María José 1
  1. 1 Universidade de Santiago de Compostela
    info

    Universidade de Santiago de Compostela

    Santiago de Compostela, España

    ROR https://ror.org/030eybx10

Journal:
Círculo de lingüística aplicada a la comunicación

ISSN: 1576-4737

Year of publication: 2022

Issue Title: Monográfico “Posicionamiento y dialogicidad en la escritura académica y profesional”

Issue: 90

Pages: 171-188

Type: Article

DOI: 10.5209/CLAC.73849 DIALNET GOOGLE SCHOLAR lock_openOpen access editor

More publications in: Círculo de lingüística aplicada a la comunicación

Abstract

This paper describes how the field of Combinatorial Semantics has contributed to the design of three prototypes for the automatic generation of argument patterns in nominal phrases in Spanish, French and German – Xera, Combinatoria and CombiContext. It also shows the importance of knowing about the argument syntactic-semantic interface in a production situation in the context of foreign languages. After a descriptive section on the design, typologie and information levels of the resources, there follows an explanation of the central role of the combinatorial meaning – roles and ontological features. The study deals with different semantic filters applied in the selection, organization and expansion of the lexicon, being these key pieces for the generation of grammatically correct and semantically acceptable mono- and biargumental nominal phrases. 

Bibliographic References

  • Álvarez de la Granja, M. (2017). ¿Qué obras lexicográficas podemos utilizar en el aula? Diversidad de herramientas y posibilidades de explotación. En Domínguez Vázquez, M.J. y Sanmarco Bande, M.T. (Eds.), Lexicografía y didáctica. Diccionarios y otros recursos lexicográficos en el aula, 307-327. Frankfurt: Peter Lang.
  • Bardanca Outeiriño, D. (2020). Automatic generation of dictionaries. Santiago de Compostela: Universidade de Santiago de Compostela.
  • Bojanowski, P., Grave, E., Joulin, A. y Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135-146.
  • CombiContext = Domínguez Vázquez, M. J. (Dir.), Valcárcel Riveiro, C, Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. y Pino Serrano, L. (2021): CombiContext. Prototipo online para la generación automática de contextos frasales y oraciones de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/ verbal
  • Combinatoria = Domínguez Vázquez, M.J. (Dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M.T. y Pino Serrano, L. (2020). Combinatoria. Prototipo online para la generación biargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario
  • Delli Bovi, C. y Navigli, R. (2017). Multilingual semantic dictionaries for natural language processing: The case of BabelNet, 149-163 World Scientific Encyclopedia with Semantic Computing and Robotic Intelligence. Semantic Computing. DOI :https://doi.org/10.1142/S2425038416300159
  • Domínguez Vázquez, M. J. y Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En Domínguez Vázquez, M. J., Mirazo Balsa, M. y Valcárcel Rivero, C. (Eds.), Studies on multilingual lexicography, 135-158. Berlin: de Gruyter. DOI: https://doi.org/10.1515/9783110607659
  • Domínguez Vázquez, M. J., Solla Portela, M. A. y Valcárcel Riveiro, C. (2019). Resources interoperability: Exploiting lexicographic data to automatically generate dictionary examples. En Kosem, I. y Zingano Kuhn, T. (Eds.), Proceedings of the VI. eLex conference Electronic lexicography in the 21st century: Smart Lexicography, 51-71. Brno: Lexical Computing CZ s.r.o. https://elex.link/elex2019/wp-content/uploads/2019/09/eLex_2019_4.pdf
  • Domínguez Vázquez, M. J. (2021). Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch. Lexikos, 31, 20-50. DOI: https://doi.org/10.5788/31-1-1623
  • Domínguez Vázquez, M. J. y Caíña Hurtado, M. (2021). Aplicación de recursos de xeración automática da lingua para estudos comparativos. Estudos de Lingüística Galega, 13, 139-172. DOI: https://doi.org/10.15304/elg.13.7409
  • Domínguez Vázquez, M. J., Valcárcel Riveiro, C. y Bardanca Outeiriño, D. (2021). Ontología léxica. Santiago de Compostela [Consultado: <20/12/201>].
  • Engel, U. (1996). Semantische Relatoren. Ein Entwurf für künftige Valenzwörterbücher. En Weber, N. (Ed.), Semantik, Lexikographie und Computeranwendung, 223-236. Tübingen: Niemeyer.
  • Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. München: Iudicium.
  • Fillmore, C. J. (1977). Scenes-and-Frames Semantics. En Zampolli A. (Ed.). Linguistic Structures Processing. 55-81. Amsterdam, New York & Oxford: North-Holland.
  • Firth, J.R. (1957). A synopsis of linguistic theory 1930-1955, 1-32. Oxford: Philological Society.
  • Gao, J. y Haitao. L. (2020). Valency Dictionaries and Chinese Vocabulary Acquisition for Foreign Learners. Lexikos, 30, 111-142. DOI: https://doi.org/10.5788/30-1-1548
  • Geyken, A., Wiegand, F. y Würzner, K. M. (2017). On-the-fly Generation of Dictionary Articles for the DWDS Website. En Kosem, I., Tiberius, C., Jakubíček, M., Kallas, J., Krek, S. y Baisa, V. (Eds.), Electronic lexicography in the 21st century: Proceedings of eLex 2017 conference, 560-570. Brno: Lexical Computing CZ s.r.o. https://elex.link/elex2017/proceedings/eLex_2017_Proceedings.pdf
  • Gómez Guinovart, X. y Solla Portela, M. A. (2018). Building the Galician wordnet: methods and applications. Language Resources and Evaluation, 52(1), 317-339.
  • Gross, G. (2008). Les classes d’objets. Lalies (Paris), 111-165. Paris: Presses de l’Ecole normale supérieure.
  • Gouws, R. H. (2017). La sociedad digital y los diccionarios. En Domínguez Vázquez, M.J. y Sanmarco Bande, M.T. (Eds.). Lexicografía y didáctica. Diccionarios y otros recursos lexicográficos en el aula, 17-34. Frankfurt: Peter Lang.
  • Hashimoto, T., Zhang, H. y Liang, P. (2019). Unifying human and statistical evaluation for natural language generation. En Burstein, J., Doran, C. y Solorio, T. (Eds.), Proceedings of the 2019 Conference of the North American Association for Computational Linguistics: Human Language Technologies, 1, 1689-1701. Minesota: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/N19-1169
  • Horák, A. y Rambousek, A. (2017): Lexicography and natural language processing. The Routledge Handbook of Lexicography, 179-196. Nueva York: Routledge. DOI: https://doi.org/10.4324/9781315104942
  • Kabashi, B. (2018). A Lexicon of Albanian for Natural Language Processing. En Čibej, J., Gorjanc, V., Kosem, I. y Krek, S. (Eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, 855-862. Ljubljana, Ljubljana University Press. https://euralex.org/publications/ a-lexicon-of-albanian-for-natural-language-processing/
  • Kilgarriff, A. y Kosem, I. (2012). Corpus tools for lexicographers. En Granger, S. y Paquot, M. (Eds.), Electronic Lexicography. DOI: https://doi.org/10.1093/acprof:oso/9780199654864.003.0003
  • Klein, W. (2015). Das Wörterbuch der Zukunft ist kein Wörterbuch. En Eichiger, L. (Ed.), Sprachwissenschaft im Fokus, 227-297. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110401592.277
  • Kosem, I., Koppel, K., Zingano Kuhn, T. Michelfeit, J. y Tiberiusm C. (2019). Identification and automatic extraction of good dictionary examples: the case(s) of GDEX. International Journal of Lexicography, 32(2), 119-137. DOI: https://doi.org/10.1093/ijl/ecy014
  • Krek, S. (2019). Natural Language Processing and Automatic Knowledge Extraction for Lexicography. International Journal of Lexicography, 32(2), Pages 115–118. DOI: https://doi.org/10.1093/ijl/ecz013
  • Laufer, B. y Nation, P. (2012). Vocabulary. En Gass, S. M. y Mackey, A. (Eds.), The Routledge Handbook of Second Language Acquisition, 163–176. London/ New York: Routledge.
  • Maldonado, M. C. (2019). Las investigaciones de mercado en lexicografía comercial: un aprendizaje para el mundo académico e investigador. RILE. Revista Internacional de Lenguas Extranjeras, 10, 101-118. DOI: https://doi.org/10.17345/rile10.101-118
  • Meyer, C. M. y Gurevych, I. (2013). Wiktionary: A new rival for expertbuilt lexicons? Exploring the possibilities of collaborative lexicography. En Granger, S. y Paquot, M. (Eds.), Electronic Lexicography, 259–291.Oxford: Oxford University Press. DOI: https://doi.org/10.1093/acprof:oso/9780199654864.003.0013
  • Mikolov, T., Chen, K., Corrado, G. y Dean, J. (2013). Efficient estimation of word representations in vector space. En Bengio, Y. y LeCun, Y. (Eds.), Proceeding of the International Conference on Learning Representations Workshop Track. Arizona: Conference Track Proceedings. https://arxiv.org/pdf/1301.3781.pdf
  • Moreno Jiménez, L. G., Torres-Moreno, J. M.m Wedemann, R. S. y SanJuan, E. (2020). Generación automática de frases literarias. Linguamática, 12 (1), 15-30. DOI: https://doi.org/10.21814/lm.12.1.308
  • Müller-Spitzer, C. (2014). Using Online Dictionaries, 1-10. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110341287.1
  • Müller-Spitzer, C., Nied Curcio, M., Domínguez Vázquez, M.J.,Silva Dias, I.M. y Wolfer, S. (2018). Correct Hypotheses and Careful Reading Are Essential: Results of an Observational Study on Learners Using Online Language Resources. Lexicos, 28, 287-315. DOI: https://doi.org/10.5788/28-1-1466
  • Nallapati, R., Zhou, B., Nogueira dos Santos, C., Gulcehre, C. y Xiang. B. (2016) Abstractive text summarization using sequence-to-sequence RNNs and beyond. En Riezler, S., y Goldberg, Y. (Eds.), Proceedings of the 20th SIGNLL Conference on Computational Natural Language Learning, 280-290. Berlin: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/K16-1028
  • Navigli, R. y Ponzeto, S. P. (2012). BabelNet: The automatic construction, evaluation and application of a wide-coverage multilingual semantic network. Artificial Intelligence, 193, 217-250. DOI: https://doi.org/10.1016/j.artint.2012.07.001
  • Nied, M. (2014). Die Benutzung von Smartphones im Fremdsprachenerwerb und -unterricht. En Abel, A., Vettori, C. y Ralli, N. (Eds.), Proceedings of the XVI EURALEX International Congress: The User in Focus, 263-280. Bolzano/Bozen: Institute for Specialised Communication and Multilingualism. http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf
  • Otter, D.W., Medina, J. R. y Kalita, J.K. (2020). A Survey of the Usages of Deep Learning for Natural Language Processing. En He, H. (Ed.), IEEE Transactions on Neural Networks and Learning Systems. DOI: https://doi.org/10.1109/TNNLS.2020.2979670
  • Portlex = Domínguez Vázquez, M.J. (Dir.), Valcárcel Riveiro, C., Mirazo Balsa, M. Sanmarco Bande, M.T., Simões, A. y Vale, M.J. (2018). Portlex. Dicccionario multilingüe de la valencia del nombre. Universidade de Santiago de Compostela. http://portlex.usc.gal/portlex/
  • Prinsloo, D. J., Heid, U., Bothma, T. y Faaß. (2011). Interactive, dynamic electronic dictionaries for text production. En Kosem, I. y Kosem, K. (Eds.), Electronic lexicography in the 21st Century: New Applications for New Users, Bled, 215-220. Eslovenia: Trojina, Institute for Applied Slovene Studies. Recuperado de https://elex2011.trojina.si/Vsebine/proceedings/eLex2011-29.pdf
  • Prinsloo, D. J., Heid, U., Bothma, T. y Faaß. (2012). Devices for information. Presentation in electronic dictionaries. Lexikos, 22, 290–320. DOI: https://doi.org/10.5788/22-1-1009
  • Raine, P. (2018). Developing Web-based English Learning Applications: Principles and Practice. Computer Assisted Language Learning Electronic Journal, 19(2), 125–138.
  • Roemmele, M. (2016). Writing stories with help from recurrent neural networks. En Schuurmans, D. y Wellman, M. (Eds.), Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (AAAI-16), 30 (1), 4311-4312. California: Association for the Advancement of Artificial Intelligence.
  • Rosch, E. (1978). Prototype classification and logical classification: The two systems. En Scholnik, E. (Ed.). New trends in cognitive representation: Challenges to Piaget's theory Hillsdale. 73-86. NJ: Erlbaum.
  • Sordoni, A., Galley, M., Auli, M., Brockett, C., Ji, Y., Mitchell, M., Nie, J.Y., Gao, J. y Dolan, B. (2015). A neural network approach to context-sensitive generation of conversational responses. En Mihalcea, R., Chai, J. y Sarkar, A. (Eds.), Human Language Technologies: The 2015 Annual Conference of the North American Chapter of the ACL, 2015, Denver, Association for Computational Linguistics, 196–205.
  • Spohr, D. (2011). A Multi-layer Architecture for “Pluri-Monofunctional” Dictionaries. En Fuertes-Olivera, P. A. y Bergenholtz, H. (Eds.), E-Lexicography: The Internet, Digital Initiatives and Lexicography, 103-120. Londres: Continuum. DOI: https://doi.org./10.5040/9781474211833.ch-005
  • Trap-Jensen, L. (2018). Lexicography between NLP and Linguistics: Aspects of Theory and Practice. En Čibej, J., Gorjanc, V., Kosem, I. y Krek, S. (Eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts,25-37. Ljubljana: Ljubljana University Press. https://euralex.org/wp-content/themes/euralex/proceedings/Euralex%202018/118-4-2949-1-10-20180820.pdf
  • Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En Domínguez Vázquez, M.J. y Kutscher, S. (Eds.), Interacción entre gramática, didáctica y lexicografía, 193-207. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110420784-015
  • Wolfer, S., Bartz, T., Weber, T., Abel, A., Meyer, C.M., Müller-Spitzer, C y Storrer, A. (2016). The Effectiveness of Lexicographic Tools for Optimising Written L1-Texts. En International Journal of Lexicography, 31 (1), 1-28. DOI: https://doi.org/10.1093/ijl/ecw038
  • Villa Vigoni-Thesen, V. (2018). Wörterbücher für die Zukunft – Die Zukunft der Wörterbücher. Herausforderungen an die Lexikografie in einer digitalen Gesellschaft. https://www.emlex.phil.fau.de/andere-publikationen/
  • Xera = Domínguez Vázquez, M. J. (Dir.), Valcárcel Riveiro, C, Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. y Pino Serrano, L. (2021) (2020). Xera. Prototipo online para la generación automática monoargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario
  • XeraWord = Domínguez Vázquez, M.J. (Dir.), Bardanca Outeiriño, D., Caíña Hurtado, M., Gómez Guinovart, X., Iglesias Allones, J.vL., Simões, A., Valcárcel Riveiro, C., Álvarez de la Granja, M. y Cidrás Escaneo, F.A. (2020). XeraWord. Prototipo de xeración automática da argumentación da frase nominal en galego e portugués. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.gal/xeraword/