Contribución de la semántica combinatoria al desarrollo de herramientas digitales multilingües

  1. Domínguez Vázquez, María José 1
  1. 1 Universidade de Santiago de Compostela
    info

    Universidade de Santiago de Compostela

    Santiago de Compostela, España

    ROR https://ror.org/030eybx10

Revista:
Círculo de lingüística aplicada a la comunicación

ISSN: 1576-4737

Ano de publicación: 2022

Título do exemplar: Monográfico “Posicionamiento y dialogicidad en la escritura académica y profesional”

Número: 90

Páxinas: 171-188

Tipo: Artigo

DOI: 10.5209/CLAC.73849 DIALNET GOOGLE SCHOLAR lock_openAcceso aberto editor

Outras publicacións en: Círculo de lingüística aplicada a la comunicación

Resumo

El presente trabajo describe cómo la semántica combinatoria ha contribuido al diseño de tres prototipos de generación automática de esquemas argumentales del nombre en español, francés y alemán – Xera, Combinatoria y CombiContext. Asimismo, da cuenta de la importancia del conocimiento sobre la interfaz sintáctico-semántica argumental en una situación de producción en lenguas extranjeras. Tras un apartado descriptivo sobre el diseño, tipología y niveles informativos de los recursos, sigue una exposición sobre el papel fundamental del significado combinatorio —relacional y categorial— en su desarrollo. El estudio detalla diferentes filtros semánticos aplicados en la selección, organización y expansión del caudal léxico, siendo estas piezas clave para la generación de frases nominales mono y biargumentales gramaticalmente correctas y semánticamente aceptables.

Referencias bibliográficas

  • Álvarez de la Granja, M. (2017). ¿Qué obras lexicográficas podemos utilizar en el aula? Diversidad de herramientas y posibilidades de explotación. En Domínguez Vázquez, M.J. y Sanmarco Bande, M.T. (Eds.), Lexicografía y didáctica. Diccionarios y otros recursos lexicográficos en el aula, 307-327. Frankfurt: Peter Lang.
  • Bardanca Outeiriño, D. (2020). Automatic generation of dictionaries. Santiago de Compostela: Universidade de Santiago de Compostela.
  • Bojanowski, P., Grave, E., Joulin, A. y Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135-146.
  • CombiContext = Domínguez Vázquez, M. J. (Dir.), Valcárcel Riveiro, C, Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. y Pino Serrano, L. (2021): CombiContext. Prototipo online para la generación automática de contextos frasales y oraciones de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/ verbal
  • Combinatoria = Domínguez Vázquez, M.J. (Dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M.T. y Pino Serrano, L. (2020). Combinatoria. Prototipo online para la generación biargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario
  • Delli Bovi, C. y Navigli, R. (2017). Multilingual semantic dictionaries for natural language processing: The case of BabelNet, 149-163 World Scientific Encyclopedia with Semantic Computing and Robotic Intelligence. Semantic Computing. DOI :https://doi.org/10.1142/S2425038416300159
  • Domínguez Vázquez, M. J. y Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En Domínguez Vázquez, M. J., Mirazo Balsa, M. y Valcárcel Rivero, C. (Eds.), Studies on multilingual lexicography, 135-158. Berlin: de Gruyter. DOI: https://doi.org/10.1515/9783110607659
  • Domínguez Vázquez, M. J., Solla Portela, M. A. y Valcárcel Riveiro, C. (2019). Resources interoperability: Exploiting lexicographic data to automatically generate dictionary examples. En Kosem, I. y Zingano Kuhn, T. (Eds.), Proceedings of the VI. eLex conference Electronic lexicography in the 21st century: Smart Lexicography, 51-71. Brno: Lexical Computing CZ s.r.o. https://elex.link/elex2019/wp-content/uploads/2019/09/eLex_2019_4.pdf
  • Domínguez Vázquez, M. J. (2021). Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch. Lexikos, 31, 20-50. DOI: https://doi.org/10.5788/31-1-1623
  • Domínguez Vázquez, M. J. y Caíña Hurtado, M. (2021). Aplicación de recursos de xeración automática da lingua para estudos comparativos. Estudos de Lingüística Galega, 13, 139-172. DOI: https://doi.org/10.15304/elg.13.7409
  • Domínguez Vázquez, M. J., Valcárcel Riveiro, C. y Bardanca Outeiriño, D. (2021). Ontología léxica. Santiago de Compostela [Consultado: <20/12/201>].
  • Engel, U. (1996). Semantische Relatoren. Ein Entwurf für künftige Valenzwörterbücher. En Weber, N. (Ed.), Semantik, Lexikographie und Computeranwendung, 223-236. Tübingen: Niemeyer.
  • Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. München: Iudicium.
  • Fillmore, C. J. (1977). Scenes-and-Frames Semantics. En Zampolli A. (Ed.). Linguistic Structures Processing. 55-81. Amsterdam, New York & Oxford: North-Holland.
  • Firth, J.R. (1957). A synopsis of linguistic theory 1930-1955, 1-32. Oxford: Philological Society.
  • Gao, J. y Haitao. L. (2020). Valency Dictionaries and Chinese Vocabulary Acquisition for Foreign Learners. Lexikos, 30, 111-142. DOI: https://doi.org/10.5788/30-1-1548
  • Geyken, A., Wiegand, F. y Würzner, K. M. (2017). On-the-fly Generation of Dictionary Articles for the DWDS Website. En Kosem, I., Tiberius, C., Jakubíček, M., Kallas, J., Krek, S. y Baisa, V. (Eds.), Electronic lexicography in the 21st century: Proceedings of eLex 2017 conference, 560-570. Brno: Lexical Computing CZ s.r.o. https://elex.link/elex2017/proceedings/eLex_2017_Proceedings.pdf
  • Gómez Guinovart, X. y Solla Portela, M. A. (2018). Building the Galician wordnet: methods and applications. Language Resources and Evaluation, 52(1), 317-339.
  • Gross, G. (2008). Les classes d’objets. Lalies (Paris), 111-165. Paris: Presses de l’Ecole normale supérieure.
  • Gouws, R. H. (2017). La sociedad digital y los diccionarios. En Domínguez Vázquez, M.J. y Sanmarco Bande, M.T. (Eds.). Lexicografía y didáctica. Diccionarios y otros recursos lexicográficos en el aula, 17-34. Frankfurt: Peter Lang.
  • Hashimoto, T., Zhang, H. y Liang, P. (2019). Unifying human and statistical evaluation for natural language generation. En Burstein, J., Doran, C. y Solorio, T. (Eds.), Proceedings of the 2019 Conference of the North American Association for Computational Linguistics: Human Language Technologies, 1, 1689-1701. Minesota: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/N19-1169
  • Horák, A. y Rambousek, A. (2017): Lexicography and natural language processing. The Routledge Handbook of Lexicography, 179-196. Nueva York: Routledge. DOI: https://doi.org/10.4324/9781315104942
  • Kabashi, B. (2018). A Lexicon of Albanian for Natural Language Processing. En Čibej, J., Gorjanc, V., Kosem, I. y Krek, S. (Eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, 855-862. Ljubljana, Ljubljana University Press. https://euralex.org/publications/ a-lexicon-of-albanian-for-natural-language-processing/
  • Kilgarriff, A. y Kosem, I. (2012). Corpus tools for lexicographers. En Granger, S. y Paquot, M. (Eds.), Electronic Lexicography. DOI: https://doi.org/10.1093/acprof:oso/9780199654864.003.0003
  • Klein, W. (2015). Das Wörterbuch der Zukunft ist kein Wörterbuch. En Eichiger, L. (Ed.), Sprachwissenschaft im Fokus, 227-297. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110401592.277
  • Kosem, I., Koppel, K., Zingano Kuhn, T. Michelfeit, J. y Tiberiusm C. (2019). Identification and automatic extraction of good dictionary examples: the case(s) of GDEX. International Journal of Lexicography, 32(2), 119-137. DOI: https://doi.org/10.1093/ijl/ecy014
  • Krek, S. (2019). Natural Language Processing and Automatic Knowledge Extraction for Lexicography. International Journal of Lexicography, 32(2), Pages 115–118. DOI: https://doi.org/10.1093/ijl/ecz013
  • Laufer, B. y Nation, P. (2012). Vocabulary. En Gass, S. M. y Mackey, A. (Eds.), The Routledge Handbook of Second Language Acquisition, 163–176. London/ New York: Routledge.
  • Maldonado, M. C. (2019). Las investigaciones de mercado en lexicografía comercial: un aprendizaje para el mundo académico e investigador. RILE. Revista Internacional de Lenguas Extranjeras, 10, 101-118. DOI: https://doi.org/10.17345/rile10.101-118
  • Meyer, C. M. y Gurevych, I. (2013). Wiktionary: A new rival for expertbuilt lexicons? Exploring the possibilities of collaborative lexicography. En Granger, S. y Paquot, M. (Eds.), Electronic Lexicography, 259–291.Oxford: Oxford University Press. DOI: https://doi.org/10.1093/acprof:oso/9780199654864.003.0013
  • Mikolov, T., Chen, K., Corrado, G. y Dean, J. (2013). Efficient estimation of word representations in vector space. En Bengio, Y. y LeCun, Y. (Eds.), Proceeding of the International Conference on Learning Representations Workshop Track. Arizona: Conference Track Proceedings. https://arxiv.org/pdf/1301.3781.pdf
  • Moreno Jiménez, L. G., Torres-Moreno, J. M.m Wedemann, R. S. y SanJuan, E. (2020). Generación automática de frases literarias. Linguamática, 12 (1), 15-30. DOI: https://doi.org/10.21814/lm.12.1.308
  • Müller-Spitzer, C. (2014). Using Online Dictionaries, 1-10. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110341287.1
  • Müller-Spitzer, C., Nied Curcio, M., Domínguez Vázquez, M.J.,Silva Dias, I.M. y Wolfer, S. (2018). Correct Hypotheses and Careful Reading Are Essential: Results of an Observational Study on Learners Using Online Language Resources. Lexicos, 28, 287-315. DOI: https://doi.org/10.5788/28-1-1466
  • Nallapati, R., Zhou, B., Nogueira dos Santos, C., Gulcehre, C. y Xiang. B. (2016) Abstractive text summarization using sequence-to-sequence RNNs and beyond. En Riezler, S., y Goldberg, Y. (Eds.), Proceedings of the 20th SIGNLL Conference on Computational Natural Language Learning, 280-290. Berlin: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/K16-1028
  • Navigli, R. y Ponzeto, S. P. (2012). BabelNet: The automatic construction, evaluation and application of a wide-coverage multilingual semantic network. Artificial Intelligence, 193, 217-250. DOI: https://doi.org/10.1016/j.artint.2012.07.001
  • Nied, M. (2014). Die Benutzung von Smartphones im Fremdsprachenerwerb und -unterricht. En Abel, A., Vettori, C. y Ralli, N. (Eds.), Proceedings of the XVI EURALEX International Congress: The User in Focus, 263-280. Bolzano/Bozen: Institute for Specialised Communication and Multilingualism. http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf
  • Otter, D.W., Medina, J. R. y Kalita, J.K. (2020). A Survey of the Usages of Deep Learning for Natural Language Processing. En He, H. (Ed.), IEEE Transactions on Neural Networks and Learning Systems. DOI: https://doi.org/10.1109/TNNLS.2020.2979670
  • Portlex = Domínguez Vázquez, M.J. (Dir.), Valcárcel Riveiro, C., Mirazo Balsa, M. Sanmarco Bande, M.T., Simões, A. y Vale, M.J. (2018). Portlex. Dicccionario multilingüe de la valencia del nombre. Universidade de Santiago de Compostela. http://portlex.usc.gal/portlex/
  • Prinsloo, D. J., Heid, U., Bothma, T. y Faaß. (2011). Interactive, dynamic electronic dictionaries for text production. En Kosem, I. y Kosem, K. (Eds.), Electronic lexicography in the 21st Century: New Applications for New Users, Bled, 215-220. Eslovenia: Trojina, Institute for Applied Slovene Studies. Recuperado de https://elex2011.trojina.si/Vsebine/proceedings/eLex2011-29.pdf
  • Prinsloo, D. J., Heid, U., Bothma, T. y Faaß. (2012). Devices for information. Presentation in electronic dictionaries. Lexikos, 22, 290–320. DOI: https://doi.org/10.5788/22-1-1009
  • Raine, P. (2018). Developing Web-based English Learning Applications: Principles and Practice. Computer Assisted Language Learning Electronic Journal, 19(2), 125–138.
  • Roemmele, M. (2016). Writing stories with help from recurrent neural networks. En Schuurmans, D. y Wellman, M. (Eds.), Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (AAAI-16), 30 (1), 4311-4312. California: Association for the Advancement of Artificial Intelligence.
  • Rosch, E. (1978). Prototype classification and logical classification: The two systems. En Scholnik, E. (Ed.). New trends in cognitive representation: Challenges to Piaget's theory Hillsdale. 73-86. NJ: Erlbaum.
  • Sordoni, A., Galley, M., Auli, M., Brockett, C., Ji, Y., Mitchell, M., Nie, J.Y., Gao, J. y Dolan, B. (2015). A neural network approach to context-sensitive generation of conversational responses. En Mihalcea, R., Chai, J. y Sarkar, A. (Eds.), Human Language Technologies: The 2015 Annual Conference of the North American Chapter of the ACL, 2015, Denver, Association for Computational Linguistics, 196–205.
  • Spohr, D. (2011). A Multi-layer Architecture for “Pluri-Monofunctional” Dictionaries. En Fuertes-Olivera, P. A. y Bergenholtz, H. (Eds.), E-Lexicography: The Internet, Digital Initiatives and Lexicography, 103-120. Londres: Continuum. DOI: https://doi.org./10.5040/9781474211833.ch-005
  • Trap-Jensen, L. (2018). Lexicography between NLP and Linguistics: Aspects of Theory and Practice. En Čibej, J., Gorjanc, V., Kosem, I. y Krek, S. (Eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts,25-37. Ljubljana: Ljubljana University Press. https://euralex.org/wp-content/themes/euralex/proceedings/Euralex%202018/118-4-2949-1-10-20180820.pdf
  • Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En Domínguez Vázquez, M.J. y Kutscher, S. (Eds.), Interacción entre gramática, didáctica y lexicografía, 193-207. Berlin/Boston: de Gruyter. DOI: https://doi.org/10.1515/9783110420784-015
  • Wolfer, S., Bartz, T., Weber, T., Abel, A., Meyer, C.M., Müller-Spitzer, C y Storrer, A. (2016). The Effectiveness of Lexicographic Tools for Optimising Written L1-Texts. En International Journal of Lexicography, 31 (1), 1-28. DOI: https://doi.org/10.1093/ijl/ecw038
  • Villa Vigoni-Thesen, V. (2018). Wörterbücher für die Zukunft – Die Zukunft der Wörterbücher. Herausforderungen an die Lexikografie in einer digitalen Gesellschaft. https://www.emlex.phil.fau.de/andere-publikationen/
  • Xera = Domínguez Vázquez, M. J. (Dir.), Valcárcel Riveiro, C, Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. y Pino Serrano, L. (2021) (2020). Xera. Prototipo online para la generación automática monoargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario
  • XeraWord = Domínguez Vázquez, M.J. (Dir.), Bardanca Outeiriño, D., Caíña Hurtado, M., Gómez Guinovart, X., Iglesias Allones, J.vL., Simões, A., Valcárcel Riveiro, C., Álvarez de la Granja, M. y Cidrás Escaneo, F.A. (2020). XeraWord. Prototipo de xeración automática da argumentación da frase nominal en galego e portugués. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.gal/xeraword/