The role of interpretable patterns in deep learning for morphology

We examine the role of character patterns in three tasks: morphological analysis, lemmatization and copy. We use a modified version of the standard sequence-to-sequence model, where the encoder is a pattern matching network. Each pattern scores all possible N character long subwords (substrings) on...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Ács Judit
Kornai András
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2020
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 16
Kulcsszavak:Nyelvészet - számítógép alkalmazása, Morfológia
Online Access:http://acta.bibl.u-szeged.hu/67672
LEADER 01825naa a2200217 i 4500
001 acta67672
005 20221108114920.0
008 200505s2020 hu o 1|| zxx d
020 |a 978-963-306-719-2 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Ács Judit 
245 1 4 |a The role of interpretable patterns in deep learning for morphology  |h [elektronikus dokumentum] /  |c  Ács Judit 
260 |c 2020 
300 |a 171-179 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 16 
520 3 |a We examine the role of character patterns in three tasks: morphological analysis, lemmatization and copy. We use a modified version of the standard sequence-to-sequence model, where the encoder is a pattern matching network. Each pattern scores all possible N character long subwords (substrings) on the source side, and the highest scoring subword’s score is used to initialize the decoder as well as the input to the attention mechanism. This method allows learning which subwords of the input are important for generating the output. By training the models on the same source but different target, we can compare what subwords are important for different tasks and how they relate to each other. We define a similarity metric, a generalized form of the Jaccard similarity, and assign a similarity score to each pair of the three tasks that work on the same source but may differ in target. We examine how these three tasks are related to each other in 12 languages. Our code is publicly available. 
695 |a Nyelvészet - számítógép alkalmazása, Morfológia 
700 0 1 |a Kornai András  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/67672/1/msznykonf_016_171-179.pdf  |z Dokumentum-elérés