Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition

Chenchen Ding; Chenhui Chu; Fei Cheng; Hao Huang; Nobuaki Minematsu; Qianying Liu; Sadao Kurohashi; Sheng Li; Yuhang Yang; Zhengdong Yang

arxiv: 2204.03855 · v2 · pith:HPNA674Gnew · submitted 2022-04-08 · 📡 eess.AS · cs.CL

Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition

Qianying Liu , Zhuo Gong , Zhengdong Yang , Yuhang Yang , Sheng Li , Chenchen Ding , Nobuaki Minematsu , Hao Huang

show 3 more authors

Fei Cheng Chenhui Chu Sadao Kurohashi

This is my paper

classification 📡 eess.AS cs.CL

keywords low-resourcehierarchicalrecognitionspeechenableslanguagesmultilingualneighboring

0 comments

read the original abstract

Low-resource speech recognition has been long-suffering from insufficient training data. In this paper, we propose an approach that leverages neighboring languages to improve low-resource scenario performance, founded on the hypothesis that similar linguistic units in neighboring languages exhibit comparable term frequency distributions, which enables us to construct a Huffman tree for performing multilingual hierarchical Softmax decoding. This hierarchical structure enables cross-lingual knowledge sharing among similar tokens, thereby enhancing low-resource training outcomes. Empirical analyses demonstrate that our method is effective in improving the accuracy and efficiency of low-resource speech recognition.

This paper has not been read by Pith yet.

Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition

discussion (0)