Քարամյան Դավիթ Ս․, Քարամյան Տիգրան Ս., Карамян Давид С., Карамян Тигран С.
Կոմպակտ N-գրամ լեզվի մոդելներ հայերենի համար ; Компактные языковые модели N-грамм для армянского языка
Applications such as speech recognition and machine translation use language models to select the most likely translation among many hypotheses. For on-device applications, inference time and model size are just as important as performance. In thiswork, we explored the fastest family of language models: the N-gram models for the Armenian language. In addition, we researched the impact of pruning and quantization methods on model size reduction. Finally, we used Bye Pair Encoding to builda subword language model. As a result, we obtained a compact (100 MB) subwordlanguage model trained on massive Armenian corpora.
oai:arar.sci.am:323480
ՀՀ ԳԱԱ Հիմնարար գիտական գրադարան
Dec 8, 2023
Jul 14, 2022
20
https://arar.sci.am/publication/351118
Հրատարակության անուն | Ամսաթիվ |
---|---|
Karamyan, Davit S., Compact N-gram Language Models for Armenian | Dec 8, 2023 |
Sargsyan, Shushanik A. Edita G. Gzoyan
Karamyan, Davit S. Kirakosyan, Grigor A. Harutyunyan, Saten A.