Նիւթ

Վերնագիր: Compact N-gram Language Models for Armenian

Ամսագրի կամ հրապարակման վերնագիր:

Математические вопросы кибернетики и вычислительной техники=Կիբեռնետիկայի և հաշվողական տեխնիկայի մաթեմատիկական հարցեր=Mathematical problems of computer science

Հրապարակման ամսաթիվ:

2022

Հատոր:

57

ISSN:

2579-2784 ; e-2538-2788

Պաշտոնական URL:


Լրացուցիչ տեղեկություն:

Քարամյան Դավիթ Ս․, Քարամյան Տիգրան Ս., Карамян Давид С., Карамян Тигран С.

Այլ վերնագիր:

Կոմպակտ N-գրամ լեզվի մոդելներ հայերենի համար ; Компактные языковые модели N-грамм для армянского языка

Ամփոփում:

Applications such as speech recognition and machine translation use language models to select the most likely translation among many hypotheses. For on-device applications, inference time and model size are just as important as performance. In thiswork, we explored the fastest family of language models: the N-gram models for the Armenian language. In addition, we researched the impact of pruning and quantization methods on model size reduction. Finally, we used Bye Pair Encoding to builda subword language model. As a result, we obtained a compact (100 MB) subwordlanguage model trained on massive Armenian corpora.

Հրատարակիչ:

Изд-во НАН РА

Ձևաչափ:

pdf

Չափեր:

էջ 30-38

Նույնացուցիչ:

oai:arar.sci.am:323480

Լեզու:

en

Բնօրինակի գտնվելու վայրը:

ՀՀ ԳԱԱ Հիմնարար գիտական գրադարան

Նիւթին հաւաքածոները:

Վերջին անգամ ձեւափոխուած է:

Dec 8, 2023

Մեր գրադարանին մէջ է սկսեալ:

Jul 14, 2022

Նիւթին բովանդակութեան հարուածներուն քանակը:

21

Նիւթին բոլոր հասանելի տարբերակները:

https://arar.sci.am/publication/351118

Ցոյց տուր նկարագրութիւնը RDF ձեւաչափով:

RDF

Ցոյց տուր նկարագրութիւնը OAI-PMH ձեւաչափով։

OAI-PMH

Հրատարակութեան անունը Թուական
Karamyan, Davit S., Compact N-gram Language Models for Armenian Dec 8, 2023

Այս էջը կ'օգտագործէ 'cookie-ներ'։ Յաւելեալ տեղեկատուութիւն