Publication Details:
Journal or Publication Title:
Գիտական Արցախ=Scientific Artsakh=Научный Арцах
Date of publication:
Number:
ISSN:
Official URL:
www.artsakhlib.am
Additional Information:
Քարամյան Դավիթ, Քարամյան Տիգրան, Карамян Давид, Карамян Тигран
Title:
A Conformer Based Automated Speech Recognition for Armenian Language
Other title:
Կոնֆորմերի վրա հիմնված խոսքի ավտոմատացված ճանաչում հայերենի համար ; Автоматическое распознавание речи на армянском языке на основе конформеров
Creator:
Karamyan, Davit ; Karamyan, Tigran
Subject:
Uncontrolled Keywords:
automated speech recognition ; conformer ; language model ; n-grams ; word error rate ; transfer learning ; NeMo
Abstract:
The article is aimed to represent Armenian automated speech recognition model and its applications in different fields of economy. Because of the lack of Armenian speech corpora, in this article we fine-tuned the voice recognition and text symbol generating parts using a Conformer pre-trained model and a compact Armenian language model. The article focuses the attention of readers on the problem of recognizing human speech and transforming it to a text, especially for non-mainstream languages. The paper is prepared with scientific abstraction and a combined analysis of many recent implementations of the discussed approach. The sources' credibility, relevance and authenticity have been confirmed by their extensive research. As to conclude, though it is pretty challenging to develop ASR model for non-mainstream languages, it was proven that the employment of Conformerbased transformers in conjunction with language models is effective for Armenian speech recognition. It was also proven that the technique employed in this article is applicable for other languages too, with some adjustments.
Հոդվածը նպատակ ունի հանրությանը ներկայացնել խոսքի ավտոմատացված ճանաչման մոդելը հայերենի համար և այդ մոդելի կիրառությունը տնտեսության տարբեր ոլորտներում: Հայերեն խոսքի տվյալների բազայի բացակայության պատճառով հոդվածում կատարելագործել ենք ձայնի ճանաչման և տեքստի սիմվոլների գեներացման մոդելները` օգտագործելով Conformer նախապես «վարժեցված» մոդելը և հայերենի համար ստեղծված կոմպակտ լեզվի մոդելը (LM): Հոդվածն ընթերցողների ուշադրությունը կենտրոնացնում է մարդու խոսքի ճանաչման և խոսքը տեքստի վերածելու խնդրի վրա, հատկապես քիչ տարածված լեզուների համար։ Հոդվածը շարադրված է գիտական վերացարկման և քննարկված մոտեցման վերջին կիրառությունների համակցված վերլուծության հիման վրա: Աղբյուրների արժանահավատությունը, համապատասխանությունը և արդիականությունը ստուգվել են գրականության լայնածավալ հետազոտությունների ընթացքում: Եզրակացությունն այն է, թեև բավականին դժվար է խոսքի ավտոմատացված մոդելի մշակումը քիչ տարածված լեզուների համար, սակայն հոդվածում ապացուցվել է, որ Conformer-ի վրա հիմնված տրանսֆորմեր-մոդելների օգտագործումը լեզվի մոդելների հետ համատեղ արդյունավետ է հայերեն խոսքի ճանաչման համար: Նաև ապացուցվել է, որ այս հոդվածում կիրառված մեթոդը կիրառելի է նաև այլ լեզուների համար՝ որոշակի ճշգրտումներով:
Цель статьи - представить модель распознавания армянской автоматизированной речи и ее применения в различных сферах экономики. Из-за отсутствия армянских речевых данных в этой статье мы доработали части распознавания голоса и генерации текстовых символов, используя предварительно обученную модель Конформер и компактную модель армянского языка. Статья акцентирует внимание на проблеме распознавания человеческой речи и преобразования ее в текст, особенно для неосновных языков. Статья подготовлена с использованием метода научной абстракции и комбинированным анализом многих последних методов реализации обсуждаемого подхода. Надежность, актуальность и подлинность источников подтверждены их объемными исследованиями. В ходе исследования мы пришли к заключению, что, хотя разработать модель распознавания речи для неосновных языков довольно сложно, было доказано, что использование преобразователей на основе Конформеров в сочетании с языковыми моделями эффективно для распознавания армянской речи. Также было доказано, что методика, использованная в этой статье, применима и для других языков, с некоторыми корректировками.
Place of publishing:
Երևան