Object

Title: A Conformer Based Automated Speech Recognition for Armenian Language

Publication Details:

«Արցախի երիտասարդ գիտնականների և մասնագետների միավորում» (ԱԵԳՄՄ) հասարակական կազմակերպության «Գիտական Արցախ» պարբերականն ընդգրկված է ՀՀ ԲՈԿ-ի կողմից հաստատված «Ատենախոսությունների հիմնական արդյունքների և դրույթների հրատարակման համար ընդունելի գիտական հրատարակությունների» ցանկում: Պարբերականը, որի հիմնադիրը Երևանի պետական համալսարանն է, լույս է տեսնում տարեկան առնվազն 2 անգամ (2020 թվականից՝ տարեկան 4 անգամ):

Journal or Publication Title:

Գիտական Արցախ=Scientific Artsakh=Научный Арцах

Date of publication:

2022

Number:

2 (13)

ISSN:

e-2738-2672 ; 2579-2652

Official URL:

www.artsakhlib.am

Additional Information:

Քարամյան Դավիթ, Քարամյան Տիգրան, Карамян Давид, Карамян Тигран

Other title:

Կոնֆորմերի վրա հիմնված խոսքի ավտոմատացված ճանաչում հայերենի համար ; Автоматическое распознавание речи на армянском языке на основе конформеров

Abstract:

The article is aimed to represent Armenian automated speech recognition model and its applications in different fields of economy. Because of the lack of Armenian speech corpora, in this article we fine-tuned the voice recognition and text symbol generating parts using a Conformer pre-trained model and a compact Armenian language model. The article focuses the attention of readers on the problem of recognizing human speech and transforming it to a text, especially for non-mainstream languages. The paper is prepared with scientific abstraction and a combined analysis of many recent implementations of the discussed approach. The sources' credibility, relevance and authenticity have been confirmed by their extensive research. As to conclude, though it is pretty challenging to develop ASR model for non-mainstream languages, it was proven that the employment of Conformerbased transformers in conjunction with language models is effective for Armenian speech recognition. It was also proven that the technique employed in this article is applicable for other languages too, with some adjustments.
Հոդվածը նպատակ ունի հանրությանը ներկայացնել խոսքի ավտոմատացված ճանաչման մոդելը հայերենի համար և այդ մոդելի կիրառությունը տնտեսության տարբեր ոլորտներում: Հայերեն խոսքի տվյալների բազայի բացակայության պատճառով հոդվածում կատարելագործել ենք ձայնի ճանաչման և տեքստի սիմվոլների գեներացման մոդելները` օգտագործելով Conformer նախապես «վարժեցված» մոդելը և հայերենի համար ստեղծված կոմպակտ լեզվի մոդելը (LM): Հոդվածն ընթերցողների ուշադրությունը կենտրոնացնում է մարդու խոսքի ճանաչման և խոսքը տեքստի վերածելու խնդրի վրա, հատկապես քիչ տարածված լեզուների համար։ Հոդվածը շարադրված է գիտական վերացարկման և քննարկված մոտեցման վերջին կիրառությունների համակցված վերլուծության հիման վրա: Աղբյուրների արժանահավատությունը, համապատասխանությունը և արդիականությունը ստուգվել են գրականության լայնածավալ հետազոտությունների ընթացքում: Եզրակացությունն այն է, թեև բավականին դժվար է խոսքի ավտոմատացված մոդելի մշակումը քիչ տարածված լեզուների համար, սակայն հոդվածում ապացուցվել է, որ Conformer-ի վրա հիմնված տրանսֆորմեր-մոդելների օգտագործումը լեզվի մոդելների հետ համատեղ արդյունավետ է հայերեն խոսքի ճանաչման համար: Նաև ապացուցվել է, որ այս հոդվածում կիրառված մեթոդը կիրառելի է նաև այլ լեզուների համար՝ որոշակի ճշգրտումներով:
Цель статьи - представить модель распознавания армянской автоматизированной речи и ее применения в различных сферах экономики. Из-за отсутствия армянских речевых данных в этой статье мы доработали части распознавания голоса и генерации текстовых символов, используя предварительно обученную модель Конформер и компактную модель армянского языка. Статья акцентирует внимание на проблеме распознавания человеческой речи и преобразования ее в текст, особенно для неосновных языков. Статья подготовлена с использованием метода научной абстракции и комбинированным анализом многих последних методов реализации обсуждаемого подхода. Надежность, актуальность и подлинность источников подтверждены их объемными исследованиями. В ходе исследования мы пришли к заключению, что, хотя разработать модель распознавания речи для неосновных языков довольно сложно, было доказано, что использование преобразователей на основе Конформеров в сочетании с языковыми моделями эффективно для распознавания армянской речи. Также было доказано, что методика, использованная в этой статье, применима и для других языков, с некоторыми корректировками.





Place of publishing:

Երևան

Publisher:

«ԱՐՑԱԽ» հրատ.

Format:

pdf

Extent:

էջ 224-229

Identifier:

oai:arar.sci.am:325415

Language:

en

Object collections:

Last modified:

Nov 27, 2022

In our library since:

Aug 31, 2022

Number of object content hits:

32

All available object's versions:

https://arar.sci.am/publication/353191

Show description in RDF format:

RDF

Show description in OAI-PMH format:

OAI-PMH

Objects

Similar

This page uses 'cookies'. More information