Հրատարակվում է 2015 թվականից։ Լույս է տեսնում տարին երկու անգամ
Բանբեր Հայաստանի գրադարանների=Bulletin of Armenian Libraries
Видал-Горен Шаан, Վիդալ-Գորեն Շահան
OCR и HTR технологии и сохранение армянского наследия ; OCR և HTR տեխնոլոգիաները և հայկական ժառանգության պահպանությունը
Character recognition is the task that automatically converts a scanned document into a searchable text format. A distinction is made between OCR (Optical Character Recognition) for printed documents and HTR (Handwritten Text Recognition) for handwritten documents. The objective of these steps is to provide a searchable and editable version of a document. These technologies meet the needs of institutions involved in the massive digitization of their collections, and strengthen the accessibility of documents and their preservation. Although the issue of OCR for printed documents remains a task considered to be largely resolved, including for Armenian, with a wide variety of software such as Abbyy Fine Reader26 (paid software), Tesseract 27 (free and open source) or Calfa28 (paid service) that can reach a character error rate (CER) of less than 1%, the recognition of manuscripts or historical documents remains an open research problem. The great variability of handwriting, the philological questions inherent to the transcription of documents, the degradation of documents (damaged printed materials, old printed matter or damaged manuscripts), the inconsistency of layouts or the quality of digitizations are all issues to be overcome, and that limit the development of generic models of recognition.
Օպտիկական տառաճանաչումը (OCR) և ձեռագիր տեքստի ճանաչումը (HTR) այժմ պատրաստ են գործարկման հայերենի համար։ Այս տեխնոլոգիան կարող է ապահովել փաստաթղթերի ավելի բարձր արժևորում՝ ապահովելով բարելավված հասանելիություն, օգտագործելով, օրինակ, բանալի բառերով որոնում և կարող է թելադրել թվային գրադարանների նոր մարտահրավերներ։ Զեկուցման նպատակն է, ներկայացնելով հայոց լեզվով տեքստերի ճանաչման գործընթացի ժամանակ առաջացած մարտահրավերները, ցույց տալ ժամանակակից հնարավորությունները: Շեշտադրումն արվելու է ձեռագիր արխիվի, հնագույն ձեռագրերի և հնատիպ գրքերի համար Կալֆայի կողմից մշակված տեխնոլոգիային։ Մենք կներկայացնենք մեր մեկնաբանությունները երեք ընթացիկ նախագծերի՝ Վենետիկի Մխիթարյան միաբանության հայկական ձեռագրերի գրացուցակի, ՀՀ ԳԱԱ հիմնարար գրադարանի թերթերի, Մխիթարյան միաբանության անդամների հայկական նամակների վերամշակման վերաբերյալ։ Կալֆայի կողմից կիրառվող մեթոդաբանությունն ապահովում է ձեռագիր փաստաթղթերի առավել քան 98%-ի և տպագիր փաստաթղթերի առավել քան 99,9%-ի ճշգրտությունը։
oai:arar.sci.am:370148
Feb 16, 2024
Feb 15, 2024
12
https://arar.sci.am/publication/399940
Հրատարակութեան անունը | Թուական |
---|---|
Vidal-Gorène, Chahan, OCR / HTR Technologies and Armenian Heritage Preservation | Feb 16, 2024 |
Zargaryan, Tigran Astsatryan, Hrachya Mateusz Matela
Ktoyan, Armen Manukyan, Elena Shirinyan, Anush Matinyan, Anna Harutyunyan, Mariam Barseghyan, Anush
Սաւալանեան, Տիգրան Թումայի 1821-1896 [հիմնադիր խմբագիր՝ 1866-1867] Մուրատեան, Մելքիսեդեկ վրդ. (Գարեգին), 1836-1903 [խմբ.՝ 1867-1875] Սահակ Բ Կաթողիկոս Խապայեան, 1849-1939 [խմբ.՝ 1875-1877] Բաբգէն Կաթողիկոս Կիւլէսէրեան, 1868-1936 [խմբ.՝ 1927-1930] Ներսոյեան, Տիրան արք․, 1904-1989 [խմբ.՝ 1930-1931] Գուշակեան, Թորգոմ արք․, 1874-1939 [խմբ.՝ 1932-1939] Տէրտէրեան, Եղիշէ արք․, 1910-1990 [խմբ.՝ 1939-1990] Մանուկեան, Թորգոմ արք․, 1919-2012 [խմբ.՝ 1990-2008] Պուրճէքեան, Բագրատ վրդ․, 1969- [խմբ.՝ 2012-2013] Գոճայեան, Մինաս, 1946- [խմբ.՝ 2014-2017] Ալոյեան, Ներսեհ աբեղա, 1987- [խմբ.՝ 2018-]
Աննա Հունանյան Անդրեա Կարտենի
Mikayelyan, G. A. Paronyan, G. M. Azatyan, N. M. Kostandyan, G. R. Samsonyan, A. L. Andreasyan, H. R. Abrahamyan, H. V. Andreasyan, D. H. Suqiasyan, A. G. Mickaelian, A. M.
Mickaelian, A. M. Sargsyan, L. A. Mikayelyan, G. A. Gigoyan, K. S. Nesc, R. Rossi, C.
Mickaelian, A. M. Gigoyan, K. S. Mikayelyan, G. A. Paronyan, G. M. Gyulzadyan, M. V. Kostandyan, G. R.