Skip to main content

Թվային հայերեն

(համակարգող՝ Մարատ Յավրումյան) Վիրտուալ (թվանշային) իրականությունը, արհեստական բանականության տարրեր կիրառող «խելացի տեխնոլոգիաները» այսօր մեր կյանքի անբաժան մասն են։ Այս պայմաններում առաջնային է ապահովել հայերենի գործառնությունը որպես լեզու, որն ունակ է սպասարկել վիրտուալ (թվանշային) իրականությունը, թվային տնտեսությունը, թվային հանրային ծառայությունները, թվային մշակույթն ու առօրյան, նաև ստեղծել թվային իրականություն։ Պետք է փաստել, որ չնայած առանձին նախագծերի, հայերենն այսօր համաքայլ չէ լեզուների տեխնոլոգացման արդի միտումներին։ Այս հանգամանքը հայերենը, հայերենով ստեղծված մշակութային ժառանգությունը, հայալեզու իրողություններն անընկալունակ են դարձնում արդի մարտահրավերների նկատմամբ՝ սրանից բխող բոլոր հետևանքներով։ Անցած տարիների բացը լրացնելու և կարճաժամկետ հեռանկարում զարգացման անհրաժեշտ նախադրյալներ ստեղծելու համար առաջարկվում են գործողությունների հետևյալ չորս ուղղությունները.
  1. Ենթակառուցվածքների ստեղծում
  2. Համակարգաստեղծ նախագծեր
  3. Միջպետական լեզվական քաղաքականություն
  4. Կրթական ռեսուրսներ
 
  1. Ենթակառուցվածքների ստեղծում
Երկարաժամկետ հեռանկարում նպատակը լեզվական կենսունակ թվային էկոհամակարգ ունենալն է, որն ի վիճակի է ուրվագծել միտումները, զարգացման ուղղություններ նախանշել, արագ արձագանքել մարտահրավերներին։ Գործնական առումով սա ենթադրում է պետական տարբեր լեզվական ինստիտուտների միավորում մեկ «Հայերենի ակադեմիայի» կամ «Հայերեն լեզվական տեխնոլոգիաների կենտրոնի» կազմում, որը կմեկտեղի գիտահետազոտական և պետական լեզվական քաղաքականության մշակման և իրականացման գործառույթներ։ Միավորումը կարող է լինել ինչպես միասնական գերատեսչական միավոր ստեղծելու, այնպես էլ գործողությունների պետական ծրագիր ընդունելու շրջանակում (հաջողությամբ կարող է տեղայնացվել Էստոնական մոդելը՝ հիմքում ունենալով տնտեսություն թվայնացման առաջնայնությունը)։
  1. Համակարգաստեղծ նախագծեր
Տնտեսության, հանրային ծառայությունների, կրթական, պետական համակարգերի թվային փոխակերպումը ենթադրում է հայերենով շրջանառվող տեղեկատվության նոր, շատ ավելի մեծ մասշտաբներ, կամ՝ հայերենով թվային այլ՝ մինչև այս անհասանելի ընդգրկմամբ և ծավալով տվյալներ։ Նման ծավալի տվյալների մշակման գործիքներ այսօր առաջարկում է «բնական լեզվի մշակման» (NLP) բնագավառը՝ հիմնված 1960-ականներից նախ մաթեմատիկական, ապա հաշվողական (համակարգչային) լեզվաբանության ոլորտների հետազոտությունների վրա։ Առաջարկվող ծրագրերի նպատակը հայերեն տվյալները, բովանդակությունը սպասարկող՝ արհեստական բանականության տարրերով մեքենական գործիք­ների ստեղծումն է, որոնք թույլ կտան կարճաժամկետ հեռանկարում հայերենը տպագրի լեզվից վերածել թվանշային լեզվի.
  • «Հայերենի ազգային ծառադարան» նախագիծ, որը հայերենն ինտեգրում է արհեստական բանականության տարրեր կիրառող լեզուների մեքենական մշակման գլոբալ համակարգերում (Universal Dependencies, StanfordNLP, Spacy.io և այլն).
  • Ngram ազգային համակարգ Ազգային գրադարանի թվայնացրած պարբերական մամուլի հենքով. համակարգը թույլ է տալիս բառազույգերի կիրառման ժամանակագրության, հաճախականության, կոնտեքստի միջոցով վիզուալիզացնել տեքստում արտացոլված իրականությունը. հասարական գիտությունների համար հասանելի դարձնել ժամանակաշրջանի սոցիալական չափումը՝ արտացոլված լեզվում.
  • Տեքստից ձայն (TTS, Text to Speech) և ձայնից տեքստ (STT, Speech to Text) բաց համակարգեր (օր.՝ Mozilla Foundation-ի տեխնիկական հարթակներում).
  • Wiki թվային միջավայրում հայերենի մասնագիտական բառապաշարի և արդի բառամթերքի բառարանագրում։
  1. Միջպետական լեզվական քաղաքականություն
Ստեղծված ենթակառուցվածքները հնարավոր կդարձնեն միջնաժամկետ հեռանկարում գործունեություն ծավալել ԵԱՏՄ շրջանակում։ Մասնագիտական բառամթերքի և տերմինների եռալեզու (հայերեն, ռուսերեն, անգլերեն) շտեմավորման համակարգի, անհրաժեշտ թվային գործիքների (մեքենական մասնագիտական, նեղ ոլորտային թարգմանություններ) ներդրմամբ նախատեսվում է ստեղծել ԵԱՏՄ միջպետական փաստաթղթերի, դասակարգիչների, ստանդարտների, նաև՝ ԵԱՏՄ էլեկտրոնային տարբեր հարթակների լեզվական միջերեսների թարգմանության միասնական էլեկտրոնային միջավայր, այլ կերպ՝ ԵԱՏՄ անդամ պետությունների համար ստանձնել լեզվական պետական քաղաքականության որոշ գործառույթներ (Էստոներեն ինստիտուտի փորձի տեղայնացմամբ)։
  1. Կրթական ռեսուրսներ
Միջնաժամկետ հեռանկարում վերոնշյալ ծրագրերի շուրջ խմբված մարդկային ռեսուրսը թույլ կտա արդիական կրթական մոդուլներ («Հաշվողական լեզվաբանություն», «Բնական լեզվի մշակում», «Թվային գործիքները հումանիտար գիտություններում» և այլն) ներդնել հայաստանյան տարբեր բուհերում (ներառյալ՝ մարզային)։

Կարող է նաև հետաքրքրել ՝