Journal or Publication Title:
Date of publication:
Number:
ISSN:
Official URL:
Additional Information:
Ադամյան Գարիկ Լ., Адамян Гарик Л.
Title:
Comparison of Model-Free Algorithms For Clustering GARCH Processes
Other title:
GARCH պրոցեսների կլաստերիզացիայի համար մոդեների ցանկ ախալգորիթմների համեմատություն ; Сравнение безмодельных алгоритмов кластеризации GARCH-процессов
Creator:
Corporate Creators:
Yerevan State University (YSU)
Subject:
Mathematical cybernetics ; Computer science
Uncontrolled Keywords:
GARCH process ; time series clustering ; dynamic time warping ; K-Means ; K-Shape
Coverage:
Abstract:
In this paper, we evaluate several model-free algorithms for clustering time seriesdatasets generated by GARCH processes. In extensive experiments, we generatesynthetic datasets in different scenarios. Then, we compare K-Means (for Euclidian anddynamic time warping distance), K-Shape, and Kernel K-Means models with differentclustering metrics. Several experiments show that the K-Means model with dynamictime warping distance archives comparably better results. However, the consideredmodels have significant shortcomings in improving the clustering accuracy when theamount of information (the minimum length of the time series) increases, and inperforming accurate clustering when data is unbalanced or clusters are overlapping.
Հոդվածում մենք գնահատում ենք մի քանի մոդելներից անկախ կլաստերիզացիայի ալգորիթմների GARCH պրոցեսներով գեներացված ժամանակային շարքերի տվյալների կլաստերավորման ունակությունը: Լայնածավալ փորձերի ընթացքում մենք գեներացնում ենք սինթետիկ տվյալների հավաքածուներ տարμեր սցենարներով: Այնուհետև, մենք համեմատում ենք K-Means մոդելները (Էվկլիդեսյան և ժամանակի դինամիկ փոխակերպման մետրիկաներով), K-Shape և Kernel K-Means մոդելների տարբեր կլաստերային չափիչներով: Մի քանի փորձերը ցույց են տալիս, որ K-Means մոդելը ժամանակի դինամիկ փոխակերպման մետրիկայով ցույց է տալիս համեմատաμար ավելի լավ արդյունքներ: Այնուամենայնիվ, դիտարկված մոդելներն ունեն զգալի թերություններ ինֆորմացիայի (ժամանակային շարքի նվազագույն երկարությունը) քանակի ավելացման հետ կլաստերավորման ճշգրտության բարձրացման հետ կապված, ինչպես նաև տվյալների անհավասարակշռության կամ կլաստերի համընկնման դեպքում ճշգրիտ կլաստերավորում իրականացնելու հարցում:
В этой статье мы оцениваем некоторые безмодельные алгоритмы кластеризации наборов данных временных рядов, сгенерированных GARCH процессами. В обширных экспериментах мы генерируем синтетические наборы данных для различных сценариях. Затем мы сравниваем модели K-Means (с метриками евклидовой и динамической трансформации временной шкалы), модели KShape и Kernel K-Means с различными метриками кластеризации. Несколько экспериментов показывают, что модель K-Means с метрикой динамической трансформации временной шкалы дает сравнительно лучшие результаты. Однако рассмотренные модели имеют существенные недостатки в повышении точности кластеризации при увеличении количества информации (минимальной длины временного ряда), а также при несбалансированности данных или перекрытии кластеров.