Journal or Publication Title:
Date of publication:
Volume:
ISSN:
Official URL:
Additional Information:
Քարամյան Դավիթ Ս., Карамян Давид С.
Title:
Cardinality Estimation of an SQL Query Using Recursive Neural Networks
Other title:
Հարցման հզորության մոտարկումը ռեկուրսիվ նեյրոնային ցանցերի միջոցով ; Оценка мощности SQL-запроса с помощью рекурсивных нейронных сетей
Creator:
Subject:
Mathematical cybernetics ; Computer science
Uncontrolled Keywords:
Recursive neural networks ; Representation learning ; Cardinality estimation ; Complex logical expressions
Coverage:
Abstract:
To learn complex interactions between predicates and accurately estimate the cardinality of an SQL query, we develop a novel framework based on recursive tree-structured neural networks, which take into account the natural properties of logical expressions: compositionality and n-ary associativity. The proposed architecture is an extension of MSCN (multi-set convolutional network) for queries containing both conjunction and disjunction operators. The goal is to represent an arbitrary logical expression in a continuous vector space by combining sub-expression vectors according to the operator type. We compared the proposed approach with the histogram-based approach on the real-world dataset and showed that our approach significantly outperforms histograms with a large margin. Պրեդիկատների միջև բարդ կապերը սովորելու և Էս-Քյու-Էլ հարցումների հզորությունը ճշգրիտ գնահատելու համար առաջարկվում է նոր մոտեցում, որը հիմնված է ռեկուրսիվ նեյրոնային ցանցերի վրա, որոնք հաշվի են առնում տրամաբանական արտահայտությունների բնական հատկությունները, բաղադրականությունը և ասոցիատիվությունը: Առաջարկվող ճարտարապետությունը MSCN-ի (Multi-Set Convolutional Network) ընդլայնումն է դիզունկցիա և կոնյուկցիա օպերատորներ պարունակող հարցումների համար: Նպատակն է ներկայացնել կամայական տրամաբանական արտահայտություն անընդհատ վեկտորային տարածության մեջ` համատեղելով ենթաարտահայտություների վեկտորները` ըստ օպերատորի տեսակի: Առաջարկվող մոտեցումը համեմատվել է հիստոգրամային մոտեցման հետ և ցույց է տրվել, որ այն զգալիորեն գերազանցում է հիստոգրամային մոտեցմանը: Чтобы изучить сложные взаимодействия между предикатами и точно оценить мощность SQL-запроса, была сконструирована новая структура, основанная на рекурсивных нейронных сетях с древовидной архитектурой, которые учитывают естественные свойства логических выражений: композиционность и n-арную ассоциативность. Предлагаемая архитектура является расширением MSCN(MultiSet Convolutional Network) для запросов, содержащих операторы конъюнкции и дизъюнкции. Цель состоит в том, чтобы представить произвольное логическое выражение в непрерывном векторном пространстве путем объединения векторов подвыражений в соответствии с типом оператора. Предлагаемый подход был сравнен с подходом, основанным на гистограммах, на реальном наборе данных и было показано, что предложенный подход значительно превосходит гистограммы.