Benchmarking of Databases for Big Data Exploration in the Social Graph Analysis

Krzysztof Węcel , Bartosz Perkowski , Agata Filipowska , Piotr Zwolenkiewicz , Dawid Węckowski

Abstract

In this article we present the results of the benchmarking of various data and knowledge-based systems for use while analysing a big social graph. MySQL, Neo4J, Titan and Virtuoso have been tested on data describing communication events among ca. 7 million users. We have proposed queries regarding the real-world scenarios derived from the requirements analysis of the data owner. Execution time has been measured for basic, aggregation, and networking types of queries. While MySQL was good at queries requiring calculations, Virtuoso outperformed it in graph-related queries.
Author Krzysztof Węcel (WIiGE / KIE)
Krzysztof Węcel,,
- Department of Information Systems
, Bartosz Perkowski (WIiGE / KIE)
Bartosz Perkowski,,
- Department of Information Systems
, Agata Filipowska (WIiGE / KIE)
Agata Filipowska,,
- Department of Information Systems
, Piotr Zwolenkiewicz (UEP)
Piotr Zwolenkiewicz,,
- Poznań University of Economics and Business
, Dawid Węckowski (WIiGE / KIE)
Dawid Węckowski,,
- Department of Information Systems
Other language title versionsBadanie wydajności baz danych na potrzeby eksploracji dużych sieci społecznych
Journal seriesStudia Oeconomica Posnaniensia, ISSN 2300-5254, e-ISSN 2449-9099, (B 10 pkt)
Issue year2017
Vol5
No12
Pages5-21
Publication size in sheets0.8
Keywords in Polishbenchmarking, bazy grafowe, MySQL, Neo4J, Titan, Virtuoso
Keywords in Englishbenchmarking, graph data, MySQL, Neo4J, Titan, Virtuoso
Abstract in PolishW niniejszym artykule prezentujemy wyniki benchmarkingu różnych systemów baz danych potencjalnie użytecznych przy analizie dużych sieci społecznych. Wykorzystując dane o zdarzeniach komunikacyjnych pomiędzy 7 milionami użytkowników, porównywaliśmy następujące rozwiązania: MySQL, Neo4J, Titan oraz Virtuoso. Zaproponowaliśmy przykładowe zapytania odpowiadające rzeczywistym scenariuszom wynikającym z analizy wymagań właściciela danych. Czasy odpowiedzi były mierzone w grupach zapytań podstawowych, agregujących i sieciowych. MySQL najlepiej sprawdził się w zapytaniach wymagających obliczeń, podczas gdy Virtuoso dominował w zapytaniach sieciowych.
DOIDOI:10.18559/SOEP.2017.12.1
URL http://soep.ue.poznan.pl/New_SOEP_site/jdownloads/Wszystkie%20numery/Rok%202017/01_wecel.pdf
Languageen angielski
File
01_wecel.pdf of 08-04-2018
330.19 KB
Score (nominal)10
Score sourcejournalList
ScoreMinisterial score = 10.0, 11-03-2020, ArticleFromJournal
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?