Kompletność danych o produktach w infoboksach różnych wersji językowych Wikipedii

Włodzimierz Lewoniewski , Aleksandra Kasprzak , Krzysztof Węcel , Witold Abramowicz

Abstract

Wikipedia is currently one of the most popular sources of knowledge. Many articles in this multilingual encyclopaedia contain information about different products, such as cars, movies, computer games or mobile phones. Articles about these goods can be edited independently in various languages, and differences in the content added by users (including anonymous ones) can be observed. An article usually contains an infobox, which in a concise way presents the most important facts from the article. Readers can use infoboxes to get the most important information about a product without analysing the content of the entire article. Additionally, data extracted from an infobox can be used to enrich other popular databases, such as DBpedia. For this reason, it is particularly important to verify the data quality provided by users, where quality can be characterized by metrics such as timeliness, correctness and completeness. This paper examines the completeness of product data from various groups from different language versions of Wikipedia. The results of the study can be applied in practice to enrich information about products.
Author Włodzimierz Lewoniewski (WIiGE / KIE)
Włodzimierz Lewoniewski,,
- Department of Information Systems
, Aleksandra Kasprzak (PUEB)
Aleksandra Kasprzak,,
- Poznań University of Economics and Business
, Krzysztof Węcel (WIiGE / KIE)
Krzysztof Węcel,,
- Department of Information Systems
, Witold Abramowicz (WIiGE / KIE)
Witold Abramowicz,,
- Department of Information Systems
Other language title versionsThe Completeness of Product Data in Infoboxes in Different Language Versions of Wikipedia
Journal seriesStudia Oeconomica Posnaniensia, ISSN 2300-5254, e-ISSN 2449-9099, (B 10 pkt)
Issue year2018
Vol6
No9
Pages39-58
Publication size in sheets0.95
Keywords in PolishWikipedia, DBpedia, jakość danych, infoboks, kompletność, opis produktu
Keywords in EnglishWikipedia, DBpedia, data quality, infobox, completeness, product
Abstract in PolishWikipedia jest obecnie jednym z najpopularniejszych źródeł wiedzy. Wiele artykułów tej wielojęzycznej encyklopedii zawiera informacje o różnego rodzaju produktach, np. samochodach, filmach, grach komputerowych, telefonach komórkowych. Artykuły o każdym z tych dóbr mogą powstawać niezależnie w różnych językach, w związku z czym można zaobserwować różnice w treściach opracowań poszczególnych użytkowników (w tym anonimowych). Często w artykułach umieszcza się wyróżnioną ramkę, która w przejrzysty sposób ma prezentować najważniejsze informacje o podmiocie artykułu, tzw. infoboks. Czytelnicy korzystają z takich ramek, aby uzyskać najważniejsze informacje o produkcie bez analizy treści całego artykułu. Dodatkowo dane z infoboksów mogą służyć do wzbogacania innych popularnych baz danych, takich jak np. DBpedia. Z tego powodu szczególnie istotna jest weryfikacja jakości wprowadzanych przez użytkowników danych, gdzie jakość może być charakteryzowana przez takie miary, jak aktualność, poprawność i kompletność. W niniejszym artykule zostanie przeprowadzona analiza kompletności danych o produktach z różnych grup, pochodzących z różnych wersji językowych Wikipedii. Wyniki badań mogą znaleźć zastosowanie w praktyce do wzbogacenia informacji o produktach.
DOIDOI:10.18559/SOEP.2018.9.3
URL http://soep.ue.poznan.pl/New_SOEP_site/jdownloads/Wszystkie%20numery/Rok%202018/03_lewoniewski_kasprzak_wecel_abramowicz.pdf
Languagepl polski
File
03_lewoniewski_kasprzak_wecel_abramowicz.pdf 1.24 MB
Score (nominal)10
Score sourcejournalList
ScoreMinisterial score = 10.0, 11-09-2020, ArticleFromJournal
Citation count*1 (2020-09-16)
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?