Cechy artykułów oraz metody ich ekstrakcji na potrzeby oceny jakości informacji w Wikipedii

Włodzimierz Lewoniewski , Krzysztof Węcel

Abstract

Th is article presents and classifi es features that can be extracted from Wikipedia articles for the purpose of automatic information quality assessment. Based on a state of the art analysis and our own experiments, specifi c measures for various aspects of quality have been defi ned. Additionally, an extraction method for various sources of features has been proposed. Th e links between articles in various languages off er opportunities for the comparison and verifi cation of the quality of information delivered by wikipedians. Th e elaborated model can be used for the relative quality assessment of data contained in the structural parts of Wikipedia articles, namely info boxes.
Author Włodzimierz Lewoniewski (WIiGE / KIE)
Włodzimierz Lewoniewski,,
- Department of Information Systems
, Krzysztof Węcel (WIiGE / KIE)
Krzysztof Węcel,,
- Department of Information Systems
Other language title versionsFeatures of Wikipedia Articles and Their Extraction Methods for Automatic Information Quality Assessment
Journal seriesStudia Oeconomica Posnaniensia, ISSN 2300-5254, e-ISSN 2449-9099, (B 10 pkt)
Issue year2017
Vol5
No12
Pages92-106
Publication size in sheets0.7
Keywords in PolishWikipedia, DBpedia, jakość informacji, jakość danych, WikiRank
Keywords in EnglishWikipedia, DBpedia, quality of information, quality of data, WikiRank
Abstract in PolishCelem artykułu jest przedstawienie i klasyfi kacja cech pozwalających na automatyczną ocenę jakości informacji zawartych w artykułach w Wikipedii. Na podstawie analizy literatury oraz własnych doświadczeń określono miary związane z artykułami, opisujące różne aspekty jakości. Dodatkowo zostały zaproponowane metody ekstrakcji cech służących do wyliczania miar jakości. Powiązania między artykułami w różnych językach stwarzają szanse w zakresie porównania i weryfi kacji jakości informacji dostarczanych przez wikipedystów. Opracowany model może zatem znaleźć zastosowanie przy względnej ocenie jakości danych zawartych w strukturalnych częściach artykułów, tzw. infoboksach
DOIDOI:10.18559/SOEP.2017.12.7
URL http://www.soep.ue.poznan.pl/New_SOEP_site/jdownloads/Wszystkie%20numery/Rok%202017/07_lewoniewski_wecel.pdf
Languagepl polski
File
07_lewoniewski_wecel.pdf 683.44 KB
Score (nominal)10
ScoreMinisterial score = 10.0, 07-10-2019, ArticleFromJournal
Citation count*2 (2020-07-09)
Additional fields
Tytuł numeruMetody, techniki, technologie przetwarzania i analizy Big Data dla potrzeb kreowania inteligentnej gospodarki i administracji
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?