Cechy artykułów oraz metody ich ekstrakcji na potrzeby oceny jakości informacji w Wikipedii

Włodzimierz Lewoniewski , Krzysztof Węcel

Abstract

Th is article presents and classifi es features that can be extracted from Wikipedia articles for the purpose of automatic information quality assessment. Based on a state of the art analysis and our own experiments, specifi c measures for various aspects of quality have been defi ned. Additionally, an extraction method for various sources of features has been proposed. Th e links between articles in various languages off er opportunities for the comparison and verifi cation of the quality of information delivered by wikipedians. Th e elaborated model can be used for the relative quality assessment of data contained in the structural parts of Wikipedia articles, namely info boxes.
Autor Włodzimierz Lewoniewski (WIiGE / KIE)
Włodzimierz Lewoniewski
- Katedra Informatyki Ekonomicznej
, Krzysztof Węcel (WIiGE / KIE)
Krzysztof Węcel
- Katedra Informatyki Ekonomicznej
Inne wersje tytułuFeatures of Wikipedia Articles and Their Extraction Methods for Automatic Information Quality Assessment
Tytuł czasopisma/seriiStudia Oeconomica Posnaniensia, ISSN 2300-5254, e-ISSN 2449-9099, (B 10 pkt)
Rok wydania2017
Tom5
Nr12
Paginacja92-106
Objętość publikacji w arkuszach wydawniczych0.7
Słowa kluczowe w języku polskimWikipedia, DBpedia, jakość informacji, jakość danych, WikiRank
Słowa kluczowe w języku angielskimWikipedia, DBpedia, quality of information, quality of data, WikiRank
Streszczenie w języku polskimCelem artykułu jest przedstawienie i klasyfi kacja cech pozwalających na automatyczną ocenę jakości informacji zawartych w artykułach w Wikipedii. Na podstawie analizy literatury oraz własnych doświadczeń określono miary związane z artykułami, opisujące różne aspekty jakości. Dodatkowo zostały zaproponowane metody ekstrakcji cech służących do wyliczania miar jakości. Powiązania między artykułami w różnych językach stwarzają szanse w zakresie porównania i weryfi kacji jakości informacji dostarczanych przez wikipedystów. Opracowany model może zatem znaleźć zastosowanie przy względnej ocenie jakości danych zawartych w strukturalnych częściach artykułów, tzw. infoboksach
DOIDOI:10.18559/SOEP.2017.12.7
URL http://www.soep.ue.poznan.pl/New_SOEP_site/jdownloads/Wszystkie%20numery/Rok%202017/07_lewoniewski_wecel.pdf
Językpl polski
Plik
07_lewoniewski_wecel.pdf 683.44 KB
Punktacja (całkowita)10
PunktacjaPunktacja MNiSW = 10.0, 07-10-2019, ArticleFromJournal
Liczba cytowań*2 (2020-08-03)
Pola dodatkowe
Tytuł numeruMetody, techniki, technologie przetwarzania i analizy Big Data dla potrzeb kreowania inteligentnej gospodarki i administracji
Cytuj
Udostępnij Udostępnij

Pobierz odnośnik do tego rekordu


* Podana liczba cytowań wynika z analizy informacji dostępnych w Internecie i jest zbliżona do wartości obliczanej przy pomocy systemu Publish or Perish.
Powrót
Potwierdzenie
Czy jesteś pewien?