Analiza porównawcza wybranych metod szacowania błędu predykcji klasyfikatora

Sergiusz Herman

Abstract

Classification is an algorithm, which assigns studied companies, taking into consideration their attributes, to specific population. An essential part of it is classifier. Its measure of quality is especially predictability, measured by true error rate. The value of this error, due to lack of sufficiently large and independent test set, must be estimated on the basis of available learning set. The aim of this article is to make a review and compare selected methods for estimating the pre-diction error of classifier, constructed with linear discriminant analysis. It was examined if the results of the analysis depends on the sample size and the method of selecting variables for a model. Empirical research was made on example of problem of bankruptcy prediction of join-stock companies in Poland.
Author Sergiusz Herman (WIiGE / KE)
Sergiusz Herman,,
- Department of Econometrics
Other language title versionsComparative Analysis of Selected Methods for Estimating the Prediction Error of Classifier
Journal seriesPrzegląd Statystyczny, ISSN 0033-2372, (B 14 pkt)
Issue year2016
Vol63
No4
Pages449-463
Publication size in sheets0.7
Keywords in Polishbłąd predykcji, walidacja krzyżowa, prosta metoda podziału, wielokrotne repróbkowanie, upadłość przedsiębiorstw, klasyfikacja
Keywords in Englishprediction error, cross-validation, holdout method, bootstrapping, corporate bankruptcy, classification
Abstract in PolishKlasyfikacją nazywamy algorytm postępowania, który przydziela badane obserwacje/obiekty, bazując na ich cechach do określonych populacji. W tym celu konstruowany jest odpowiedni model - klasyfikator. Miarą jego jakości jest przede wszystkim zdolność predykcyjna, mierzona m.in. za pomocą prawdziwego błędu predykcji. Wartość tego błędu, ze względu na brak odpowiednio dużej, niezależnej próby testowej, musi być często szacowana na podstawie dostępnej próby uczącej. Celem artykułu jest dokonanie przeglądu oraz empirycznej analizy porównawczej wybranych metod szacowania błędu predykcji klasyfikatora, skonstruowanego z wykorzystaniem liniowej analizy dyskryminacyjnej. Zbadano, czy wyniki analizy uzależnione są od wielkości próby oraz metody wyboru zmiennych do modelu. Badanie empiryczne zostało przeprowadzone na przykładzie problemu prognozowania upadłości spółek akcyjnych w Polsce.
URL http://keii.ue.wroc.pl/przeglad/Rok%202016/Zeszyt%204/2016_63_4_449-463.pdf
Languagepl polski
Score (nominal)14
Score sourcejournalList
ScoreMinisterial score = 14.0, 18-12-2019, ArticleFromJournal
Ministerial score (2013-2016) = 14.0, 18-12-2019, ArticleFromJournal
Citation count*3 (2020-08-07)
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?