Search CORE

4 research outputs found

Popular Ensemble Methods: An Empirical Study

Author: Maclin R.
Opitz D.
Publication venue: 'AI Access Foundation'
Publication date: 01/06/2011
Field of study

An ensemble consists of a set of individually trained classifiers (such as neural networks or decision trees) whose predictions are combined when classifying novel instances. Previous research has shown that an ensemble is often more accurate than any of the single classifiers in the ensemble. Bagging (Breiman, 1996c) and Boosting (Freund and Shapire, 1996; Shapire, 1990) are two relatively new but popular methods for producing ensembles. In this paper we evaluate these methods on 23 data sets using both neural networks and decision trees as our classification algorithm. Our results clearly indicate a number of conclusions. First, while Bagging is almost always more accurate than a single classifier, it is sometimes much less accurate than Boosting. On the other hand, Boosting can create ensembles that are less accurate than a single classifier -- especially when using neural networks. Analysis indicates that the performance of the Boosting methods is dependent on the characteristics of the data set being examined. In fact, further results show that Boosting ensembles may overfit noisy data sets, thus decreasing its performance. Finally, consistent with previous studies, our work suggests that most of the gain in an ensemble's performance comes in the first few classifiers combined; however, relatively large gains can be seen up to 25 classifiers when Boosting decision trees

arXiv.org e-Print Archive

Crossref

Towards Comprehensive Foundations of Computational Intelligence

Author: A Cichocki
A Gifi
A Gutkin
A Hyvärinen
A Konar
A Newell
A Pouget
A Pouget
A Roy
AM Callataÿ de
B Bakker
B Kégl
B Schölkopf
C Giraud-Carrier
C Jones
C Wendelken
CD Manning
CS Ong
D Michie
D Nauck
D Rousseau
D Wolpert
DL Wang
E Bauer
E Pekalska
E Salinas
E Simoncelli
EM Iyoda
F Corbacho
F Crestani
F Schwenker
FR Bach
G Giacinto
G-B Huang
GA Carpenter
GE Hinton
GRG Lanckriet
GS Cree
H Haas
H Leung
H Lodhi
I Guyon
J-P Vert
JA Anderson
JA Anderson
JG Wolff
JH Friedman
JSR Jang
K Grabczewski
K Torkkola
K Tsuda
KP Unnikrishnan
KS Fu
L Goldfarb
L Goldfarb
L Györfi
L Shastri
LI Kuncheva
M Blachnik
M Grochowski
M Kordos
M Leshno
MJ Kearns
MJD Powell
N Chater
N Jankowski
N Kunstman
NI Achieser
O Chapelle
P Dayan
P Matykiewicz
P Smyth
PH Winston
PM Baggenstoss
R Avnimelech
R Hecht-Nielsen
R Raizada
RE Schapire
RF Thompson
RL Gorsuch
RO Duda
RS Sutton
S Anuj
S Deneve
S Grossberg
S Haykin
S Mitra
S Roweis
SF Walker
SJ Russell
SK Pal
T Bilgiç
T Kohonen
T Poggio
T Wieczorek
TG Dietterich
TJ McCabe
TM Cover
V Kecman
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Duch
W Maass
W Shoujue
Y Bengio
Y Bengio
Y Burnod
YH Pao
YJ Lee
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/01/2007
Field of study

Abstract. Although computational intelligence (CI) covers a vast variety of different methods it still lacks an integrative theory. Several proposals for CI foundations are discussed: computing and cognition as compression, meta-learning as search in the space of data models, (dis)similarity based methods providing a framework for such meta-learning, and a more general approach based on chains of transformations. Many useful transformations that extract information from features are discussed. Heterogeneous adaptive systems are presented as particular example of transformation-based systems, and the goal of learning is redefined to facilitate creation of simpler data models. The need to understand data structures leads to techniques for logical and prototype-based rule extraction, and to generation of multiple alternative models, while the need to increase predictive power of adaptive models leads to committees of competent models. Learning from partial observations is a natural extension towards reasoning based on perceptions, and an approach to intuitive solving of such problems is presented. Throughout the paper neurocognitive inspirations are frequently used and are especially important in modeling of the higher cognitive functions. Promising directions such as liquid and laminar computing are identified and many open problems presented.

CiteSeerX

Crossref

Combinación de clasificadores mediante el método boosting. Una aplicación a la predicción del fracaso empresarial en España

Author: Alfaro Cortés Esteban
Publication venue: Ediciones de la Universidad de Castilla-La Mancha
Publication date: 01/01/2005
Field of study

El trabajo que se presenta está estructurado en tres partes. La primera parte comprende del capítulo i al capítulo IV. Tras exponer algunos aspectos generales de los problemas de clasificación, se analizan algunos de los métodos de clasificación individuales más utilizados en la actualidad, destacando sus principales ventajas e inconvenientes. En la segunda parte (capítulos V al VII) se analizan algunos aspectos relacionados con el comportamiento y las propiedades de los clasificadores individuales. En concreto, se plantean las dificultades que pueden surgir debido al uso de los clasificadores individuales, como son la precisión y la estabilidad de los mismos. A continuación, en el capitulo vi, se aborda el estudio de la combinación de clasificadores prestando especial atención al método boosting. Además, se recoge una taxonomía de los métodos de combinación y se introducen también el método bagging y el bosque aleatorio. Por último, se estudian los primeros algoritmos que han dado lugar al desarrollo posterior del método boosting. También se exponen algunas de las modificaciones que se han propuesto al algoritmo adaboost, incluyendo las que sirven para afrontar la existencia de más de dos clases y, para acabar, se analiza cual debe ser el tamaño adecuado de los arboles utilizados en la combinación. En la tercera parte (capítulos 8-10) se proporciona una visión general de la predicción del fallo empresarial, sus antecedentes y estado actual. Además, se elaborara un listado con los ratios financieros que han resultado de mayor utilidad para el pronóstico del fracaso. También se lleva a cabo una descripción de la evolución que han seguido en España las empresas fracasadas. El capitulo IX se centra en la aplicación práctica. Después de recoger brevemente algunas consideraciones teóricas sobre el tratamiento de la información, se realiza un análisis exploratorio de los datos. Además de catorce ratios financieros, se utilizan otras tres variables menos habituales que intentan recoger el tamaño de la empresa, la actividad a la que se dedica y la forma jurídica que presenta. Se coteja el método boosting con los arboles de clasificación, tanto para el caso dicotómico, como cuando se distingue entre tres clases. A continuación se realiza una comparación, algo menos detallada, con otros cinco métodos de clasificación. Posteriormente, se examina la capacidad de los modelos establecidos anteriormente para predecir el fracaso empresarial cuando aumenta la distancia temporal al periodo en que se hace efectivo el fallo. Finalmente, se concluye que boosting mejora los resultados de los arboles de clasificación individuales. Entre las principales aportaciones de este trabajo destacan el uso de una técnica novedosa, el método boosting y la consideración de un concepto de fracaso empresarial más amplio del habitual

Universidad de Castilla-La Mancha: Repositorio Universitario Institucional de Recursos Abiertos (RUIdeRA)

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas