• español
    • English
  • English 
    • español
    • English
  • Login
View Item 
  •   RIO Home
  • PUBLICACIONES UPO
  • Revistas UPO
  • Revista de Métodos Cuantitativos para la Economía y la Empresa
  • RevMetCuant Vol. 17 (2014)
  • View Item
  •   RIO Home
  • PUBLICACIONES UPO
  • Revistas UPO
  • Revista de Métodos Cuantitativos para la Economía y la Empresa
  • RevMetCuant Vol. 17 (2014)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Comparison of Imputation Methods for Handling Missing Categorical Data with Univariate Pattern // Una comparación de métodos de imputación de variables categóricas con patrón univariado

View/Open
2196-6823-1-SM.pdf (945.5Kb)
URI
http://hdl.handle.net/10433/3615
Export
RefworksMendeleyEndNote
Share
Statistics
View Usage Statistics
Metadata
Show full item record
Authorship
Torres Munguía, Juan Armando
Palabras clave
Imputation methods
hot-deck
polytomous regression
random forests
smoking habits
missing categorical data
Publication date
2014
Abstract
This paper examines the sample proportions estimates in the presence of univariate missing categorical data. A database about smoking habits (2011 National Addiction Survey of Mexico) was used to create simulated yet realistic datasets at rates 5% and 15% of missingness, each for MCAR, MAR and MNAR mechanisms. Then the performance of six methods for addressing missingness is evaluated: listwise, mode imputation, random imputation, hot-deck, imputation by polytomous regression and random forests. Results showed that the most effective methods for dealing with missing categorical data in most of the scenarios assessed in this paper were hot-deck and polytomous regression approaches.------------------------------------El presente estudio examina la estimación de proporciones muestrales en la presencia de valores faltantes en una variable categórica. Se utiliza una encuesta de consumo de tabaco (Encuesta Nacional de Adicciones de México 2011) para crear bases de datos simuladas pero re ...
This paper examines the sample proportions estimates in the presence of univariate missing categorical data. A database about smoking habits (2011 National Addiction Survey of Mexico) was used to create simulated yet realistic datasets at rates 5% and 15% of missingness, each for MCAR, MAR and MNAR mechanisms. Then the performance of six methods for addressing missingness is evaluated: listwise, mode imputation, random imputation, hot-deck, imputation by polytomous regression and random forests. Results showed that the most effective methods for dealing with missing categorical data in most of the scenarios assessed in this paper were hot-deck and polytomous regression approaches.------------------------------------El presente estudio examina la estimación de proporciones muestrales en la presencia de valores faltantes en una variable categórica. Se utiliza una encuesta de consumo de tabaco (Encuesta Nacional de Adicciones de México 2011) para crear bases de datos simuladas pero reales con 5% y 15% de valores perdidos para cada mecanismo de no respuesta MCAR, MAR y MNAR. Se evalúa el desempeño de seis métodos para tratar la falta de respuesta: listwise, imputación de moda, imputación aleatoria, hot-deck, imputación por regresión politómica y árboles de clasificación. Los resultados de las simulaciones indican que los métodos más efectivos para el tratamiento de la no respuesta en variables categóricas, bajo los escenarios simulados, son hot-deck y la regresión politómica.
Collections
  • RevMetCuant Vol. 17 (2014) [7]

BIBLIOTECA CRAI  ©  2015 Universidad Pablo de Olavide
Contact Us | Legal warning
 

 

Browse

All of RIOCommunities and CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Of interest

HelpFaqDeposit documentsPoliciesCopyrightRegulation

BIBLIOTECA CRAI  ©  2015 Universidad Pablo de Olavide
Contact Us | Legal warning