dc.contributor.author | Torres Munguía, Juan Armando | |
dc.date.accessioned | 2017-03-16T12:37:23Z | |
dc.date.available | 2017-03-16T12:37:23Z | |
dc.date.issued | 2014 | |
dc.identifier.citation | Revista de Métodos Cuantitativos para la Economía y la Empresa | |
dc.identifier.uri | http://hdl.handle.net/10433/3615 | |
dc.description.abstract | This paper examines the sample proportions estimates in the presence of univariate missing categorical data. A database about smoking habits (2011 National Addiction Survey of Mexico) was used to create simulated yet realistic datasets at rates 5% and 15% of missingness, each for MCAR, MAR and MNAR mechanisms. Then the performance of six methods for addressing missingness is evaluated: listwise, mode imputation, random imputation, hot-deck, imputation by polytomous regression and random forests. Results showed that the most effective methods for dealing with missing categorical data in most of the scenarios assessed in this paper were hot-deck and polytomous regression approaches.------------------------------------El presente estudio examina la estimación de proporciones muestrales en la presencia de valores faltantes en una variable categórica. Se utiliza una encuesta de consumo de tabaco (Encuesta Nacional de Adicciones de México 2011) para crear bases de datos simuladas pero reales con 5% y 15% de valores perdidos para cada mecanismo de no respuesta MCAR, MAR y MNAR. Se evalúa el desempeño de seis métodos para tratar la falta de respuesta: listwise, imputación de moda, imputación aleatoria, hot-deck, imputación por regresión politómica y árboles de clasificación. Los resultados de las simulaciones indican que los métodos más efectivos para el tratamiento de la no respuesta en variables categóricas, bajo los escenarios simulados, son hot-deck y la regresión politómica. | |
dc.format.mimetype | application/pdf | |
dc.language.iso | en | |
dc.publisher | https://www.upo.es/emch/portada | |
dc.relation.publisherversion | http://www.upo.es/revistas/index.php/RevMetCuant/article/view/2196 | |
dc.rights | Copyright (c) 2014 Revista de Métodos Cuantitativos para la Economía y la Empresa | |
dc.subject | Imputation methods | |
dc.subject | hot-deck | |
dc.subject | polytomous regression | |
dc.subject | random forests | |
dc.subject | smoking habits | |
dc.subject | missing categorical data | |
dc.title | Comparison of Imputation Methods for Handling Missing Categorical Data with Univariate Pattern // Una comparación de métodos de imputación de variables categóricas con patrón univariado | |
dc.type | info:eu-repo/semantics/article | |
dc.description.version | Artículo revisado por pares | |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | |