Show simple item record

dc.contributor.authorTorres Munguía, Juan Armando
dc.date.accessioned2017-03-16T12:37:23Z
dc.date.available2017-03-16T12:37:23Z
dc.date.issued2014
dc.identifier.citationRevista de Métodos Cuantitativos para la Economía y la Empresa
dc.identifier.urihttp://hdl.handle.net/10433/3615
dc.description.abstractThis paper examines the sample proportions estimates in the presence of univariate missing categorical data. A database about smoking habits (2011 National Addiction Survey of Mexico) was used to create simulated yet realistic datasets at rates 5% and 15% of missingness, each for MCAR, MAR and MNAR mechanisms. Then the performance of six methods for addressing missingness is evaluated: listwise, mode imputation, random imputation, hot-deck, imputation by polytomous regression and random forests. Results showed that the most effective methods for dealing with missing categorical data in most of the scenarios assessed in this paper were hot-deck and polytomous regression approaches.------------------------------------El presente estudio examina la estimación de proporciones muestrales en la presencia de valores faltantes en una variable categórica. Se utiliza una encuesta de consumo de tabaco (Encuesta Nacional de Adicciones de México 2011) para crear bases de datos simuladas pero reales con 5% y 15% de valores perdidos para cada mecanismo de no respuesta MCAR, MAR y MNAR. Se evalúa el desempeño de seis métodos para tratar la falta de respuesta: listwise, imputación de moda, imputación aleatoria, hot-deck, imputación por regresión politómica y árboles de clasificación. Los resultados de las simulaciones indican que los métodos más efectivos para el tratamiento de la no respuesta en variables categóricas, bajo los escenarios simulados, son hot-deck y la regresión politómica.
dc.format.mimetypeapplication/pdf
dc.language.isoen
dc.publisherhttps://www.upo.es/emch/portada
dc.relation.publisherversionhttp://www.upo.es/revistas/index.php/RevMetCuant/article/view/2196
dc.rightsCopyright (c) 2014 Revista de Métodos Cuantitativos para la Economía y la Empresa
dc.subjectImputation methods
dc.subjecthot-deck
dc.subjectpolytomous regression
dc.subjectrandom forests
dc.subjectsmoking habits
dc.subjectmissing categorical data
dc.titleComparison of Imputation Methods for Handling Missing Categorical Data with Univariate Pattern // Una comparación de métodos de imputación de variables categóricas con patrón univariado
dc.typeinfo:eu-repo/semantics/article
dc.description.versionArtículo revisado por pares
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess


Files in this item

This item appears in the following Collection(s)

Show simple item record