Encuestasmetodología

Artículo sobre la mejora de las estimaciones con la combinación de muestras probabilísticas y no probabilísticas

Los investigadores del Grupo de Diseño y Análisis Estadístico de Encuestas por Muestreo (FQM-365) de la Universidad de Granada en colaboración con nuestra compañera Sara Pasadas del Amo (en la imagen), han pubilicado un artículo en el que  proponen una metodología para combinar muestras de encuestas web probabilísticas y no probabilísticas con la ayuda de técnicas de aprendizaje automático y evalúa la eficiencia de las estimaciones resultantes comparándolas con otras estrategias que se han utilizado anteriormente. El artículo, denominado Enhancing estimation methods for integrating probability and nonprobability survey samples with machine‐learning techniques. An application to a Survey on the impact of the COVID‐19 pandemic in Spain,  se ha publicado en la revista Biometrical Journal y es de acceso libre.

Las encuestas web han sustituido a las entrevistas presenciales y telefónicas asistidas por ordenador (CATI) como principal modo de recogida de datos en la mayoría de los países. Esta tendencia se ha reforzado como consecuencia de las restricciones relacionadas con la pandemia COVID-19. Sin embargo, esta modalidad sigue teniendo importantes limitaciones para obtener muestras probabilísticas de la población general. Por esta razón, la mayoría de las encuestas web se basan en diseños de encuestas no probabilísticas, lo que requiere generar herramientas para mejorar las estimaciones combinándolos con métodos probabilisticos

En este caso se han utilizado parte de los datos de la segunda ola de la Encuesta sobre el impacto de la pandemia de COVID-19 en España (ESPACOV), diseñada y financiada por el IESA-CSIC y que empleó una combinación de métodos probabilísticos (invitación por SMS) y no probabilísticos (anuncios en redes sociales) para seleccionar su muestra. El estudio de simulación y la aplicación del método de estimación propuesto a esta encuesta permiten concluir que ésta es la mejor opción para reducir los sesgos observados en nuestros datos.

Muestra más
Close