En la Calculadora Salarial que lanza hoy EF, se utilizó un modelo estadístico llamado regresión lineal para conocer cuáles son los factores que explican las diferencias en el salario bruto de los trabajadores costarricenses entre 15 y 65 años (se excluye el ingreso percibido en especie).
Con ese modelo, la Calculadora Salarial permite conocer cuál es el efecto que tiene, independientemente, cada una de las siguientes variables en el sueldo promedio de los costarricenses: edad (experiencia), género, zona de residencia, sector donde se labora, rama en la que se labora, nivel de escolaridad y horas trabajadas semanalmente.
A esa herramienta se puede tener acceso desde elfinancierocr.com, ya sea con su teléfono inteligente o su computadora.
De la Encuesta Nacional de Ingresos y Gastos de los Hogares (Enigh) del INEC, del 2013, se utiliza una muestra de 5.968 personas, que representa a 1,5 millones de trabajadores.
La Enigh es la mejor estimación disponible de los ingresos y gastos de los costarricenses. Utiliza un tipo de muestreo complejo aplicado en cada mes entre octubre de 2012 y septiembre de 2013.
Cabe advertir que la estimación de EF no pretende predecir futuras ganancias, ya que muestra el comportamiento del ingreso monetario del mercado laboral en el 2013.
Además, la Calculadora no pretende acertar el salario exacto de cada usuario, sino presentar el sueldo promedio que paga el mercado laboral a alguien con sus características, para que conozca si su ingreso real se encuentra por encima o por debajo del promedio.
Explicación técnica de la metodología
El lector avanzado en materia estadística puede encontrar valiosos detalles del modelo utilizado en la siguiente explicación:
El diseño muestral de la ENIGH 2013 corresponde a un diseño probabilístico de áreas, estratificado, bietápico y replicado. La base datos utilizada corresponde a la base de personas de la ENIGH 2013. La población de estudio corresponde a la población ocupada entre 15 y 65 años de edad y que reportó un ingreso monetario (asalariados, patronos y trabajadores por cuenta propia).
Se excluye a la población ocupada que no reportó ingresos monetarios, sino únicamente ingresos no monetarios (en especie). La muestra final incluye 5.958 observaciones que representan a 1.529.812 trabajadores.
El modelo utilizado para las estimaciones que proporciona la calculadora se basa en un modelo de regresión Gaussiana con función de enlace identidad, que de acuerdo con los criterios de información de Akaike y Bayesiana ajusta de una mejor manera los datos de la ENIGH que el modelo de regresión Gamma con funciones de enlace identidad o logarítmica.
Como la variable de ingreso muestra una gran asimetría, la transformación de Box Cox sugiere corregir el problema de la heterocedasticidad utilizando el logaritmo natural del ingreso, ya que esta variable es más cercana a la distribución normal.
Fueron realizados análisis de valores extremos (residuos estudentizados externamente, hat values, distancia de Cook, entre otros) para eliminar observaciones que influían de una manera atípica en las estimaciones.
La estimación final del modelo no presenta problemas de multicolinealidad de acuerdo con el factor de inflación de la varianza. Todas las variables utilizadas resultaron estadísticamente significativas, de acuerdo con las pruebas de Wald y de Cociente de Verosimilitud.
El modelo muestra un ajuste de la suma de cuadrados de la regresión del 58,5% con un cuadrado medio de error de 0,65.
El error estándar de las estimaciones de ingreso promedio es lo suficientemente bajo, por lo que se toma la decisión de no presentar los intervalos de confianza de las estimaciones, ya que estos intervalos se alejan entre ¢100 y ¢17mil para las estimaciones inferiores a un millón de colones, y llega hasta los ¢50 mil para las estimaciones superiores a ¢3,5 millones.