10.11 Inicialesy Reparametrización

Iniciales en Stan

Las siguientes recomendaciones de iniciales son de los desarrolladores de Stan, puedes leer más en https://github.com/stan-dev/stan/wiki/Prior-Choice-Recommendations.

Podemos clasificar las iniciales en 5 niveles de acuerdo a que tan informativas son:

  1. Iniciales planas: usualmente impropias.
  2. Muy vagas pero propias: \(N(0, (1e6) ^ 2)\).
  3. Iniciales genéricas muy debilmente informativas: \(Normal(0, 10^2)\).
  4. Iniciales genéricas debilmente informativas: \(Normal(0, 1)\).
  5. Iniciales específicas e informativas: \(Normal(0.4, 0.2^2)\)

Cuando se usa Stan tenemos los siguientes principios generales:

  • En Stan no importa usar conjugadas (cuando se usan muestreadores de Gibbs puede ser conveniente usar conjugadas, aquí no).

  • No interesan: invarianza, Jeffreys o entropía.

  • Las iniciales debilmente informativas deben contener suficiente información para regularizar: las iniciales deben dejar fuera valores de los parámetros que no sean razonables, pero no dejar fuera valores que podrían tener sentido.

  • Se prefieren las iniciales debilmente informativas sobre las informativas, esto es porque las consecuencias de perder precisión por elegir una inicial muy débil (comparado con la verdadera distribución poblacional de los parámetros o comparado con conocimiento experto) es menos importante que la ganancia en robustez que se deriva de incluir parte del espacio paramétrico que pueda ser relevante.

  • Cuando se usen distribuciones iniciales informativas se debe ser explícito en porque se tomaron las decisiones.

  • No utilices iniciales uniformes, o en general no restrinjas el espacio paramétrico, a menos que las fronteras representen restricciones verdaderas (por ejemplo parámetros de escala restringidos a los positivos, o correlaciones entre el -1 y el 1). Algunos ejemplos:
    • Si crees que un parámetro se ubica entre el cero y el un, en lugar de usar Uniforme(0,1), intenta Normal(0.5, 0.5).
    • Un parámetro de escala esta restringido a ser positivo y quieres una inicial vaga, propones Uniforme(0,100) (o Uniforme(0,1000), es mejor no especificar inicial, que en Stan equivale a una inicial uniforme no informativa, o usar una Esxponencial con valor esperado 10, o una media-normal(0,10).