3-Datos Limpios
Entrega: Lunes \(3\) de septiembre.
Descarga los datos aquí.
En la carpeta de arriba encontrarás un archivo de excel (m_013.xls), este archivo contiene información de causas de mortalidad en México entre \(2000\) y \(2008\). Contesta las siguientes preguntas:
- ¿Cuáles son las variables en esta base de datos?
- ¿La tabla de datos cumple con los principios de datos limpios?
¿Qué problemas presenta?
- La información del archivo de excel se ha guardado también en archivos de
texto (csv) \(2001-2008\), lee y limpia los datos para que cumplan los principios de
datos limpios. Recuerda que las modificaciones deben de ser reproducibles, para
esto guarda tu trabajo en un script.
- El archivo de excel indice_marginacion.xlsx contiene el índice por entidad para los años \(2000\) y \(2010\). Realiza una gráfica donde compares la marginación por entidad con las tasas de mortalidad correspondientes al \(2000\). Deberás unir las dos fuentes de información.
Observaciones:
Puedes filtrar/eliminar los valores a Total si crees que es más claro.
Intenta usar las funciones que estudiamos en la clase (gather, separate, select, filter).
Si aún no te sientes cómodx con las funciones de clase (y lo intentaste varias veces) puedes hacer las manipulaciones usando otra herramienta (incluso Excel, una combinación de Excel y R o cualquier software que conozcas); sin embargo, debes documentar tus pasos claramente, con la intención de mantener métodos reproducibles.