description |
---|
En esta sección puedes consultar los estándares y mejores prácticas para la estructuración de los conjuntos de datos a publicar. |
Los Datos Abiertos deberán seguir ciertos estándares y codificaciones con el objetivo de ser fáciles de encontrar y comparar dentro y entre temáticas y en el tiempo. A fin de que los datos sean más útiles, se deberá considerar lo siguiente:
- La interoperabilidad de los datos publicados mediante su estandarización.
- La usabilidad de los datos, mejorando la legibilidad y lógica de publicación de los conjuntos y recursos de datos.
Para incrementar la interoperabilidad de los datos, las áreas generadoras o administradoras de datos deberán utilizar:
- El Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades para el registro de información geográfica.
- El estándar **** ISO-8601 para el registro de fechas, horas y periodos.
- Codificación de texto en formato UTF-8.
- El estándar ASCII6.
- Los estándares en materia de datos para contrataciones abiertas.
- Otros estándares adoptados a nivel nacional o internacional.
Para incrementar la usabilidad de los datos, se deberá:
- Promover la legibilidad por máquinas, se deberá utilizar en la medida de lo posible, formatos de archivo como CSV, JSON y XML. Incrementar la legibilidad por máquinas se refiere a hacer disponible información en un formato digital, así como a que la información se encuentre en un formato de archivo cuya estructura sea adecuada para su procesamiento por computadora.
- Promover la legibilidad por humanos, se podrá publicar los datos en diversos formatos que, además de permitir la legibilidad por máquina, permitan a un usuario comprender los datos. Para lo anterior se recomienda acompañar formatos abiertos por archivos XLS, a manera de que usuarios de diferentes niveles de conocimiento técnico puedan usarlo.
- Establecer categorizaciones de datos, utilizar categorías bien definidas facilita la consulta y el análisis de datos. Las categorías permiten agrupar datos conforme a una cierta característica o propiedad en común. El establecimiento de categorías en los datos se podrá realizar utilizando atributos de los datos para los cuales es posible establecer valores predefinidos.
Adicionalmente se deberán considerar otros aspectos como evitar información duplicada, eliminar redundancia en datos, asegurar la representación de variables, entre otras que se consideren mejores prácticas de datos, como las siguientes:
- Tienen que ser planos y simétricos.
- La primera fila debe tener el nombre de las columnas.
- Los nombres de la columna no deben de tener espacio, usa el guión bajo de preferencia.
- Nombres de columna de máximo 20 caracteres.
- Sin celdas en blanco.