Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Create full open data dump #231

Open
EsaMakinen opened this issue Apr 15, 2020 · 1 comment
Open

Create full open data dump #231

EsaMakinen opened this issue Apr 15, 2020 · 1 comment
Assignees

Comments

@EsaMakinen
Copy link
Contributor

EsaMakinen commented Apr 15, 2020

We should release the full open dataset and adhere to tietosuoja requirements, the main issues being:

Yksittäisen vastaajan kaikki vastaukset oireista, sisältäen oireiden keston päivinä
Laitteella luotu satunnainen tunniste UUID salakirjoitettuna kuten Oiretutkan tietokannassa. Tämän avulla datasta voi tunnistaa ne vastaajat, jotka ovat vastanneet useana peräkkäisenä päivää. Tunnisteen avulla mikään taho ei voi päätellä vastaajan henkilöllisyyttä.
Vastauksen päivämäärä ja kellonaika tunnin tarkkuudella
Ikä kahtena luokkana (alle 50v, yli 50v)
Sukupuoli kahtena luokkana (mies, nainen. Muu yhdistetään mies-luokkaan)
Postinumeroalue. Jos postinumeroalueella asuu alle 500 henkeä, yhdistetään se kunnan väkiluvultaan suurimpaan postinumeroon.
Datasta poistetaan seuraavat vastausrivit: ulkomailta tulleet vastaukset; ne vastaukset jossa on virheellinen postinumero

@EsaMakinen
Copy link
Contributor Author

This spec is current.

@cutepig cutepig self-assigned this May 18, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants