-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy path010_Organisatorisches.Rmd
248 lines (149 loc) · 8.02 KB
/
010_Organisatorisches.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
```{r include=FALSE, cache=FALSE}
set.seed(1014)
options(digits = 3)
knitr::opts_chunk$set(
comment = "#>",
collapse = TRUE,
message = FALSE,
warning = FALSE,
cache = TRUE,
out.width = "70%",
fig.align = 'center',
fig.width = 6,
fig.asp = 0.618, # 1 / phi
fig.show = "hold",
size = "tiny"
)
```
```{r include=FALSE, cache=FALSE}
set.seed(1014)
options(digits = 3)
knitr::opts_chunk$set(
comment = "#>",
message = FALSE,
warning = FALSE,
collapse = TRUE,
cache = TRUE,
out.width = "70%",
fig.align = 'center',
fig.width = 6,
fig.asp = 0.618, # 1 / phi
fig.show = "hold"
)
```
`r if (knitr:::is_latex_output()) '\\newpage'`
# Organisatorisches
```{r echo = FALSE, out.width = "30%", fig.align = "center"}
knitr::include_graphics("images/FOM.jpg")
```
```{r echo = FALSE, out.width = "10%", fig.align = "center"}
knitr::include_graphics("images/licence.png")
```
## Modulziele
```{block2, ziele-modul, type='rmdcaution', echo = TRUE}
Die Studierenden können nach erfolgreichem Abschluss des Moduls:
- den Ablauf eines Projekts aus der Datenanalyse in wesentlichen Schritten nachvollziehen,
- Daten aufbereiten und ansprechend visualisieren,
- Inferenzstatistik anwenden und kritisch hinterfragen,
- klassische Vorhersagemethoden (Regression) anwenden,
- moderne Methoden der angewandten Datenanalyse anwenden (z.B. Textmining),
- betriebswirtschaftliche Fragestellungen mittels datengetriebener Vorhersagemodellen beantworten.
```
## Themen pro Termin
Für dieses Modul sind 44 UE für Lehre eingeplant, aufgeteilt in 11 Termine (vgl. \@ref(tab:termin-themen)).
Folgende Abfolge von Themen sind pro Termin vorgeschlagen:
Tabelle \@ref(tab:termin-themen) ordnet die Themen des Moduls den Terminen (1-11) zu.
```{r termin-themen, echo = FALSE}
df <- readr::read_csv("includes/Termin_Themen.csv")
knitr::kable(df, caption = "Zuordnung von Themen zu Terminen")
```
```{r fig-themen, echo = FALSE, include = FALSE}
# Bild erzeugen von der Tabelle, da einfacher zu handeln in Powerpoint
library(gridExtra)
library(grid)
pdf("images/Orga/Themen_Termin.pdf", height=11, width=8.5)
grid.table(df, rows = NULL)
dev.off()
```
## Vorerfahrung
Bei den Studierenden werden folgende Themen als bekannt vorausgesetzt:
- Deskriptive Statistik
- Inferenzstatistik
- Grundlagen R
- Grundlagen der Datenvisualisierung
## Prüfung
### Prüfungshinweise
- Die Prüfung besteht aus zwei Teilen
- einer Klausur (50% der Teilnote)
- einer Datenanalyse (50% der Teilnote).
*Prüfungsrelevant* ist der gesamte Stoff aus dem Skript und dem Unterricht mit folgenden Ausnahmen:
- Inhalte/Abschnitte, die als "nicht klausurrelevant" gekennzeichnet sind,
- Inhalte/Abschnitte, die als "Vertiefung" gekennzeichnet sind,
- Fallstudien (nur für Klausuren nicht prüfungsrelevant),
- die Inhalte von Links,
- die Inhalte von Fußnoten,
- die Kapitel *Vorwort*, *Organisatorisches* und *Anhang*.
Alle Hinweise zur Prüfung gelten nur insoweit nicht anders vom Dozenten festgelegt.
### Klausur
- Die Klausur besteht fast oder komplett aus Multiple-Choice (MC-)-Aufgaben mit mehreren Antwortoptionen (sofern nicht anders vom Dozenten vorgegeben).
- Die (maximale) Anzahl der richtigen Aussagen ist pro Aufgabe angegeben. Werden mehr Aussagen als "richtig" angekreuzt als angegeben, so wird die Aufgabe mit 0 Punkten beurteilt. Ansonsten werden Teilpunkte für jede Aufgabe vergeben.
- Jede Aussage gilt ceteris paribus (unter sonst gleichen Umständen). Aussagen der Art "A ist B" (z.B. "Menschen sind sterblich") sind *nur* dann als richtig auszuwählen, wenn die Aussage *immer* richtig ist.
- Im Zweifel ist eine Aussage auf den Stoff, so wie im Unterricht behandelt, zu beziehen.
Werden in Aussagen Zahlen abgefragt, so sind Antworten auch dann richtig, wenn die vorgeschlagene Antwort ab der 1. Dezimale von der wahren Antwort abweicht (einigermaßen genaue Aussagen werden als richtig akzeptiert). Bei Fragen zu R-Syntax spielen Aspekte wie Enter-Taste o.ä. bei der Beantwortung der Frage keine Rolle; diese Aspekte dürfen zu ignorieren.
- Jede Aussage einer MC-Aufgabe ist entweder richtig oder falsch (aber nicht beides oder keines).
- Die MC-Aufgaben sind nur mit Kreuzen zu beantworten; Text wird bei der Korrektur nicht berücksichtigt.
- Bei Nachholklausuren gelten die selben Inhalte (inkl. Schwerpunkte) wie bei der Standard-Klausur, sofern nicht anderweitig angegeben.
- I.d.R. sind nur Klausurpapier und ein nicht-programmierbarer Taschenrechner als Hilfsmittel zulässig.
- Die Musterlösungen zu offenen Fragen sind elektronisch hinterlegt.
### Datenanalyse
#### Hinweise
- Wenden Sie die passenden, im Modul eingeführten statistischen Verfahren an.
- Werten Sie die Daten mit R aus; R-Syntax soll verwendet und im Hauptteil dokumentiert werden.
- In der Wahl des Datensatzes sind Sie frei, mit folgender Ausnahme: Im Unterricht besprochene Datensätze dürfen nicht als Prüfungsleistung eingereicht werden (vgl. Abschnitt \@ref(Daten)).
- Der (Original-)Name des Datensatzes (sowie ggf. Link) ist bei der Anmeldung anzugeben.
- Gruppenarbeiten sind nicht zulässig.
- Hat sich jemand schon für einen Datensatz angemeldet, so darf dieser Datensatz nicht mehr gewählt werden ("first come, first serve").
- Fundorte für Datensätze sind z.B. [hier](http://www.stat.ufl.edu/~winner/datasets.html), [hier](http://archive.ics.uci.edu/ml/datasets.html), [hier](https://www.kaggle.com/datasets) und [hier](http://vincentarelbundock.github.io/Rdatasets/datasets.html); im Internet finden sich viele Datensätze^[Googeln Sie mal nach "open datasets" o.ä.].
- Schreiben Sie Ihre Ergebnisse in einer Ausarbeitung zusammen; der Umfang der Ausarbeitung umfasst ca. *1500 Wörter* (nur Hauptteil; d.h. exklusive Deckblatt, Verzeichnisse, Anhang etc.).
- Untersuchen Sie 2-3 Hypothesen.
- Denken Sie daran, Name, Matrikelnummer, Modulname etc. anzugeben (Deckblatt). Bei der Gestaltung des Layout entscheiden Sie selbständig bitte nach Zweckmäßigkeit (und Ästhetik).
- Fügen Sie keine Erklärungen oder Definitionen von statistischen Verfahren an.
#### Gliederungsvorschlag zur Datenanalyse
1. Datensatz
1. Beschreibung
- Name
- Hintergrund (Themengebiet, Theorien, Relevanz), ca. 100 Wörter
- Dimension (Zeilen*Spalten)
- Zitation (wenn vorhanden)
- sonstige Hinweise (z.B. Datenqualität, Entstehung des Datensatzes)
2. Variablendeskription (nur für Variablen der Hypothese)
- Skalenniveaus
- Kontinuität (nur bei metrischen Variablen)
- R-Datentyp
- Anzahl Fälle und fehlende Werte
- Erläuterung der Variablen
2. Deduktive Analyse
1. Hypothese(n)
Beschreiben Sie die Vermutung(en), die Sie prüfen möchten, möglichst exakt.
2. Deskriptive Statistiken
- Berichten Sie deskriptive Statistiken für alle Variablen der Hypothesen.
- Berichten Sie aber nur univariate Statistiken sowie Subgruppenanalysen dazu.
- Berichten Sie ggf. Effektstärken.
3. Diagramme
- Visualisieren Sie Ihre Hypothese(n) bzw. die Daten dazu, gerne aus mehreren Blickwinkeln.
4. Signifikanztest
3. Explorative Analyse
- Erörtern Sie interessante Einblicke, die über Ihre vorab getroffenen Hypothesen hinausgehen.
- Diagramme können hier eine zentrale Rolle spielen.
4. Diskussion
1. Zentrale Ergebnisse
Fassen Sie das zentrale Ergebnisse zusammen.
2. Interpretation
Interpretieren Sie die Ergebnisse: Was bedeuten die Zahlen/Fakten, die die Rechnungen ergeben haben?
3. Grenzen der Analyse
- Schildern Sie etwaige Schwachpunkte oder Einschränkungen der Analyse.
- Geben Sie Anregungen für weiterführende Analysen dieses Datensatzes.
## Literatur
Zum Bestehen der Prüfung ist keine weitere Literatur formal notwendig; allerdings ist es hilfreich, den Stoff aus unterschiedlichen Blickwinkeln aufzuarbeiten.
Dazu ist am ehesten das Buch von Wickham und Grolemund [@r4ds] hilfreich,
obwohl es deutlich tiefer geht als dieses Skript.