Daten verarbeiten
In diesem Kapitel werden wir die folgenden Fähigkeiten lernen.
- Daten aus einer Datei einzulesen:
Der Datentyp mit dem wir im allgemeinen arbeiten sind Datentabellen. Exceldateien oder Textdateien (zum Beispiel csv-Dateien) müssen so eingelsen werden, dass R die wichtigen Strukturen erkennt - Kopfzeilen für die Merkmalsnamen, - Datentypen sollten gleich erkannt werden, - Dezimaltrenner müssen ggf. angegeben werden, - etc.
- Daten zu transformieren:
Dies umfasst in Datentabellen nur bestimmte Merkmale (Spalten) oder Beobachtungen (Zeilen) zu betrachten, neue Merkmale zu erstellen, Ausprägungen zu ändern oder Kenngrößenn, also zum Beispiel statistische Größen, aus einer Datentabelle zu berechnen. Die geschieht mit Hilfe des Pakets dplyr
.
- Daten bereinigen:
Mit Hilfe des Pakets tidyr
(und dem Paket dplyr
) können Daten bereinigt werden. Dies bedeutet, dass man Datentabellen in eine zum Arbeiten geeignete Form bringt.