Daten verarbeiten

In diesem Kapitel werden wir die folgenden Fähigkeiten lernen.

Der Datentyp mit dem wir im allgemeinen arbeiten sind Datentabellen. Exceldateien oder Textdateien (zum Beispiel csv-Dateien) müssen so eingelsen werden, dass R die wichtigen Strukturen erkennt - Kopfzeilen für die Merkmalsnamen, - Datentypen sollten gleich erkannt werden, - Dezimaltrenner müssen ggf. angegeben werden, - etc.

Dies umfasst in Datentabellen nur bestimmte Merkmale (Spalten) oder Beobachtungen (Zeilen) zu betrachten, neue Merkmale zu erstellen, Ausprägungen zu ändern oder Kenngrößenn, also zum Beispiel statistische Größen, aus einer Datentabelle zu berechnen. Die geschieht mit Hilfe des Pakets dplyr.

Mit Hilfe des Pakets tidyr (und dem Paket dplyr) können Daten bereinigt werden. Dies bedeutet, dass man Datentabellen in eine zum Arbeiten geeignete Form bringt.