Der Datensatz enthält die folgenden Spalten:
- PassengerId: eine Identifikationsnummer für jeden Passagier. Der Datentyp ist irrelevant, da diese Spalte keine Vorhersagefähigkeit hat.
- Name: Der Name des Passagiers. Der Datentyp ist irrelevant, da diese Spalte keine Vorhersagefähigkeit hat.
- SibSp: Die Anzahl der Geschwister oder Ehepartner, die mit dem Passagier an Bord reisen. Der Datentyp ist kategorisch.
- Parch: Anzahl der Eltern oder Kinder an Bord, die mit dem Passagier reisen. Der Datentyp ist kategorisch.
- Fare: Betrag, der für das Ticket bezahlt wurde. Der Datentyp ist Dezimal, da Fare Betrag bedeutet.
- Cabin: Die zugewiesene Kabinennummer des Passagiers. Der Datentyp ist irrelevant, da diese Spalte keine Vorhersagefähigkeit hat.
- Pclass: Reiseklasse (kann 0, 1, 2 oder 3 sein). Der Datentyp ist kategorisch.
- Embarked: Abfahrtshafen. Datentyp ist kategorisch.
- Age: Passagieralter. Der Datentyp ist dezimal, ebenso wie der Fahrpreis mit einer Menge zusammenhängt.
- Sex: männlich oder weiblich. Datentyp ist kategorisch.
- Ticket: Ticketnummer. Datentyp ist irrelevant, da diese Spalte keine Vorhersagefähigkeit hat.
- Survived: Ob der Passagier überlebt hat oder nicht. Datentyp ist kategorisch. ZIEL