- Descriptif :
Ensemble de données décrivant l'état de survie des passagers individuels du Titanic. Les valeurs manquantes dans l'ensemble de données d'origine sont représentées à l'aide de ?. Les valeurs flottantes et int manquantes sont remplacées par -1, les valeurs manquantes de chaîne sont remplacées par 'Inconnu'.
Page d' accueil : https://www.openml.org/d/40945
Code source :
tfds.datasets.titanic.BuilderVersions :
-
2.0.0: Nouvelle API fractionnée ( https://tensorflow.org/datasets/splits ) -
3.0.0: Utilisez un dictionnaire plat standard d'entités pour le jeu de données. Utilisezas_supervised=Truepour diviser le jeu de données en un tuple(features_dict, survived). -
4.0.0(par défaut) : Correction des étiquettes inversées qui étaient inversées dans la 3.0.0.
-
Taille du téléchargement :
114.98 KiBTaille du jeu de données :
382.58 KiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'train' | 1 309 |
- Structure des fonctionnalités :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- Documentation des fonctionnalités :
| Fonctionnalité | Classe | Forme | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| âge | Tenseur | float32 | ||
| bateau | Tenseur | chaîne | ||
| corps | Tenseur | int32 | ||
| cabine | Tenseur | chaîne | ||
| embarqué | Étiquette de classe | int64 | ||
| tarif | Tenseur | float32 | ||
| home.dest | Tenseur | chaîne | ||
| nom | Tenseur | chaîne | ||
| dessécher | Tenseur | int32 | ||
| pclasse | Étiquette de classe | int64 | ||
| sexe | Étiquette de classe | int64 | ||
| sibsp | Tenseur | int32 | ||
| Survécu | Étiquette de classe | int64 | ||
| billet | Tenseur | chaîne |
Clés supervisées (Voir
as_superviseddoc ):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}
, - Descriptif :
Ensemble de données décrivant l'état de survie des passagers individuels du Titanic. Les valeurs manquantes dans l'ensemble de données d'origine sont représentées à l'aide de ?. Les valeurs flottantes et int manquantes sont remplacées par -1, les valeurs manquantes de chaîne sont remplacées par 'Inconnu'.
Page d' accueil : https://www.openml.org/d/40945
Code source :
tfds.datasets.titanic.BuilderVersions :
-
2.0.0: Nouvelle API fractionnée ( https://tensorflow.org/datasets/splits ) -
3.0.0: Utilisez un dictionnaire plat standard d'entités pour le jeu de données. Utilisezas_supervised=Truepour diviser le jeu de données en un tuple(features_dict, survived). -
4.0.0(par défaut) : Correction des étiquettes inversées qui étaient inversées dans la 3.0.0.
-
Taille du téléchargement :
114.98 KiBTaille du jeu de données :
382.58 KiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'train' | 1 309 |
- Structure des fonctionnalités :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- Documentation des fonctionnalités :
| Fonctionnalité | Classe | Forme | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| âge | Tenseur | float32 | ||
| bateau | Tenseur | chaîne | ||
| corps | Tenseur | int32 | ||
| cabine | Tenseur | chaîne | ||
| embarqué | Étiquette de classe | int64 | ||
| tarif | Tenseur | float32 | ||
| home.dest | Tenseur | chaîne | ||
| nom | Tenseur | chaîne | ||
| dessécher | Tenseur | int32 | ||
| pclasse | Étiquette de classe | int64 | ||
| sexe | Étiquette de classe | int64 | ||
| sibsp | Tenseur | int32 | ||
| Survécu | Étiquette de classe | int64 | ||
| billet | Tenseur | chaîne |
Clés supervisées (Voir
as_superviseddoc ):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}