- Descriptif :
Le radon est un gaz radioactif qui pénètre dans les maisons par des points de contact avec le sol. C'est un cancérogène qui est la principale cause de cancer du poumon chez les non-fumeurs. Les niveaux de radon varient considérablement d'un ménage à l'autre. Cet ensemble de données contient les niveaux de radon mesurés dans les foyers américains par comté et par État. L'étiquette « activité » est la concentration de radon mesurée en pCi/L. Les prédicteurs importants sont le « plancher » (le sol de la maison dans laquelle la mesure a été prise), le « comté » (le comté américain dans lequel la maison est située) et « Uppm » (une mesure du niveau d'uranium du sol par comté ).
Page d'accueil : http://www.stat.columbia.edu/~gelman/arm/examples/radon/
Code source :
tfds.datasets.radon.BuilderVersions :
-
1.0.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.71 MiBTaille du jeu de données :
9.15 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'train' | 12 573 |
- Structure des fonctionnalités :
FeaturesDict({
'activity': float32,
'features': FeaturesDict({
'Uppm': float32,
'adjwt': float32,
'basement': string,
'cntyfips': int32,
'county': string,
'dupflag': int32,
'floor': int32,
'idnum': int32,
'lat': float32,
'lon': float32,
'pcterr': float32,
'region': int32,
'rep': int32,
'room': int32,
'startdt': int32,
'starttm': int32,
'state': string,
'state2': string,
'stfips': int32,
'stopdt': int32,
'stoptm': int32,
'stratum': int32,
'typebldg': int32,
'wave': int32,
'windoor': string,
'zip': int32,
'zipflag': int32,
}),
})
- Documentation des fonctionnalités :
| Caractéristique | Classe | Façonner | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| activité | Tenseur | float32 | ||
| caractéristiques | FonctionnalitésDict | |||
| fonctionnalités/Uppm | Tenseur | float32 | ||
| fonctionnalités/ajustement | Tenseur | float32 | ||
| caractéristiques/sous-sol | Tenseur | chaîne de caractères | ||
| fonctionnalités/cntyfips | Tenseur | int32 | ||
| caractéristiques/comté | Tenseur | chaîne de caractères | ||
| fonctionnalités/dupflag | Tenseur | int32 | ||
| caractéristiques/sol | Tenseur | int32 | ||
| fonctionnalités/idnum | Tenseur | int32 | ||
| fonctionnalités/lat | Tenseur | float32 | ||
| caractéristiques/lon | Tenseur | float32 | ||
| fonctionnalités/pcterr | Tenseur | float32 | ||
| caractéristiques/région | Tenseur | int32 | ||
| fonctionnalités/représentation | Tenseur | int32 | ||
| caractéristiques/pièce | Tenseur | int32 | ||
| fonctionnalités/startdt | Tenseur | int32 | ||
| fonctionnalités/démarrage | Tenseur | int32 | ||
| caractéristiques/état | Tenseur | chaîne de caractères | ||
| caractéristiques/état2 | Tenseur | chaîne de caractères | ||
| fonctionnalités/stips | Tenseur | int32 | ||
| fonctionnalités/arrêt | Tenseur | int32 | ||
| fonctionnalités/arrêt | Tenseur | int32 | ||
| caractéristiques/strate | Tenseur | int32 | ||
| caractéristiques/typebdg | Tenseur | int32 | ||
| fonctionnalités/vague | Tenseur | int32 | ||
| caractéristiques/fenêtre | Tenseur | chaîne de caractères | ||
| fonctionnalités/zip | Tenseur | int32 | ||
| fonctionnalités/zipflag | Tenseur | int32 |
Touches supervisées (Voir
as_superviseddoc ):('features', 'activity')Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@book{GelmanHill:2007,
author = {Gelman, Andrew and Hill, Jennifer},
title = {Data Analysis Using Regression and Multilevel/Hierarchical Models},
publisher = {Cambridge University Press},
series = {Analytical methods for social research},
year = 2007
}