- 설명 :
타이타닉에 탑승한 개별 승객의 생존 상태를 설명하는 데이터 세트. 원래 데이터 세트의 누락된 값은 ?를 사용하여 표시됩니다. Float 및 int 누락 값은 -1로 대체되고 문자열 누락 값은 'Unknown'으로 대체됩니다.
소스 코드 :
tfds.datasets.titanic.Builder버전 :
-
2.0.0: 새로운 분할 API( https://tensorflow.org/datasets/splits ) -
3.0.0: 데이터 세트에 대한 기능의 표준 플랫 사전을 사용합니다.as_supervised=True를 사용하여 데이터 세트를(features_dict, survived)튜플로 분할합니다. -
4.0.0(기본값): 3.0.0에서 반전되었던 반전된 레이블을 수정합니다.
-
다운로드 크기 :
114.98 KiB데이터 세트 크기 :
382.58 KiB자동 캐시 ( 문서 ): 예
분할 :
| 나뉘다 | 예 |
|---|---|
'train' | 1,309 |
- 기능 구조 :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- 기능 문서 :
| 특징 | 수업 | 모양 | D타입 | 설명 |
|---|---|---|---|---|
| 풍모Dict | ||||
| 나이 | 텐서 | float32 | ||
| 보트 | 텐서 | 끈 | ||
| 몸 | 텐서 | int32 | ||
| 선실 | 텐서 | 끈 | ||
| 승선 | 클래스 레이블 | int64 | ||
| 요금 | 텐서 | float32 | ||
| 집.목적지 | 텐서 | 끈 | ||
| 이름 | 텐서 | 끈 | ||
| 볶다 | 텐서 | int32 | ||
| pclass | 클래스 레이블 | int64 | ||
| 섹스 | 클래스 레이블 | int64 | ||
| 한모금 | 텐서 | int32 | ||
| 살아남았다 | 클래스 레이블 | int64 | ||
| 티켓 | 텐서 | 끈 |
감독 키 (
as_supervised문서 참조):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}
, - 설명 :
타이타닉에 탑승한 개별 승객의 생존 상태를 설명하는 데이터 세트. 원래 데이터 세트의 누락된 값은 ?를 사용하여 표시됩니다. Float 및 int 누락 값은 -1로 대체되고 문자열 누락 값은 'Unknown'으로 대체됩니다.
소스 코드 :
tfds.datasets.titanic.Builder버전 :
-
2.0.0: 새로운 분할 API( https://tensorflow.org/datasets/splits ) -
3.0.0: 데이터 세트에 대한 기능의 표준 플랫 사전을 사용합니다.as_supervised=True를 사용하여 데이터 세트를(features_dict, survived)튜플로 분할합니다. -
4.0.0(기본값): 3.0.0에서 반전되었던 반전된 레이블을 수정합니다.
-
다운로드 크기 :
114.98 KiB데이터 세트 크기 :
382.58 KiB자동 캐시 ( 문서 ): 예
분할 :
| 나뉘다 | 예 |
|---|---|
'train' | 1,309 |
- 기능 구조 :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- 기능 문서 :
| 특징 | 수업 | 모양 | D타입 | 설명 |
|---|---|---|---|---|
| 풍모Dict | ||||
| 나이 | 텐서 | float32 | ||
| 보트 | 텐서 | 끈 | ||
| 몸 | 텐서 | int32 | ||
| 선실 | 텐서 | 끈 | ||
| 승선 | 클래스 레이블 | int64 | ||
| 요금 | 텐서 | float32 | ||
| 집.목적지 | 텐서 | 끈 | ||
| 이름 | 텐서 | 끈 | ||
| 볶다 | 텐서 | int32 | ||
| pclass | 클래스 레이블 | int64 | ||
| 섹스 | 클래스 레이블 | int64 | ||
| 한모금 | 텐서 | int32 | ||
| 살아남았다 | 클래스 레이블 | int64 | ||
| 티켓 | 텐서 | 끈 |
감독 키 (
as_supervised문서 참조):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}