- توضیحات :
اندازه گیری سه گونه پنگوئن مشاهده شده در مجمع الجزایر پالمر، قطب جنوب.
این داده ها از سال 2007 تا 2009 توسط دکتر کریستن گورمن با برنامه تحقیقات زیست محیطی بلندمدت ایستگاه پالمر ، بخشی از شبکه تحقیقات زیست محیطی بلند مدت ایالات متحده جمع آوری شده است. دادهها در اصل از پورتال دادههای Environmental Data Initiative (EDI) وارد شدهاند و مطابق با خطمشی دادههای ایستگاه پالمر برای استفاده توسط مجوز CC0 ("بدون حقوق محفوظ") در دسترس هستند. این کپی از مخزن GitHub آلیسون هورست وارد شده است.
صفحه اصلی : https://allisonhorst.github.io/palmerpenguins/
کد منبع :
tfds.datasets.penguins.Builderنسخه ها :
-
1.0.0(پیش فرض): انتشار اولیه.
-
ذخیره خودکار ( اسناد ): بله
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
پنگوئن ها / پردازش شده (پیکربندی پیش فرض)
توضیحات پیکربندی :
penguins/processedشده جایگزینی برای مجموعه دادهirisاست. این شامل 4 ویژگی عددی نرمال شده ارائه شده به عنوان یک تانسور منفرد، بدون مقادیر گم شده است و برچسب کلاس (گونه) به عنوان یک عدد صحیح (n = 334) ارائه می شود.حجم دانلود :
25.05 KiBحجم مجموعه داده :
17.61 KiBتقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 334 |
- ساختار ویژگی :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| امکانات | تانسور | (4،) | float32 | |
| گونه ها | ClassLabel | int64 |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('features', 'species')مثالها ( tfds.as_dataframe ):
پنگوئن / ساده
توضیحات پیکربندی :
penguins/simpleاز مجموعه داده خام پردازش شده است، با برچسبهای کلاس سادهشده که از فیلدهای متنی مشتق شدهاند، مقادیر گمشده بهعنوان NaN/NA علامتگذاری شدهاند و تنها 7 ویژگی مهم را حفظ میکند (n = 344).حجم دانلود :
13.20 KiBحجم مجموعه داده :
56.10 KiBتقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 344 |
- ساختار ویژگی :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| جرم_بدن_گرم | تانسور | float32 | ||
| culmen_depth_mm | تانسور | float32 | ||
| culmen_length_mm | تانسور | float32 | ||
| باله_طول_میلی متر | تانسور | float32 | ||
| جزیره | ClassLabel | int64 | ||
| رابطه ی جنسی | ClassLabel | int64 | ||
| گونه ها | ClassLabel | int64 |
کلیدهای نظارت شده (به
as_supervisedنظارت شده رجوع کنید):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')مثالها ( tfds.as_dataframe ):
پنگوئن / خام
توضیحات پیکربندی :
penguins/rawکپی اصلی و پردازش نشده از @allisonhorst است که شامل تمام 17 ویژگی است که به صورت انواع عددی یا به صورت متن خام ارائه شده است (n = 344).حجم دانلود :
49.72 KiBاندازه مجموعه داده :
164.51 KiBتقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 344 |
- ساختار ویژگی :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| توده بدن (گرم) | تانسور | float32 | ||
| تکمیل کلاچ | متن | رشته | ||
| نظرات | متن | رشته | ||
| عمق کولمن (میلی متر) | تانسور | float32 | ||
| طول کولمن (میلی متر) | تانسور | float32 | ||
| تخم مرغ خرما | متن | رشته | ||
| Delta 13 C (o/oo) | تانسور | float32 | ||
| Delta 15 N (o/oo) | تانسور | float32 | ||
| طول باله (میلی متر) | تانسور | float32 | ||
| شناسنامه فردی | متن | رشته | ||
| جزیره | متن | رشته | ||
| منطقه | متن | رشته | ||
| شماره نمونه | تانسور | int32 | ||
| رابطه ی جنسی | متن | رشته | ||
| گونه ها | متن | رشته | ||
| صحنه | متن | رشته | ||
| نام مطالعه | متن | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneمثالها ( tfds.as_dataframe ):