- תיאור :
WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.
WebVid-10M מכיל:
10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.
דף הבית : https://m-bain.github.io/webvid-dataset/
קוד מקור :
tfds.datasets.webvid.Builderגרסאות :
-
1.0.0(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
Unknown sizeגודל ערכת נתונים :
Unknown sizeהוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/):
עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב-manual_dir/webvid, כך שקובצי mp4 ממוקמים ב-manual_dir/webvid/*/*_*/*.mp4.
הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.
שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
| לְפַצֵל | דוגמאות |
|---|
- מבנה תכונה :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| כּוֹתֶרֶת | טֶקסט | חוּט | ||
| תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
| כתובת אתר | טֶקסט | חוּט | ||
| וִידֵאוֹ | וידאו (תמונה) | (ללא, 360, 640, 3) | uint8 |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - תיאור :
WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.
WebVid-10M מכיל:
10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.
דף הבית : https://m-bain.github.io/webvid-dataset/
קוד מקור :
tfds.datasets.webvid.Builderגרסאות :
-
1.0.0(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
Unknown sizeגודל ערכת נתונים :
Unknown sizeהוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/):
עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב-manual_dir/webvid, כך שקובצי mp4 ממוקמים ב-manual_dir/webvid/*/*_*/*.mp4.
הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.
שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
| לְפַצֵל | דוגמאות |
|---|
- מבנה תכונה :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| כּוֹתֶרֶת | טֶקסט | חוּט | ||
| תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
| כתובת אתר | טֶקסט | חוּט | ||
| וִידֵאוֹ | וידאו (תמונה) | (ללא, 360, 640, 3) | uint8 |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}