- विवरण :
WebVid लघु वीडियो का एक बड़े पैमाने का डेटासेट है, जिसमें वेब से पाठ्य विवरण दिया गया है। वीडियो विविध और उनकी सामग्री में समृद्ध हैं।
WebVid-10M में शामिल हैं:
10.7M वीडियो-कैप्शन जोड़े। 52K कुल वीडियो घंटे।
स्रोत कोड :
tfds.datasets.webvid.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
Unknown sizeडेटासेट का आकार :
Unknown sizeमैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/) में डाउनलोड करना होगा:
डेटा प्राप्त करने के लिए https://m-bain.github.io/webvid-dataset/ में डाउनलोड निर्देशों का पालन करें। csv फ़ाइलों और वीडियो निर्देशिकाओं कोmanual_dir/webvidमें रखें, जैसे कि mp4 फ़ाइलेंmanual_dir/webvid/*/*_*/*.mp4में रखी गई हों।
पहली निर्देशिका आम तौर पर एक मनमाना हिस्सा निर्देशिका (शार्ल्ड डाउनलोडिंग के लिए) होती है, दूसरी निर्देशिका पृष्ठ निर्देशिका (अंडरस्कोर के आसपास दो नंबर) होती है, जिसके अंदर एक या अधिक mp4 फाइलें होती हैं।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
| विभाजित करना | उदाहरण |
|---|
- फ़ीचर संरचना :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| कैप्शन | मूलपाठ | डोरी | ||
| पहचान | मूलपाठ | डोरी | ||
| यूआरएल | मूलपाठ | डोरी | ||
| वीडियो | वीडियो (छवि) | (कोई नहीं, 360, 640, 3) | uint8 |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ): गुम।
उद्धरण :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - विवरण :
WebVid लघु वीडियो का एक बड़े पैमाने का डेटासेट है, जिसमें वेब से पाठ्य विवरण दिया गया है। वीडियो विविध और उनकी सामग्री में समृद्ध हैं।
WebVid-10M में शामिल हैं:
10.7M वीडियो-कैप्शन जोड़े। 52K कुल वीडियो घंटे।
स्रोत कोड :
tfds.datasets.webvid.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
Unknown sizeडेटासेट का आकार :
Unknown sizeमैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/) में डाउनलोड करना होगा:
डेटा प्राप्त करने के लिए https://m-bain.github.io/webvid-dataset/ में डाउनलोड निर्देशों का पालन करें। csv फ़ाइलों और वीडियो निर्देशिकाओं कोmanual_dir/webvidमें रखें, जैसे कि mp4 फ़ाइलेंmanual_dir/webvid/*/*_*/*.mp4में रखी गई हों।
पहली निर्देशिका आम तौर पर एक मनमाना हिस्सा निर्देशिका (शार्ल्ड डाउनलोडिंग के लिए) होती है, दूसरी निर्देशिका पृष्ठ निर्देशिका (अंडरस्कोर के आसपास दो नंबर) होती है, जिसके अंदर एक या अधिक mp4 फाइलें होती हैं।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
| विभाजित करना | उदाहरण |
|---|
- फ़ीचर संरचना :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| कैप्शन | मूलपाठ | डोरी | ||
| पहचान | मूलपाठ | डोरी | ||
| यूआरएल | मूलपाठ | डोरी | ||
| वीडियो | वीडियो (छवि) | (कोई नहीं, 360, 640, 3) | uint8 |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ): गुम।
उद्धरण :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}