- وصف :
تعتمد مجموعة البيانات هذه بشكل أساسي على مجموعة بيانات AI2D (انظر هنا ).
راجع القسم 4.1 من ورقتنا للتعرف على عملية شرح مجموعة بيانات AI2D-Caption.
الصفحة الرئيسية : https://huggingface.co/datasets/abhayzala/AI2D-Caption
كود المصدر :
tfds.datasets.ai2dcaption.Builderالإصدارات :
-
1.0.0(افتراضي): الإصدار الأولي.
-
حجم التحميل :
Unknown sizeحجم مجموعة البيانات :
2.01 GiBالتخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'auditor_llm_training_examples' | 30 |
'gpt4v' | 4,903 |
'llava_15' | 4,902 |
'planner_llm_training_examples' | 30 |
'test' | 75 |
- هيكل الميزة :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'entities': Sequence({
'bounds': BBoxFeature(shape=(4,), dtype=float32),
'cat': ClassLabel(shape=(), dtype=int64, num_classes=10),
'from': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': Text(shape=(), dtype=string),
'to': Text(shape=(), dtype=string),
'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
'image': Image(shape=(None, None, 3), dtype=uint8, description=The image of the diagram.),
'image_filename': Text(shape=(), dtype=string),
'layout': ClassLabel(shape=(), dtype=int64, num_classes=7),
'relationships': Sequence(Text(shape=(), dtype=string)),
'topic': ClassLabel(shape=(), dtype=int64, num_classes=4),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع D | وصف |
|---|---|---|---|---|
| المميزاتDict | ||||
| التسمية التوضيحية | نص | خيط | ||
| الكيانات | تسلسل | |||
| الكيانات/الحدود | ميزة BBox | (4،) | float32 | |
| الكيانات/القط | ClassLabel | int64 | ||
| الجهات/من | نص | خيط | ||
| الكيانات/المعرف | نص | خيط | ||
| الكيانات/التسمية | نص | خيط | ||
| الكيانات/ إلى | نص | خيط | ||
| الكيانات/النوع | ClassLabel | int64 | ||
| صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | صورة المخطط. |
| image_filename | نص | خيط | اسم ملف الصورة. على سبيل المثال "1337.png" | |
| تَخطِيط | ClassLabel | int64 | ||
| العلاقات | التسلسل (النص) | (لا أحد،) | خيط | |
| عنوان | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (راجع
as_superviseddoc ):Noneالشكل ( tfds.show_examples ):

- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{Zala2024DiagrammerGPT,
author = {Abhay Zala and Han Lin and Jaemin Cho and Mohit Bansal},
title = {DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning},
year = {2024},
booktitle = {COLM},
}