segment_anything

বর্ণনা :

SA-1B ডাউনলোড করুন

সেগমেন্ট এনিথিং 1 বিলিয়ন (SA-1B) হল একটি ডেটাসেট যা ওপেন ওয়ার্ল্ড ইমেজ থেকে সাধারণ-উদ্দেশ্য অবজেক্ট সেগমেন্টেশন মডেলের প্রশিক্ষণের জন্য ডিজাইন করা হয়েছে। ডেটাসেটটি "সেগমেন্ট এনিথিং" কাগজে চালু করা হয়েছিল।

SA-1B ডেটাসেটে 11M বৈচিত্র্যময়, উচ্চ-রেজোলিউশন, লাইসেন্সপ্রাপ্ত, এবং গোপনীয়তা-সুরক্ষামূলক ছবি এবং 1.1B মাস্ক টীকা রয়েছে। মাস্কগুলি COCO রান-লেংথ এনকোডিং (RLE) ফর্ম্যাটে দেওয়া হয় এবং ক্লাস নেই৷

লাইসেন্স কাস্টম। অনুগ্রহ করে https://ai.facebook.com/datasets/segment-anything-downloads- এ সম্পূর্ণ নিয়ম ও শর্তাবলী পড়ুন

image.content (ছবির বিষয়বস্তু) ছাড়া সমস্ত বৈশিষ্ট্য মূল ডেটাসেটে রয়েছে।

আপনি এর সাথে সেগমেন্টেশন মাস্ক ডিকোড করতে পারেন:

import tensorflow_datasets as tfds

pycocotools = tfds.core.lazy_imports.pycocotools

ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
  segmentation = example['annotations']['segmentation']
  for counts, size in zip(segmentation['counts'], segmentation['size']):
    encoded_mask = {'size': size, 'counts': counts}
    mask = pycocotools.decode(encoded_mask)  # np.array(dtype=uint8) mask
    ...

হোমপেজ : https://ai.facebook.com/datasets/segment-anything-downloads
উত্স কোড : tfds.datasets.segment_anything.Builder
সংস্করণ :
- 1.0.0 (ডিফল্ট): প্রাথমিক প্রকাশ।
ডাউনলোডের আকার : 10.28 TiB
ডেটাসেটের আকার : 10.59 TiB
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে download_config.manual_dir এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে ( ~/tensorflow_datasets/downloads/manual/ এ ডিফল্ট):
https://ai.facebook.com/datasets/segment-anything-downloads manual_dir থেকে লিঙ্ক ফাইল ডাউনলোড করুন segment_anything_links.txt হিসাবে সংরক্ষিত লিঙ্ক ফাইল থাকা উচিত।
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'train'`	11,185,362

বৈশিষ্ট্য গঠন :

FeaturesDict({
    'annotations': Sequence({
        'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
        'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
        'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
        'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
        'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
        'segmentation': FeaturesDict({
            'counts': string,
            'size': Tensor(shape=(2,), dtype=uint64),
        }),
        'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
    }),
    'image': FeaturesDict({
        'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
        'file_name': string,
        'height': uint64,
        'image_id': uint64,
        'width': uint64,
    }),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ	বর্ণনা
	ফিচারসডিক্ট
টীকা	সিকোয়েন্স
টীকা/ক্ষেত্র	স্কেলার		uint64	মাস্কের পিক্সেলে এলাকা।
টীকা/bbox	বিবক্স ফিচার	(৪,)	float32	মুখোশের চারপাশে বাক্স, TFDS ফর্ম্যাটে।
টীকা/ক্রপ_বক্স	বিবক্স ফিচার	(৪,)	float32	টিএফডিএস ফর্ম্যাটে মুখোশ তৈরি করতে ব্যবহৃত চিত্রের ফসল।
টীকা/আইডি	স্কেলার		uint64	টীকা জন্য শনাক্তকারী.
টীকা/পয়েন্ট_কোর্ড	টেনসর	(1, 2)	float64	পয়েন্টটি মাস্ক তৈরি করতে মডেলটিতে ইনপুট সমন্বয় করে।
টীকা/অনুমানিত_iou	স্কেলার		float64	মুখোশের গুণমান সম্পর্কে মডেলের নিজস্ব ভবিষ্যদ্বাণী।
টীকা/বিভাজন	ফিচারসডিক্ট			COCO RLE ফরম্যাটে এনকোডেড সেগমেন্টেশন মাস্ক (কী `size` এবং `counts` সহ নির্দেশনা)।
টীকা/বিভাজন/গণনা	টেনসর		স্ট্রিং
টীকা/বিভাজন/আকার	টেনসর	(2,)	uint64
টীকা/স্থিরতা_স্কোর	স্কেলার		float64	মুখোশের গুণমানের একটি পরিমাপ।
ইমেজ	ফিচারসডিক্ট
ছবি/কন্টেন্ট	ছবি	(কোনটিই নয়, 3)	uint8	ছবির বিষয়বস্তু।
image/file_name	টেনসর		স্ট্রিং
ছবি/উচ্চতা	টেনসর		uint64
ছবি/ছবি_আইডি	টেনসর		uint64
ছবি/প্রস্থ	টেনসর		uint64

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):

উদ্ধৃতি :

@misc{kirillov2023segment,
  title={Segment Anything},
  author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
  year={2023},
  eprint={2304.02643},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}