वाइला

  • विवरण :

फ्रेंका रोबोट शैलीगत रसोई कार्यों के साथ बातचीत कर रहा है

विभाजित करना उदाहरण
'test' 15
'train' 135
  • फ़ीचर संरचना :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'gripper_closedness_action': float32,
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': float32,
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_rgb': Image(shape=(224, 224, 3), dtype=uint8, description=RGB captured by workspace camera),
            'ee_states': Tensor(shape=(16,), dtype=float32, description=Pose of the end effector specified as a homogenous matrix.),
            'eye_in_hand_rgb': Image(shape=(224, 224, 3), dtype=uint8, description=RGB captured by in hand camera),
            'gripper_states': Tensor(shape=(1,), dtype=float32, description=gripper_states = 0 means the gripper is fully closed. The value represents the gripper width of Franka Panda Gripper.),
            'joint_states': Tensor(shape=(7,), dtype=float32, description=joint values),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
कदम डेटासेट
कदम/कार्रवाई फीचर्सडिक्ट
चरण/कार्रवाई/ग्रिपर_क्लोज्डनेस_एक्शन टेन्सर फ्लोट32
चरण/क्रिया/रोटेशन_डेल्टा टेन्सर (3,) फ्लोट32
चरण/कार्रवाई/समाप्त_एपिसोड टेन्सर फ्लोट32
चरण/कार्रवाई/विश्व_वेक्टर टेन्सर (3,) फ्लोट32
चरण/पहला है टेन्सर बूल
चरण/अंतिम है टेन्सर बूल
चरण/is_terminal टेन्सर बूल
चरण/अवलोकन फीचर्सडिक्ट
चरण/अवलोकन/एजेंटव्यू_आरजीबी छवि (224, 224, 3) uint8 कार्यस्थल कैमरे द्वारा आरजीबी कैप्चर किया गया
चरण/अवलोकन/ee_states टेन्सर (16,) फ्लोट32 एक समरूप मैट्रिक्स के रूप में निर्दिष्ट अंतिम प्रभावकार की मुद्रा।
चरण/अवलोकन/आंख_में_हाथ_आरजीबी छवि (224, 224, 3) uint8 RGB को इन हैंड कैमरे से कैप्चर किया गया
चरण/अवलोकन/ग्रिपर_स्टेट्स टेन्सर (1,) फ्लोट32 ग्रिपर_स्टेट्स = 0 का मतलब है कि ग्रिपर पूरी तरह से बंद है। मान फ्रेंका पांडा ग्रिपर की ग्रिपर चौड़ाई को दर्शाता है।
चरण/अवलोकन/joint_states टेन्सर (7,) फ्लोट32 संयुक्त मूल्य
चरण/अवलोकन/प्राकृतिक_भाषा_एम्बेडिंग टेन्सर (512,) फ्लोट32
चरण/अवलोकन/प्राकृतिक_भाषा_निर्देश टेन्सर डोरी
कदम/इनाम अदिश फ्लोट32
  • उद्धरण :
@article{zhu2022viola,
  title={VIOLA: Imitation Learning for Vision-Based Manipulation with Object Proposal Priors},
  author={Zhu, Yifeng and Joshi, Abhishek and Stone, Peter and Zhu, Yuke},
  journal={6th Annual Conference on Robot Learning (CoRL)},
  year={2022}
}