stanford_hydra_dataset_converted_externally_to_rlds

  • Descrizione :

Franka risolve compiti a lungo orizzonte

Diviso Esempi
'train' 570
  • Struttura delle caratteristiche :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32, description=Robot action, consists of [3x EEF positional delta, 3x EEF orientation delta in euler angle, 1x close gripper].),
        'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
        'is_dense': Scalar(shape=(), dtype=bool, description=True if state is a waypoint(010) or in dense mode(x111).),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(240, 320, 3), dtype=uint8, description=Main camera RGB observation.),
            'state': Tensor(shape=(27,), dtype=float32, description=Robot state, consists of [3x EEF position,4x EEF orientation in quaternion,3x EEF orientation in euler angle,7x robot joint angles, 7x robot joint velocities,3x gripper state.),
            'wrist_image': Image(shape=(240, 320, 3), dtype=uint8, description=Wrist camera RGB observation.),
        }),
        'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
metadati_episodio CaratteristicheDict
metadati_episodio/percorso_file Testo corda Percorso del file di dati originale.
passi Set di dati
passi/azione Tensore (7,) float32 L'azione del robot consiste in [3x delta posizionale EEF, 3x delta orientamento EEF nell'angolo di Eulero, 1x pinza chiusa].
passi/sconto Scalare float32 Sconto se fornito, il valore predefinito è 1.
passi/è_denso Scalare bool Vero se lo stato è un waypoint (010) o in modalità densa (x111).
passi/è_primo Tensore bool
passi/è_ultimo Tensore bool
passi/è_terminale Tensore bool
passaggi/incorporamento_lingua Tensore (512,) float32 Incorporamento del linguaggio Kona. Vedi https://tfhub.dev/google/universal-sentence-encoder-large/5
passi/lingua_istruzioni Testo corda Insegnamento della lingua.
passi/osservazione CaratteristicheDict
passi/osservazione/immagine Immagine (240, 320, 3) uint8 Osservazione RGB della fotocamera principale.
passi/osservazione/stato Tensore (27,) float32 Lo stato del robot è costituito da [3x posizione EEF, 4x orientamento EEF in quaternione, 3x orientamento EEF in angolo di Eulero, 7x angoli del giunto del robot, 7x velocità del giunto del robot, 3x stato della pinza.
passi/osservazione/immagine_polso Immagine (240, 320, 3) uint8 Osservazione RGB con fotocamera da polso.
passi/ricompensa Scalare float32 Ricompensa se fornita, 1 nel passaggio finale per le demo.
  • Citazione :
@article{belkhale2023hydra,
 title={HYDRA: Hybrid Robot Actions for Imitation Learning},
 author={Belkhale, Suneel and Cui, Yuchen and Sadigh, Dorsa},
 journal={arxiv},
 year={2023}
}