- বর্ণনা :
RL আনপ্লাগড হল অফলাইন রিইনফোর্সমেন্ট শেখার জন্য বেঞ্চমার্কের স্যুট। RL আনপ্লাগড নিম্নলিখিত বিবেচনার ভিত্তিতে ডিজাইন করা হয়েছে: ব্যবহারের সহজতর করার জন্য, আমরা একটি ইউনিফাইড API সহ ডেটাসেটগুলি সরবরাহ করি যা অনুশীলনকারীর পক্ষে একটি সাধারণ পাইপলাইন প্রতিষ্ঠিত হওয়ার পরে স্যুটের সমস্ত ডেটার সাথে কাজ করা সহজ করে তোলে।
ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।
ডেটাসেটের উদাহরণগুলি https://arxiv.org/abs/1904.12901- এ বর্ণিত আংশিকভাবে অনলাইন প্রশিক্ষিত এজেন্ট চালানোর সময় সংরক্ষিত SAR ট্রানজিশনগুলিকে উপস্থাপন করে, যেমন https://github.com/google-research- এ উল্লেখ করা হয়েছে আমরা RLDS ডেটাসেট বিন্যাস অনুসরণ করি /rlds#dataset-format
আমরা মোট 8টি টাস্কে 40টি ডেটাসেট প্রকাশ করি -- কোন সম্মিলিত চ্যালেঞ্জ ছাড়াই এবং কার্টপোল, ওয়াকার, চতুষ্পদ এবং মানবিক কাজগুলিতে সহজ সম্মিলিত চ্যালেঞ্জ ছাড়াই। প্রতিটি টাস্কে 5টি বিভিন্ন আকারের ডেটাসেট রয়েছে, 1%, 5%, 20%, 40% এবং 100%। মনে রাখবেন যে ছোট ডেটাসেটটি বড়গুলির একটি উপসেট হওয়ার নিশ্চয়তা দেয় না। কীভাবে ডেটাসেট তৈরি করা হয়েছিল তার বিশদ বিবরণের জন্য, অনুগ্রহ করে কাগজটি পড়ুন।
হোমপেজ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
উত্স কোড :
tfds.rl_unplugged.rlu_rwrl.RluRwrlসংস্করণ :
-
1.0.0: প্রাথমিক প্রকাশ। -
1.0.1(ডিফল্ট): RLU RWRL ডেটাসেটের একটি বাগ ফিক্স করে যেখানে হিউম্যানয়েড ডেটাসেটের একটিতে ডুপ্লিকেট করা পর্ব আইডি রয়েছে।
-
ডাউনলোড আকার :
Unknown sizeতত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (ডিফল্ট কনফিগারেশন)
ডেটাসেটের আকার :
172.43 KiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
ডেটাসেটের আকার :
862.13 KiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
ডেটাসেটের আকার :
3.37 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
ডেটাসেটের আকার :
6.74 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
ডেটাসেটের আকার :
16.84 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
1.77 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
8.86 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
35.46 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
70.92 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
177.29 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
6.27 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 50 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
31.34 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 250 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
125.37 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
250.75 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
626.86 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
69.40 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
346.98 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
1.36 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
2.71 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 8,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
6.78 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 20,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
369.84 KiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
1.81 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
7.22 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
14.45 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
36.12 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
1.97 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
9.83 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
39.31 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
78.63 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
196.57 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
8.20 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 50 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
40.98 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 250 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
163.93 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
327.86 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
819.65 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 5,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
77.11 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
385.54 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
1.51 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
3.01 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 8,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
7.53 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 20,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
| পদক্ষেপ | ডেটাসেট | |||
| পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
| steps/is_first | টেনসর | bool | ||
| ধাপ/শেষ_শেষ | টেনসর | bool | ||
| steps/is_terminal | টেনসর | bool | ||
| পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
| পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-১ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষন/চূড়া | টেনসর | (12,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
| পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
| পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):