- תיאור :
QM9 מורכב מתכונות גיאומטריות, אנרגטיות, אלקטרוניות ותרמודינמיות מחושבות עבור מולקולות אורגניות קטנות יציבות של 134k המורכבות מ-C, H, O, N ו-F. כרגיל, אנו מסירים את המולקולות הלא מאופיינות ומספקים את 130,831 הנותרים.
קוד מקור :
tfds.datasets.qm9.Builderגרסאות :
-
1.0.0(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
82.62 MiBגודל מערך נתונים :
177.16 MiBמבנה תכונה :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- תיעוד תכונה :
| תכונה | מַחלָקָה | צוּרָה | Dtype | תֵאוּר |
|---|---|---|---|---|
| FeaturesDict | ||||
| א | מוֹתֵחַ | לצוף32 | ||
| ב | מוֹתֵחַ | לצוף32 | ||
| ג | מוֹתֵחַ | לצוף32 | ||
| קורות חיים | מוֹתֵחַ | לצוף32 | ||
| G | מוֹתֵחַ | לצוף32 | ||
| G_אטומיזציה | מוֹתֵחַ | לצוף32 | ||
| ח | מוֹתֵחַ | לצוף32 | ||
| H_atomization | מוֹתֵחַ | לצוף32 | ||
| InChI | מוֹתֵחַ | חוּט | ||
| InChI_רגוע | מוֹתֵחַ | חוּט | ||
| Mulliken_charges | מוֹתֵחַ | (29,) | לצוף32 | |
| חיוכים | מוֹתֵחַ | חוּט | ||
| SMILES_רגוע | מוֹתֵחַ | חוּט | ||
| U | מוֹתֵחַ | לצוף32 | ||
| U0 | מוֹתֵחַ | לצוף32 | ||
| U0_אטומיזציה | מוֹתֵחַ | לצוף32 | ||
| U_atomization | מוֹתֵחַ | לצוף32 | ||
| אלפא | מוֹתֵחַ | לצוף32 | ||
| חיובים | מוֹתֵחַ | (29,) | int64 | |
| תדרים | מוֹתֵחַ | (אַף לֹא אֶחָד,) | לצוף32 | |
| פַּעַר | מוֹתֵחַ | לצוף32 | ||
| הומו | מוֹתֵחַ | לצוף32 | ||
| מַדָד | מוֹתֵחַ | int64 | ||
| לומו | מוֹתֵחַ | לצוף32 | ||
| מו | מוֹתֵחַ | לצוף32 | ||
| מספר_אטומים | מוֹתֵחַ | int64 | ||
| עמדות | מוֹתֵחַ | (29, 3) | לצוף32 | |
| r2 | מוֹתֵחַ | לצוף32 | ||
| תָג | מוֹתֵחַ | חוּט | ||
| zpve | מוֹתֵחַ | לצוף32 |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (תצורת ברירת המחדל)
תיאור תצורה : QM9 אינו מגדיר פיצולים. אז גרסה זו מכניסה את מערך הנתונים המלא של QM9 לפיצול הרכבת, בסדר המקורי (ללא דשדוש).
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 130,831 |
- דוגמאות ( tfds.as_dataframe ):
qm9/קורמורן
תיאור תצורה : פיצול מערך הנתונים בשימוש על ידי קורמורנט. 100,000 רכבות, 17,748 אימות ו-13,083 דגימות בדיקה. פיצול מתרחש לאחר ערבוב עם זרע 0. נייר: https://arxiv.org/abs/1906.04015 פיצול: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
שמור אוטומטי במטמון ( תיעוד ): כן (בדיקה, אימות), רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- דוגמאות ( tfds.as_dataframe ):
qm9/dimenet
תיאור תצורה : פיצול מערך נתונים בשימוש על ידי DimeNet. 110,000 רכבות, 10,000 אימות ו-10,831 דגימות בדיקה. פיצול מתרחש לאחר ערבוב עם זרע 42. נייר: https://arxiv.org/abs/2003.03123 פיצול: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
שמור אוטומטי במטמון ( תיעוד ): כן (בדיקה, אימות), רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- דוגמאות ( tfds.as_dataframe ):