- Keterangan :
QM9 terdiri dari sifat geometris, energik, elektronik, dan termodinamika yang dihitung untuk 134k molekul organik kecil stabil yang terdiri dari C, H, O, N, dan F. Seperti biasa, kami menghilangkan molekul yang tidak dikarakterisasi dan menyediakan 130.831 sisanya.
Kode sumber :
tfds.datasets.qm9.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
82.62 MiB
Ukuran kumpulan data :
177.16 MiB
Struktur fitur :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
A | Tensor | float32 | ||
B | Tensor | float32 | ||
C | Tensor | float32 | ||
CV | Tensor | float32 | ||
G | Tensor | float32 | ||
G_atomisasi | Tensor | float32 | ||
H | Tensor | float32 | ||
H_atomisasi | Tensor | float32 | ||
Di ChI | Tensor | rangkaian | ||
DiChI_santai | Tensor | rangkaian | ||
Mulliken_biaya | Tensor | (29,) | float32 | |
SENYUM | Tensor | rangkaian | ||
SMILES_santai | Tensor | rangkaian | ||
kamu | Tensor | float32 | ||
U0 | Tensor | float32 | ||
U0_atomisasi | Tensor | float32 | ||
U_atomisasi | Tensor | float32 | ||
alfa | Tensor | float32 | ||
biaya | Tensor | (29,) | int64 | |
frekuensi | Tensor | (Tidak ada,) | float32 | |
celah | Tensor | float32 | ||
homo | Tensor | float32 | ||
indeks | Tensor | int64 | ||
lumo | Tensor | float32 | ||
mu | Tensor | float32 | ||
jumlah_atom | Tensor | int64 | ||
posisi | Tensor | (29, 3) | float32 | |
r2 | Tensor | float32 | ||
menandai | Tensor | rangkaian | ||
zpve | Tensor | float32 |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/asli (konfigurasi default)
Deskripsi konfigurasi : QM9 tidak mendefinisikan pemisahan apa pun. Jadi varian ini menempatkan kumpulan data QM9 lengkap dalam pemisahan kereta, dalam urutan aslinya (tanpa pengacakan).
Cache otomatis ( dokumentasi ): Hanya ketika
shuffle_files=False
(kereta)Perpecahan :
Membelah | Contoh |
---|---|
'train' | 130.831 |
- Contoh ( tfds.as_dataframe ):
qm9/dandang
Deskripsi konfigurasi : Pemisahan kumpulan data yang digunakan oleh Cormorant. 100.000 train, 17.748 validasi, dan 13.083 sampel uji. Pemisahan terjadi setelah pengocokan dengan seed 0. Makalah: https://arxiv.org/abs/1906.04015 Pemisahan: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Cache otomatis ( dokumentasi ): Ya (pengujian, validasi), Hanya ketika
shuffle_files=False
(latihan)Perpecahan :
Membelah | Contoh |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
- Contoh ( tfds.as_dataframe ):
qm9/dimenet
Deskripsi konfigurasi : Pemisahan kumpulan data yang digunakan oleh DimeNet. 110.000 latih, 10.000 validasi, dan 10.831 sampel uji. Pemisahan terjadi setelah pengocokan dengan seed 42. Makalah: https://arxiv.org/abs/2003.03123 Pemisahan: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Cache otomatis ( dokumentasi ): Ya (pengujian, validasi), Hanya ketika
shuffle_files=False
(latihan)Perpecahan :
Membelah | Contoh |
---|---|
'test' | 10.831 |
'train' | 110.000 |
'validation' | 10.000 |
- Contoh ( tfds.as_dataframe ):