mq9

  • Descrizione :

QM9 consiste nel calcolo delle proprietà geometriche, energetiche, elettroniche e termodinamiche per 134.000 piccole molecole organiche stabili costituite da C, H, O, N e F. Come al solito, rimuoviamo le molecole non caratterizzate e forniamo le restanti 130.831.

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
UN Tensore float32
B Tensore float32
C Tensore float32
Cv Tensore float32
G Tensore float32
G_atomizzazione Tensore float32
H Tensore float32
H_atomizzazione Tensore float32
InChI Tensore corda
InChI_rilassato Tensore corda
Mulliken_charges Tensore (29,) float32
SORRISI Tensore corda
SORRISI_rilassato Tensore corda
U Tensore float32
U0 Tensore float32
U0_atomizzazione Tensore float32
U_atomizzazione Tensore float32
alfa Tensore float32
spese Tensore (29,) int64
frequenze Tensore (Nessuno,) float32
spacco Tensore float32
omo Tensore float32
indice Tensore int64
lumo Tensore float32
mu Tensore float32
num_atomi Tensore int64
posizioni Tensore (29, 3) float32
r2 Tensore float32
etichetta Tensore corda
zpve Tensore float32
@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/originale (configurazione predefinita)

  • Descrizione della configurazione : QM9 non definisce alcuna suddivisione. Quindi questa variante inserisce l'intero set di dati QM9 nella suddivisione del treno, nell'ordine originale (senza mescolamento).

  • Memorizzazione nella cache automatica ( documentazione ): solo quando shuffle_files=False (train)

  • Divide :

Diviso Esempi
'train' 130.831

qm9/cormorano

Diviso Esempi
'test' 13.083
'train' 100.000
'validation' 17.748

qm9/dimenet

Diviso Esempi
'test' 10.831
'train' 110.000
'validation' 10.000