qm9

  • Description :

QM9 comprend les propriétés géométriques, énergétiques, électroniques et thermodynamiques calculées pour 134 000 petites molécules organiques stables composées de C, H, O, N et F. Comme d'habitude, nous supprimons les molécules non caractérisées et fournissons les 130 831 restantes.

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
UN Tenseur flotteur32
B Tenseur flotteur32
C Tenseur flotteur32
CV Tenseur flotteur32
G Tenseur flotteur32
G_atomisation Tenseur flotteur32
H Tenseur flotteur32
H_atomisation Tenseur flotteur32
InChI Tenseur chaîne
InChI_relaxé Tenseur chaîne
Mulliken_charges Tenseur (29,) flotteur32
SOURIRES Tenseur chaîne
SMILES_détendu Tenseur chaîne
U Tenseur flotteur32
U0 Tenseur flotteur32
U0_atomisation Tenseur flotteur32
U_atomisation Tenseur flotteur32
alpha Tenseur flotteur32
frais Tenseur (29,) int64
fréquences Tenseur (Aucun,) flotteur32
écart Tenseur flotteur32
homo Tenseur flotteur32
indice Tenseur int64
lumo Tenseur flotteur32
mu Tenseur flotteur32
num_atomes Tenseur int64
postes Tenseur (29, 3) flotteur32
r2 Tenseur flotteur32
étiqueter Tenseur chaîne
zpve Tenseur flotteur32
@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuration par défaut)

  • Description de la config : QM9 ne définit aucun split. Ainsi, cette variante place l'ensemble de données QM9 complet dans la répartition du train, dans l'ordre d'origine (pas de brassage).

  • Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)

  • Divisions :

Diviser Exemples
'train' 130 831

qm9/cormoran

Diviser Exemples
'test' 13 083
'train' 100 000
'validation' 17 748

qm9/dimenet

Diviser Exemples
'test' 10 831
'train' 110 000
'validation' 10 000