qm9

  • Descripción :

QM9 consta de propiedades geométricas, energéticas, electrónicas y termodinámicas calculadas para 134k moléculas orgánicas pequeñas estables compuestas de C, H, O, N y F. Como de costumbre, eliminamos las moléculas no caracterizadas y proporcionamos las 130,831 restantes.

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
A Tensor flotador32
B Tensor flotador32
do Tensor flotador32
CV Tensor flotador32
GRAMO Tensor flotador32
G_atomización Tensor flotador32
h Tensor flotador32
H_atomización Tensor flotador32
InChi Tensor cadena
InChI_relajado Tensor cadena
Mulliken_charges Tensor (29,) flotador32
SONRISAS Tensor cadena
SONRISAS_relajadas Tensor cadena
Ud. Tensor flotador32
U0 Tensor flotador32
U0_atomización Tensor flotador32
U_atomización Tensor flotador32
alfa Tensor flotador32
cargos Tensor (29,) int64
frecuencias Tensor (Ninguno,) flotador32
brecha Tensor flotador32
homo Tensor flotador32
índice Tensor int64
lumo Tensor flotador32
mu Tensor flotador32
num_átomos Tensor int64
posiciones Tensor (29, 3) flotador32
r2 Tensor flotador32
etiqueta Tensor cadena
zpve Tensor flotador32
@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuración predeterminada)

  • Descripción de la configuración : QM9 no define ninguna división. Entonces, esta variante coloca el conjunto de datos QM9 completo en la división del tren, en el orden original (sin barajar).

  • Almacenamiento en caché automático ( documentación ): solo cuando shuffle_files=False (entrenamiento)

  • Divisiones :

Dividir Ejemplos
'train' 130.831

qm9/cormorán

Dividir Ejemplos
'test' 13.083
'train' 100.000
'validation' 17.748

qm9/dimenet

Dividir Ejemplos
'test' 10.831
'train' 110.000
'validation' 10.000