- Descripción :
QM9 consta de propiedades geométricas, energéticas, electrónicas y termodinámicas calculadas para 134k moléculas orgánicas pequeñas estables compuestas de C, H, O, N y F. Como de costumbre, eliminamos las moléculas no caracterizadas y proporcionamos las 130,831 restantes.
Página de inicio : https://doi.org/10.6084/m9.figshare.c.978904.v5
Código fuente :
tfds.datasets.qm9.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de descarga :
82.62 MiB
Tamaño del conjunto de datos :
177.16 MiB
Estructura de características :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
A | Tensor | flotador32 | ||
B | Tensor | flotador32 | ||
do | Tensor | flotador32 | ||
CV | Tensor | flotador32 | ||
GRAMO | Tensor | flotador32 | ||
G_atomización | Tensor | flotador32 | ||
h | Tensor | flotador32 | ||
H_atomización | Tensor | flotador32 | ||
InChi | Tensor | cadena | ||
InChI_relajado | Tensor | cadena | ||
Mulliken_charges | Tensor | (29,) | flotador32 | |
SONRISAS | Tensor | cadena | ||
SONRISAS_relajadas | Tensor | cadena | ||
Ud. | Tensor | flotador32 | ||
U0 | Tensor | flotador32 | ||
U0_atomización | Tensor | flotador32 | ||
U_atomización | Tensor | flotador32 | ||
alfa | Tensor | flotador32 | ||
cargos | Tensor | (29,) | int64 | |
frecuencias | Tensor | (Ninguno,) | flotador32 | |
brecha | Tensor | flotador32 | ||
homo | Tensor | flotador32 | ||
índice | Tensor | int64 | ||
lumo | Tensor | flotador32 | ||
mu | Tensor | flotador32 | ||
num_átomos | Tensor | int64 | ||
posiciones | Tensor | (29, 3) | flotador32 | |
r2 | Tensor | flotador32 | ||
etiqueta | Tensor | cadena | ||
zpve | Tensor | flotador32 |
Claves supervisadas (ver documento
as_supervised
):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (configuración predeterminada)
Descripción de la configuración : QM9 no define ninguna división. Entonces, esta variante coloca el conjunto de datos QM9 completo en la división del tren, en el orden original (sin barajar).
Almacenamiento en caché automático ( documentación ): solo cuando
shuffle_files=False
(entrenamiento)Divisiones :
Dividir | Ejemplos |
---|---|
'train' | 130.831 |
- Ejemplos ( tfds.as_dataframe ):
qm9/cormorán
Descripción de la configuración : división del conjunto de datos utilizada por Cormorant. 100.000 trenes, 17.748 validaciones y 13.083 muestras de prueba. La división ocurre después de mezclar con la semilla 0. Documento: https://arxiv.org/abs/1906.04015 División: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Almacenamiento en caché automático ( documentación ): Sí (prueba, validación), solo cuando
shuffle_files=False
(entrenamiento)Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
- Ejemplos ( tfds.as_dataframe ):
qm9/dimenet
Descripción de la configuración : división del conjunto de datos utilizada por DimeNet. 110.000 trenes, 10.000 validaciones y 10.831 muestras de prueba. La división ocurre después de mezclar con la semilla 42. Documento: https://arxiv.org/abs/2003.03123 División: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Almacenamiento en caché automático ( documentación ): Sí (prueba, validación), solo cuando
shuffle_files=False
(entrenamiento)Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 10.831 |
'train' | 110.000 |
'validation' | 10.000 |
- Ejemplos ( tfds.as_dataframe ):