- 설명 :
QM9는 C, H, O, N 및 F로 구성된 134k개의 안정적인 소형 유기 분자에 대해 계산된 기하학적, 에너지적, 전자적 및 열역학적 특성으로 구성됩니다. 평소와 같이 특성화되지 않은 분자를 제거하고 나머지 130,831개를 제공합니다.
소스 코드 :
tfds.datasets.qm9.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스입니다.
-
다운로드 크기 :
82.62 MiB
데이터세트 크기 :
177.16 MiB
기능 구조 :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
에이 | 텐서 | float32 | ||
비 | 텐서 | float32 | ||
기음 | 텐서 | float32 | ||
이력서 | 텐서 | float32 | ||
G | 텐서 | float32 | ||
G_원자화 | 텐서 | float32 | ||
시간 | 텐서 | float32 | ||
H_원자화 | 텐서 | float32 | ||
인치 | 텐서 | 끈 | ||
InChI_편안한 | 텐서 | 끈 | ||
Mulliken_charges | 텐서 | (29,) | float32 | |
미소 | 텐서 | 끈 | ||
SMILES_편안함 | 텐서 | 끈 | ||
유 | 텐서 | float32 | ||
U0 | 텐서 | float32 | ||
U0_원자화 | 텐서 | float32 | ||
U_원자화 | 텐서 | float32 | ||
알파 | 텐서 | float32 | ||
요금 | 텐서 | (29,) | 정수64 | |
주파수 | 텐서 | (없음,) | float32 | |
갭 | 텐서 | float32 | ||
호모 | 텐서 | float32 | ||
색인 | 텐서 | 정수64 | ||
루모 | 텐서 | float32 | ||
무 | 텐서 | float32 | ||
num_atoms | 텐서 | 정수64 | ||
위치 | 텐서 | (29, 3) | float32 | |
r2 | 텐서 | float32 | ||
꼬리표 | 텐서 | 끈 | ||
zpve | 텐서 | float32 |
감독되는 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (기본 구성)
구성 설명 : QM9는 분할을 정의하지 않습니다. 따라서 이 변형은 전체 QM9 데이터세트를 원래 순서(셔플링 없음)로 열차 분할에 배치합니다.
자동 캐시 ( 문서 ):
shuffle_files=False
인 경우에만(학습)분할 :
나뉘다 | 예 |
---|---|
'train' | 130,831 |
- 예 ( tfds.as_dataframe ):
qm9/가마우지
구성 설명 : Cormorant에서 사용하는 데이터 세트 분할입니다. 100,000개의 열차, 17,748개의 검증, 13,083개의 테스트 샘플. 분할은 시드 0으로 섞은 후에 발생합니다. 문서: https://arxiv.org/abs/1906.04015 분할: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
자동 캐시 ( 문서 ): 예(테스트, 검증),
shuffle_files=False
인 경우에만(학습)분할 :
나뉘다 | 예 |
---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- 예 ( tfds.as_dataframe ):
qm9/dimenet
구성 설명 : DimeNet에서 사용하는 데이터 세트 분할입니다. 학습 110,000개, 검증 10,000개, 테스트 샘플 10,831개. 분할은 시드 42로 섞은 후에 발생합니다. 문서: https://arxiv.org/abs/2003.03123 분할: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
자동 캐시 ( 문서 ): 예(테스트, 검증),
shuffle_files=False
인 경우에만(학습)분할 :
나뉘다 | 예 |
---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- 예 ( tfds.as_dataframe ):