- 説明:
QM9 は、C、H、O、N、F で構成される 134,000 個の安定した小さな有機分子の計算された幾何学的、エネルギー的、電子的、熱力学的特性で構成されています。いつものように、特徴付けられていない分子を削除し、残りの 130,831 個を提供します。
ソースコード:
tfds.datasets.qm9.Builderバージョン:
-
1.0.0(デフォルト): 初期リリース。
-
ダウンロードサイズ:
82.62 MiBデータセットのサイズ:
177.16 MiB機能の構造:
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- 機能ドキュメント:
| 特徴 | クラス | 形 | Dタイプ | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| あ | テンソル | float32 | ||
| B | テンソル | float32 | ||
| C | テンソル | float32 | ||
| 履歴書 | テンソル | float32 | ||
| G | テンソル | float32 | ||
| G_原子化 | テンソル | float32 | ||
| H | テンソル | float32 | ||
| H_原子化 | テンソル | float32 | ||
| インチチ | テンソル | 弦 | ||
| InChI_relaxed | テンソル | 弦 | ||
| Mulliken_charges | テンソル | (29,) | float32 | |
| 笑顔 | テンソル | 弦 | ||
| SMILES_リラックス | テンソル | 弦 | ||
| U | テンソル | float32 | ||
| U0 | テンソル | float32 | ||
| U0_原子化 | テンソル | float32 | ||
| U_原子化 | テンソル | float32 | ||
| アルファ | テンソル | float32 | ||
| 料金 | テンソル | (29,) | int64 | |
| 周波数 | テンソル | (なし、) | float32 | |
| ギャップ | テンソル | float32 | ||
| ホモ | テンソル | float32 | ||
| 索引 | テンソル | int64 | ||
| ルモ | テンソル | float32 | ||
| む | テンソル | float32 | ||
| 原子数 | テンソル | int64 | ||
| ポジション | テンソル | (29, 3) | float32 | |
| r2 | テンソル | float32 | ||
| タグ | テンソル | 弦 | ||
| ズプヴェ | テンソル | float32 |
監視キー(
as_superviseddoc を参照):None図( tfds.show_examples ): サポートされていません。
引用:
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/オリジナル (デフォルト設定)
構成の説明: QM9 では分割が定義されていません。したがって、このバリアントは、完全な QM9 データセットを元の順序 (シャッフルなし) でトレイン分割に配置します。
自動キャッシュ(ドキュメント):
shuffle_files=False(トレイン) の場合のみ分割:
| スプリット | 例 |
|---|---|
'train' | 130,831 |
- 例( tfds.as_dataframe ):
qm9/鵜
構成の説明: Cormorant によって使用されるデータセット分割。 100,000 のトレーニング、17,748 の検証、13,083 のテスト サンプル。分割はシード 0 でシャッフルした後に行われます。 論文: https://arxiv.org/abs/1906.04015分割: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=Falseの場合のみ (トレーニング)分割:
| スプリット | 例 |
|---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- 例( tfds.as_dataframe ):
qm9/ディメネット
構成の説明: DimeNet によって使用されるデータセット分割。 110,000 のトレーニング、10,000 の検証、10,831 のテスト サンプル。分割はシード 42 でシャッフルした後に行われます。 論文: https://arxiv.org/abs/2003.03123分割: https://github.com/gastigerjo/dimenet/blob/master/dimenet/training/data_provider.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=Falseの場合のみ (トレーニング)分割:
| スプリット | 例 |
|---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- 例( tfds.as_dataframe ):