- Açıklama :
 
BIGPATENT, 1,3 milyon ABD patent belgesi kaydından ve insan tarafından yazılmış soyutlayıcı özetlerden oluşur. Her ABD patent başvurusu, bir Ortak Patent Sınıflandırması (CPC) kodu altında yapılır. Bu tür dokuz sınıflandırma kategorisi vardır:
- A (İnsani İhtiyaçlar),
 - B (İşlemleri Gerçekleştirme; Taşıma),
 - C (Kimya; Metalurji),
 - D (Tekstil; Kağıt),
 - E (Sabit Konstrüksiyonlar),
 - F (Makine Mühendisliği; Yıldırım; Isıtma; Silahlar; Patlatma),
 - G (Fizik),
 - H (Elektrik) ve
 - Y (Yeni veya çapraz kesitli teknolojinin genel etiketlemesi)
 
İki özellik vardır:
- açıklama: patentin ayrıntılı açıklaması.
 özet: Patent özeti.
Ek Belgeler : Kodlu Belgeleri Keşfedin
Ana Sayfa : https://evasharma.github.io/bigpatent/
Kaynak kodu :
tfds.datasets.big_patent.Buildersürümler :
-  
1.0.0: küçük harfli simgeleştirilmiş sözcükler -  
2.0.0: Büyük/küçük harfli ham dizeleri kullanmak için güncelleme -  
2.1.2(varsayılan): Büyük/küçük harfli ham dizilere yönelik güncellemeyi düzeltin. 
-  
 İndirme boyutu :
9.45 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
Özellik yapısı :
FeaturesDict({
    'abstract': Text(shape=(), dtype=string),
    'description': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| soyut | Metin | sicim | ||
| Tanım | Metin | sicim | 
Denetimli anahtarlar (Bkz.
as_superviseddoc ):('description', 'abstract')Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{sharma2019bigpatent,
    title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
    author={Eva Sharma and Chen Li and Lu Wang},
    year={2019},
    eprint={1906.03741},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
big_patent/all (varsayılan yapılandırma)
Yapılandırma açıklaması : Tüm kategoriler altındaki patentler.
Veri kümesi boyutu :
35.17 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 67.072 | 
 'train' | 1.207.222 | 
 'validation' | 67.068 | 
- Örnekler ( tfds.as_dataframe ):
 
big_patent/a
Yapılandırma açıklaması : İşbirlikçi Patent Sınıflandırması (CPC)a kapsamındaki Patentler: İnsani Gereklilikler
Veri kümesi boyutu :
5.16 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 9.675 | 
 'train' | 174.134 | 
 'validation' | 9.674 | 
- Örnekler ( tfds.as_dataframe ):
 
big_patent/b
Yapılandırma açıklaması : İşbirliğine Dayalı Patent Sınıflandırması (CPC)b kapsamındaki Patentler: İşlemlerin Gerçekleştirilmesi; taşıma
Veri kümesi boyutu :
4.06 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 8.974 | 
 'train' | 161.520 | 
 'validation' | 8.973 | 
- Örnekler ( tfds.as_dataframe ):
 
büyük_patent/c
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)c kapsamındaki patentler: Kimya; metalurji
Veri kümesi boyutu :
3.63 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 5.614 | 
 'train' | 101.042 | 
 'validation' | 5.613 | 
- Örnekler ( tfds.as_dataframe ):
 
büyük_patent/d
Yapılandırma açıklaması : Kooperatif Patent Sınıflandırması (CPC)d kapsamındaki patentler: Tekstiller; Kağıt
Veri kümesi boyutu :
255.56 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 565 | 
 'train' | 10.164 | 
 'validation' | 565 | 
- Örnekler ( tfds.as_dataframe ):
 
big_patent/e
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)e kapsamındaki Patentler: Sabit Yapılar
Veri kümesi boyutu :
871.40 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.914 | 
 'train' | 34.443 | 
 'validation' | 1.914 | 
- Örnekler ( tfds.as_dataframe ):
 
büyük_patent/f
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)f kapsamındaki patentler: Makine Mühendisliği; Yıldırım; Isıtma; Silahlar; patlatma
Veri kümesi boyutu :
2.06 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 4.754 | 
 'train' | 85.568 | 
 'validation' | 4.754 | 
- Örnekler ( tfds.as_dataframe ):
 
big_patent/g
Yapılandırma açıklaması : İşbirliğine Dayalı Patent Sınıflandırması (CPC)g: Fizik kapsamındaki patentler
Veri kümesi boyutu :
8.19 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 14.386 | 
 'train' | 258.935 | 
 'validation' | 14.385 | 
- Örnekler ( tfds.as_dataframe ):
 
big_patent/h
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)h kapsamındaki patentler: Elektrik
Veri kümesi boyutu :
7.50 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 14.279 | 
 'train' | 257.019 | 
 'validation' | 14.279 | 
- Örnekler ( tfds.as_dataframe ):
 
büyük_patent/y
Yapılandırma açıklaması : İşbirlikçi Patent Sınıflandırması (CPC)y kapsamındaki patentler: Yeni veya çapraz kesitli teknolojinin genel etiketlemesi
Veri kümesi boyutu :
3.46 GiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 6.911 | 
 'train' | 124.397 | 
 'validation' | 6.911 | 
- Örnekler ( tfds.as_dataframe ):