- Açıklama :
 
CoNLL-2002'nin paylaşılan görevi, dilden bağımsız adlandırılmış varlık tanıma ile ilgilidir. Adlandırılmış varlık türleri şunları içerir: önceki üç gruba ait olmayan kişiler, yerler, kuruluşlar ve çeşitli varlıkların adları. Paylaşılan görevin katılımcılarına en az iki dil için eğitim ve test verileri sunuldu. Bu paylaşılan görevde eğitim verileri dışındaki bilgi kaynakları kullanılmış olabilir.
Anasayfa : https://aclanthology.org/W02-2024/
Kaynak kodu :
tfds.text.conll2002.Conll2002sürümler :
-  
1.0.0(varsayılan): İlk sürüm. 
-  
 Otomatik önbelleğe alınmış ( belgeleme ): Evet
Denetlenen anahtarlar (Bkz
as_superviseddoc ):NoneŞekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{tjong-kim-sang-2002-introduction,
    title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.",
    booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
    year = "2002",
    url = "https://aclanthology.org/W02-2024",
}
conll2002/es (varsayılan yapılandırma)
İndirme boyutu :
3.95 MiBVeri kümesi boyutu :
3.52 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'dev' | 1.916 | 
 'test' | 1.518 | 
 'train' | 8.324 | 
- Özellik yapısı :
 
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Açıklama | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| ner | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
| pozisyon | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
| belirteçler | Sıra(Metin) | (Hiçbiri,) | sicim | 
- Örnekler ( tfds.as_dataframe ):
 
conll2002/nl
İndirme boyutu :
3.47 MiBVeri kümesi boyutu :
3.55 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'dev' | 2.896 | 
 'test' | 5.196 | 
 'train' | 15.807 | 
- Özellik yapısı :
 
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Açıklama | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| ner | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
| pozisyon | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
| belirteçler | Sıra(Metin) | (Hiçbiri,) | sicim | 
- Örnekler ( tfds.as_dataframe ):