تدفق التوتر:: العمليات:: ثابتUnigramCandidateSampler:: Attrs
#include <candidate_sampling_ops.h>
محددات السمات الاختيارية لـ FixedUnigramCandidateSampler .
ملخص
الصفات العامة | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
الوظائف العامة | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs يتم استخدام التشويه لتحريف توزيع احتمالية unigram. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs اختياريًا، يمكن إضافة بعض المعرفات المحجوزة في النطاق [0، ...، num_reserved_ids) بواسطة المستخدمين. |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs بذرة ثانية لتجنب اصطدام البذور. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs قائمة بأعداد أو احتمالات unigram، واحدة لكل معرف بترتيب تسلسلي. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs كل سطر صالح في هذا الملف (الذي يجب أن يكون بتنسيق CSV) يتوافق مع معرف كلمة صالح. |
الصفات العامة
تشويه_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
بذرة2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
بذرة_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
قشرة_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
يونيجرام_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
vocab_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
الوظائف العامة
تشويه
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
يتم استخدام التشويه لتحريف توزيع احتمالية unigram.
يتم رفع كل وزن أولاً إلى قوة التشويه قبل إضافته إلى توزيع الأحادي الداخلي. ونتيجة لذلك، فإن التشويه = 1.0 يعطي عينة منتظمة من أحادي جرام (كما هو محدد في ملف المفردات)، والتشويه = 0.0 يعطي توزيعًا موحدًا.
الإعدادات الافتراضية إلى 1
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
اختياريًا، يمكن إضافة بعض المعرفات المحجوزة في النطاق [0، ...، num_reserved_ids) بواسطة المستخدمين.
إحدى حالات الاستخدام هي أنه يتم استخدام رمز مميز لكلمة غير معروفة كمعرف 0. وسيكون لهذه المعرفات احتمالية أخذ العينات 0.
الإعدادات الافتراضية إلى 0
نومشاردز
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.
تشير هذه المعلمة (مع 'shard') إلى عدد الأقسام المستخدمة في الحساب الإجمالي.
الإعدادات الافتراضية إلى 1
بذرة
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة.
خلاف ذلك، يتم زرعها بواسطة بذرة عشوائية.
الإعدادات الافتراضية إلى 0
البذور2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
بذرة ثانية لتجنب اصطدام البذور.
الإعدادات الافتراضية إلى 0
قشرة
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.
تشير هذه المعلمة (مع 'num_shards') إلى رقم القسم المحدد لعملية أخذ العينات، عند استخدام التقسيم.
الإعدادات الافتراضية إلى 0
يونيجرامز
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
قائمة بأعداد أو احتمالات unigram، واحد لكل معرف بترتيب تسلسلي.
يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.
الإعدادات الافتراضية إلى []
VocabFile
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
كل سطر صالح في هذا الملف (الذي يجب أن يكون بتنسيق CSV) يتوافق مع معرف كلمة صالح.
المعرفات مرتبة تسلسليًا، بدءًا من num_reserved_ids. من المتوقع أن يكون الإدخال الأخير في كل سطر قيمة مقابلة للعدد أو الاحتمال النسبي. يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.
الإعدادات الافتراضية إلى ""
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2025-01-08 (حسب التوقيت العالمي المتفَّق عليه)