جریان تنسور:: عملیات:: QuantizeV2

#include <array_ops.h>

تانسور «ورودی» از نوع شناور را به تانسور «خروجی» از نوع «T» کمی کنید.

خلاصه

[min_range، max_range] شناورهای اسکالر هستند که محدوده را برای داده های "ورودی" مشخص می کنند. ویژگی 'mode' دقیقاً کنترل می کند که کدام محاسبات برای تبدیل مقادیر شناور به معادل های کوانتیزه شده آنها استفاده می شود. ویژگی 'round_mode' کنترل می‌کند که کدام الگوریتم گره‌شکنی گرد هنگام گرد کردن مقادیر شناور به معادل‌های کوانتیزه‌شده آن‌ها استفاده می‌شود.

در حالت "MIN_COMBINED"، هر مقدار تانسور تحت شرایط زیر قرار می گیرد:

out[i] = (in[i] - min_range) * range(T) / (max_range - min_range)
if T == qint8: out[i] -= (range(T) + 1) / 2.0

اینجا range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min()

مثال حالت MIN_COMBINED

فرض کنید ورودی از نوع float است و دارای محدوده احتمالی [0.0، 6.0] و نوع خروجی quint8 است ([0، 255]). مقادیر min_range و max_range باید به صورت 0.0 و 6.0 مشخص شوند. کوانتیز کردن از float به quint8 هر مقدار ورودی را در 255/6 ضرب می‌کند و به quint8 تبدیل می‌شود.

اگر نوع خروجی qint8 بود ([-128, 127])، عملیات علاوه بر این، قبل از ریخته‌گری، هر مقدار را 128 کم می‌کند، به طوری که محدوده مقادیر با محدوده qint8 همسو می‌شود.

اگر حالت "MIN_FIRST" باشد، از این روش استفاده می شود:

num_discrete_values = 1 << (# of bits in T)
range_adjust = num_discrete_values / (num_discrete_values - 1)
range = (range_max - range_min) * range_adjust
range_scale = num_discrete_values / range
quantized = round(input * range_scale) - round(range_min * range_scale) +
  numeric_limits::min()
quantized = max(quantized, numeric_limits::min())
quantized = min(quantized, numeric_limits::max())

بزرگترین تفاوت بین این و MIN_COMBINED این است که حداقل محدوده ابتدا گرد می شود، قبل از اینکه از مقدار گرد شده کم شود. با MIN_COMBINED، یک سوگیری کوچک معرفی می‌شود که در آن تکرارهای مکرر کوانتیزه‌سازی و کمی‌سازی خطای بزرگ‌تر و بزرگ‌تری ایجاد می‌کند.

حالت SCALED مثال

حالت SCALED با رویکرد کوانتیزاسیون مورد استفاده در QuantizeAndDequantize{V2|V3} مطابقت دارد.

اگر حالت SCALED باشد، کوانتیزاسیون با ضرب هر مقدار ورودی در یک scaling_factor انجام می‌شود. scaling_factor از min_range و max_range تا حد امکان بزرگ تعیین می شود به طوری که محدوده از min_range تا max_range قابل نمایش در مقادیر نوع T باشد.

  

  const int min_T = std::numeric_limits::min();
  const int max_T = std::numeric_limits::max();
  const float max_float = std::numeric_limits::max();

  const float scale_factor_from_min_side =
      (min_T * min_range > 0) ? min_T / min_range : max_float;
  const float scale_factor_from_max_side =
      (max_T * max_range > 0) ? max_T / max_range : max_float;

  const float scale_factor = std::min(scale_factor_from_min_side,
                                      scale_factor_from_max_side);

سپس از scale_factor برای تنظیم min_range و max_range به صورت زیر استفاده می کنیم:

      min_range = min_T / scale_factor;
      max_range = max_T / scale_factor;

به عنوان مثال، اگر T = qint8، و در ابتدا min_range = -10، و max_range = 9، -128/-10.0 = 12.8 را با 127/9.0 = 14.11 مقایسه می کنیم، و scaling_factor = 12.8 را تنظیم می کنیم در این حالت، min_range -10 باقی می ماند. اما max_range به 127 / 12.8 = 9.921875 تنظیم می شود

بنابراین مقادیر ورودی را در محدوده (-10، 9.921875) تا (128-127) کوانتیزه می کنیم.

اکنون می توان تانسور ورودی را با برش مقادیر در محدوده min_range تا max_range ، و سپس ضرب در scale_factor به صورت زیر تعیین کرد:

result = round(min(max_range, max(min_range, input)) * scale_factor)

min_range و max_range تنظیم شده به عنوان خروجی های 2 و 3 این عملیات برگردانده می شوند. این خروجی ها باید به عنوان محدوده برای هر گونه محاسبات بیشتر استفاده شوند.

خصیصه narrow_range (bool).

اگر درست باشد، از حداقل مقدار کوانتیزه استفاده نمی کنیم. یعنی برای int8 خروجی کوانتیزه شده، به جای محدوده کامل -128..127 به محدوده -127..127 محدود می شود. این برای سازگاری با باطن استنتاج خاصی ارائه شده است. (فقط برای حالت SCALED اعمال می شود)

ویژگی محور (int).

یک ویژگی axis اختیاری می‌تواند یک شاخص بعد از تانسور ورودی را مشخص کند، به طوری که محدوده‌های کوانتیزاسیون به طور جداگانه برای هر برش از تانسور در امتداد آن بعد محاسبه و اعمال می‌شود. این برای کوانتیزاسیون هر کانال مفید است.

اگر محور مشخص شده باشد، min_range و max_range

اگر axis =هیچ‌کدام باشد، کوانتیزاسیون در هر تانسور به صورت عادی انجام می‌شود.

ویژگی sure_minimum_range (float).

اطمینان حاصل می کند که حداقل محدوده کوانتیزاسیون حداقل این مقدار است. مقدار پیش‌فرض قدیمی برای این 0.01 است، اما اکیداً پیشنهاد می‌شود آن را برای استفاده‌های جدید روی 0 تنظیم کنید.

استدلال ها:

  • scope: یک شی Scope
  • min_range: حداقل مقدار محدوده کوانتیزاسیون. این مقدار ممکن است بسته به پارامترهای دیگر توسط op تنظیم شود. مقدار تنظیم شده در output_min نوشته می شود. اگر ویژگی axis مشخص شده باشد، این باید یک تانسور 1 بعدی باشد که اندازه آن با بعد axis تانسورهای ورودی و خروجی مطابقت داشته باشد.
  • max_range: حداکثر مقدار محدوده کوانتیزاسیون. این مقدار ممکن است بسته به پارامترهای دیگر توسط op تنظیم شود. مقدار تنظیم شده به output_max نوشته می شود. اگر ویژگی axis مشخص شده باشد، این باید یک تانسور 1 بعدی باشد که اندازه آن با بعد axis تانسورهای ورودی و خروجی مطابقت داشته باشد.

برمی‌گرداند:

  • خروجی Output : داده های کوانتیزه شده تولید شده از ورودی شناور.
  • Output output_min: حداقل محدوده کوانتیزاسیون نهایی که برای برش مقادیر ورودی قبل از مقیاس بندی و گرد کردن آنها به مقادیر کوانتیزه استفاده می شود. اگر ویژگی axis مشخص شده باشد، این یک تانسور 1 بعدی خواهد بود که اندازه آن با بعد axis تانسورهای ورودی و خروجی مطابقت دارد.
  • Output output_max: حداکثر دامنه کوانتیزاسیون نهایی که برای برش مقادیر ورودی قبل از مقیاس بندی و گرد کردن آنها به مقادیر کوانتیزه استفاده می شود. اگر ویژگی axis مشخص شده باشد، این یک تانسور 1 بعدی خواهد بود که اندازه آن با بعد axis تانسورهای ورودی و خروجی مطابقت دارد.

سازندگان و ویرانگرها

QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T)
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs)

صفات عمومی

operation
output
output_max
output_min

توابع استاتیک عمومی

Axis (int64 x)
EnsureMinimumRange (float x)
Mode (StringPiece x)
NarrowRange (bool x)
RoundMode (StringPiece x)

سازه ها

tensorflow:: ops:: QuantizeV2:: Attrs

تنظیم کننده های ویژگی اختیاری برای QuantizeV2 .

صفات عمومی

عملیات

Operation operation

خروجی

::tensorflow::Output output

خروجی_حداکثر

::tensorflow::Output output_max

خروجی_دقیقه

::tensorflow::Output output_min

توابع عمومی

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T
)

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T,
  const QuantizeV2::Attrs & attrs
)

توابع استاتیک عمومی

محور

Attrs Axis(
  int64 x
)

حداقل محدوده را تضمین کنید

Attrs EnsureMinimumRange(
  float x
)

حالت

Attrs Mode(
  StringPiece x
)

محدوده باریک

Attrs NarrowRange(
  bool x
)

حالت گرد

Attrs RoundMode(
  StringPiece x
)