Обновите «*var» в соответствии с алгоритмом Адама.
$$lr_t := \text{learning\_rate} * \sqrt{1 - beta_2^t} / (1 - beta_1^t)$$$$m_t := beta_1 * m_{t-1} + (1 - beta_1) * g$$$$v_t := beta_2 * v_{t-1} + (1 - beta_2) * g * g$$$$variable := variable - lr_t * m_t / (\sqrt{v_t} + \epsilon)$$
Вложенные классы
сорт | ПрименитьАдам.Параметры | Дополнительные атрибуты для ApplyAdam |
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
Выход <Т> | какВывод () Возвращает символический дескриптор тензора. |
static <T расширяет TType > ApplyAdam <T> | create ( Область видимости , Операнд <T> var, Операнд <T> m, Операнд <T> v, Операнд <T> beta1Power, Операнд <T> beta2Power, Операнд <T> lr, Операнд <T> beta1, Операнд <T > beta2, Операнд <T> эпсилон, Операнд <T> град, Опции... опции) Фабричный метод для создания класса, обертывающего новую операцию ApplyAdam. |
Выход <Т> | вне () То же, что «вар». |
статический ApplyAdam.Options | useLocking (логическое значение useLocking) |
статический ApplyAdam.Options | useNesterov (логическое значение useNesterov) |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
публичный вывод <T> asOutput ()
Возвращает символический дескриптор тензора.
Входные данные для операций TensorFlow являются выходными данными другой операции TensorFlow. Этот метод используется для получения символического дескриптора, который представляет собой вычисление входных данных.
public static ApplyAdam <T> create ( Область действия, Операнд <T> var, Операнд <T> m, Операнд <T> v, Операнд <T> beta1Power, Операнд <T> beta2Power, Операнд <T> lr, Операнд <T > beta1, Операнд <T> бета2, Операнд <T> эпсилон, Операнд <T> град, Опции... опции)
Фабричный метод для создания класса, обертывающего новую операцию ApplyAdam.
Параметры
объем | текущий объем |
---|---|
вар | Должно быть из переменной(). |
м | Должно быть из переменной(). |
в | Должно быть из переменной(). |
бета1Power | Должно быть скаляр. |
бета2Power | Должно быть скаляр. |
лр | Коэффициент масштабирования. Должно быть скаляр. |
бета1 | Фактор импульса. Должно быть скаляр. |
бета2 | Фактор импульса. Должно быть скаляр. |
эпсилон | Риджовый термин. Должно быть скаляр. |
выпускник | Градиент. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр ApplyAdam
public static ApplyAdam.Options useLocking (логическое значение useLocking)
Параметры
использоватьLocking | Если «True», обновление тензоров var, m и v будет защищено блокировкой; в противном случае поведение не определено, но может вызывать меньше конфликтов. |
---|
public static ApplyAdam.Options useNesterov (логическое значение useNesterov)
Параметры
использовать Нестерова | Если «True», используется обновление нестеров. |
---|