Каким образом вычисляются входы каждого слоя при методе обратного распространения ошибки?
При оптимизации размеров сети надо учитывать…
Какой метод был предложен в 1953 г.?
Какой метод был запатентован в 1989 г. Хехт-Нильсоном?
Какой метод обучения использует информацию о градиенте функции ошибки и информацию о вторых производных?
Какой тип уменьшения избыточности позволяет снизить разнообразие данных, уменьшая число бит, требуемых для описания данных?
Какая нормировка неспособна отнормировать основную массу данных и одновременно ограничить диапазон значений этих данных?
В чем заключается метод обратного распространения ошибки?
Что позволяет нейрону быть более чувствительным к различиям входной информации?
На чем основывается метод back-propagation?