Integration fortgeschrittener Kompressionsalgorithmen durch den Neural Network Distiller von NervanaSystems
Bearbeitet von F. Lorenz.
Bachelor’s Thesis
Abstract
Implementierung von Pruning, Quantisierung und Early-Exit um die Effizienz der Inferenz mit TC-Resnet8 zu steigern.