Deep Learning's Log-Linear Scaling Secrets

6 January 2021·38 words·1 min · Download pdf

Deep Learning Scaling is Predictable, Empirically - https://arxiv.org/abs/1712.00409

Roughly, ResNet parameters in millions = sqrt(data size)*2.6