Tags

Activation Function1

Backpropagation3

Batch Normalization1

Bias-Variance Tradeoff1

Convolutional Neural Network1

Curse of Dimensionality1

Efficient Inference Engine1

Exploding Gradient1

Gradient Descent2

Gradient Saturation1

Kaiming He Initialization1

Language Model1

Linear Transformation1

Log Likelihood1

Maximum Likelihood Estimation1

Mini-Batch Training1

Model Compression1

Model Smoothing2

Negative Log Likelihood1

Negative Log-Likelihood1

Neural Network2

One Hot Encoding1

Out of Vocabulary1

Regularization2

Special Tokens1

Train Validation Test Split1

Vanishing Gradient1

Weight Initialization2

Word Embedding1

Xavier Initialization1