Breno

Os porquês do treino, validação e teste para as redes neurais

Quando se aprende sobre o treinamento de modelos no contexto de aprendizado de máquina, um escopo muito comum está na divisão dos dados.

Como uma prática, divide-se o conjunto de dados em um conjunto de treino, um de validação e se tem um conjunto de teste separado.

Aspecto esse que os engenheiros e cientistas precisam ter muita atenção e cuidado.

O aprendizado pode ser prejudicado e o modelo assim pode não produzir os resultados esperados ou pode demonstrar um aprendizado sem generalização, com overfitting.

Para as redes neurais, tem-se que ter um cuidado grande porque, pela própria definição de uma rede neural, ela pode tornar-se capaz ao ponto de memorizar todo o conjunto de dados que você possui.

Implementemos.

import torch
import torch.nn.functional as F

Consideremos o conjunto de dados que já temos utilizado.