Ciência da Computação 2006 UBM: Aprendizado de Máquina: Dica para a prova

terça-feira, 26 de agosto de 2008

Aprendizado de Máquina: Dica para a prova

A tendencia é que se aproximando do fim, não se faz mais a ação action greed. Pq?

no inicio usa mto o e-greedy para explorar a tabela por inteiro, se aproximando do fim das etapas de simulaçao o algoritmo precisa aprender... então ele aprende quais as melhores políticas e atua somente nelas.

Um comentário:

Unknown disse...: num é action greedy naum seu animal!; 28 de agosto de 2008 às 10:25

Postar um comentário

Ciência da Computação 2006 UBM

terça-feira, 26 de agosto de 2008

Aprendizado de Máquina: Dica para a prova

Um comentário:

Colaboradores

Marcadores

Arquivo do blog

TI & Tecnologia

Web

Ciência da Computação 2006 UBM

terça-feira, 26 de agosto de 2008

Aprendizado de Máquina: Dica para a prova

Um comentário:

Colaboradores

Marcadores

Arquivo do blog

Inscrever-se (RSS)

TI & Tecnologia

Web