Megértése log_prob a normális eloszlást pytorch

szavazat
1

Én jelenleg próbálják megoldani Pendulum-v0 a openAi edzőteremben környezet, amely egy folyamatos cselekvési tér. Ennek eredményeként, azt kell használni a normális eloszlás, hogy mintát a tetteimet. Amit nem értek, az dimenziója log_prob amikor használja:

írja

Azt várták tenzor a 2-es méretű (egy log_prob minden akciók), de kiadási tenzor méretű (2,2).

Azonban, ha egy kategorikus eloszlás diszkrét környezetben a log_prob a várt méretű. Miért van az log_prob Normál eloszlása ​​eltérő méretű?

A kérdést 19/03/2020 21:23
a forrás felhasználó
Más nyelveken...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more