프로그래밍 학습 전 적성에 맞는지 확인하고 싶다면? codingvillainkor.github.io/studying_python/
@jihunbae4795Ай бұрын
건방지게, 고수같아보이려고 표현이 너무 제스타일이네요ㅋㅋ
@uyelife4 ай бұрын
항상 감사합니다 센세
@dukasgeorge75844 ай бұрын
stop gradient 는 사실 연산량을 줄여주는 의미가 있긴하죠. 아마 sg 하든 말든 큰 차이는 없을겁니다. loss design 할때 양쪽다 gradient 가 달려 있으면 서로 움직이니까 훈련프로세스가 더 복잡해져서 설명할때는 sg 넣는게 더 쉬워서(?) 그런것 같네요. 아마 저렇게 수식안썼으면 리뷰어들이 양쪽에 gradient 흘리는 이유가 뭐냐고 지적할수도 있었을거라 생각합니다. 저도 궁금해서 detach 안하고 양쪽다 gradient 흘려주는 세팅에서 직접 계산하면서 분석한 연구를 진행했었는데 정말 어려웠던것 기억이 있네요. 이론적 분석할땐 sg 있는게 간단해져서 수식에 저렇게 쓰는것 같네요.