강화학습 예시로 날씨예측
저도 ML, DL, RL을 배우는 입장이기는 한데... 보통 날씨 예측은 RL보다는 DL에서 Sequential data를 다루는 LSTM이나 GRU로 많이 한다고 알고 있습니다. 미래 예측은 미래의 데이터가 없이 행해야 합니다(당연하게도). 그리고 과거부터 현재 데이터까지 sequential하게 분석해야 합니다. 2d CNN이나 MLP, RL은 모든 시점의 데이터가 한 번에 주어지고 거기에 가장 적합한 parameter를 찾아나가는 과정인데 이는 순차데이터에는 맞지 않을 것 같습니다. 반면 LSTM, GRU 같은 RNN 기술들은 적합합니다. 굳이 강화학습을 적용하고 싶으시다면 별도의 모듈 제작을 통해 미래의 데이터를 masking한 채로 데이터를 feeding해야 할 것 같습니다.