R
선형회귀 질문

선형회귀 관련 질문입니다. 오늘의 tempHigh, sunlightTimeSum, windMax, temp5Avg, RHMin, windMaxInstantDir, LocalAPAvg로 내일의 tempHigh인 to_tempHigh 변수를 예측하고자 합니다.

1. to_tempHigh는 다음날의 tempHigh 입니다. train 데이터(1910~2017년도의 데이터)로 다른 변수들을 독립 변수로 두고, to_tempHigh를 종속 변수로 두어 선형회귀모델을 만듭니다.

model_fwd3 <- lm(to_tempHigh ~ tempHigh + sunlightTimeSum + windMax + temp5Avg + RHMin + windMaxInstantDir + LocalAPAvg , data = train)

2. test데이터(2017년도의 데이터)을 이 모델에 넣어 test데이터의 to_tempHigh를 예측합니다. 그 후에, test데이터의 to_tempHigh를 그래프로 그린 후, 모델을 통해 예측한 to_tempHigh를 그래프에 선으로 추가합니다.

predtemphigh <- predict.lm(model_fwd3,newdata = test[-1])

plot(test[1:32,1], type = 'o', col = 'red')#실제 최고기온

lines(predtemphigh[1:32], type = 'o', col = 'blue')#다음날 최고기온

그 결과, 그래프 속 예측한 to_tempHigh가 하루씩 밀려서 나오는데, 이유를 모르겠습니다. 이것에 관해 알고계신분 계신가요?

 

자세한 코드는 LaVue/linear_regression.R at main · jiParkyoung/LaVue (github.com) 여기에 있습니다.

댓글 0