Sunday 11 February 2018

비교 선형 회귀 이동 평균 및 평활 기술


기술 매끄러움에 의한 예측. 이 사이트는 의사 결정을위한 JavaScript E-labs 학습 객체의 일부입니다. 이 시리즈의 다른 JavaScript는이 페이지의 MENU 섹션에있는 여러 응용 분야로 분류됩니다. 시계열은 다음과 같은 일련의 관찰입니다. 시간이 지남에 따라 수집 된 데이터의 수집은 시간의 흐름에 따라 일정한 형태로 발생합니다. 무작위적인 변화로 인한 영향을 줄이기위한 방법이 있습니다. 널리 사용되는 기술이 원활합니다. 적절하게 적용될 때 이러한 기법이 기본 추세를 더 분명하게 나타냅니다. 왼쪽 위 모퉁이에서 시작하여 순차적으로 시계열을 입력하고 매개 변수 s를 입력 한 다음 계산 버튼을 클릭하여 일회성 예측을 얻습니다. 빈 상자는 계산에 포함되지 않지만 0은 있습니다. 데이터 매트릭스에있는 셀에서 셀로 이동하기 위해 데이터를 입력 할 때는 Tab 키를 누르지 말고 화살표 키를 사용하십시오. examini에 의해 표시 될 수있는 시계열의 특징 그래프를 예측 된 값 및 잔차 거동, 조건 예측 모델링과 비교합니다. 이동 평균 이동 평균은 시간 계열 전처리에서 가장 많이 사용되는 기법 중 하나입니다. 데이터에서 임의의 백색 잡음을 필터링하여 시계열을 만드는 데 사용됩니다 더 부드럽게 또는 심지어 시계열에 포함 된 특정 정보 구성 요소를 강조하기 위해 사용됩니다. 지수 평활화 평활화 된 시간 계열을 생성하는 데 매우 일반적으로 사용되는 구성표입니다. 과거 평균 관측치가 균등하게 가중치가 적용되는 경우 지수 평활화는 관측치가 커질수록 지수가 감소하는 가중치를 지정합니다. 즉, 최근 관측치는 이전 관측치보다 예측에서 상대적으로 더 많은 가중치가 부여됩니다. 이중 지수 평활화는 추세를 처리하는 데 더 좋습니다. 삼각 지수 스무딩은 포물선 추세를 처리 할 때 더 낫습니다. 평활 상수 a를 갖는 지수 가중 이동 평균은 대략 간단합니다 길이의 이동 평균 즉 기간 n, 여기서 a와 n은 서로 관련이 있습니다. a 2 n 1 OR n 2 - a a. 따라서 예를 들어 평활화 상수가 0 1 인 지수 가중 이동 평균은 대략 19 일 이동 평균에 해당합니다. 그리고 40 일 단순 이동 평균은 기하 급수적으로 이동 평균에 대략적으로 일치 할 것이며 평활 상수는 0 04878입니다. 선형 선형 지수 스무딩 시계열은 계절적이지는 않지만 표시하지 않습니다. 경향 홀트의 방법은 현재 레벨 및 현재 경향에 따라 달라집니다. 단순 이동 평균은 이동 평균 기간을 2 알파 알파의 정수 부분으로 설정하여 지수 평활화의 특별한 경우입니다. 대부분의 비즈니스 데이터에서 0보다 작은 알파 매개 변수는 자주 그러나 0 1에서 0 9까지, 0 1의 증분으로 매개 변수 공간의 격자 검색을 수행 할 수 있습니다. 그런 다음 최상의 알파는 평균 절대 오류 MA 오류가 가장 적습니다. 여러 가지 평활화 방법을 비교하는 방법 예측 기법의 정확성을 평가하기위한 수치 지표입니다. 가장 널리 사용되는 방법은 여러 예측의 시각적 비교를 사용하여 정확성을 평가하고 다양한 예측 방법 중에서 선택하는 것입니다. 이 접근법에서는 같은 그래프 시계열 변수의 원래 값 및 여러 가지 다른 예측 방법의 예상 값을 비교하여 시각적 비교를 용이하게합니다. 단일 매개 변수 만 사용하는 스무딩 기술을 기반으로 과거 예측 값을 얻으려면 과거 예상 기법을 사용하십시오. Holt 및 Winters 방법은 각각 두 개 및 세 개의 매개 변수를 사용하므로 매개 변수에 대한 시행 착오를 통해 최적의 값 또는 거의 최적의 값을 선택하는 것은 쉬운 작업이 아닙니다. 단일 지수 평활화는 단거리 투시를 강조합니다. 레벨을 마지막 관측 값으로 설정하고 트렌드가 없다는 조건에 기반합니다. 선형 회귀 이온은 히스토리 데이터 또는 변환 된 히스토리 데이터에 최소 제곱 선을 맞추고, 기본 트렌드를 조건으로하는 장거리를 나타냅니다. 홀트의 선형 지수 스무딩은 최근 추세에 대한 정보를 캡처합니다. 홀트 모델의 매개 변수는 다음과 같은 레벨 매개 변수입니다. 데이터 편차가 커지면 줄여야하며 트렌드 - 최근 트렌드 방향이 요인에 의해 뒷받침되는 경우 매개 변수를 늘려야합니다. 단기 예측이 페이지의 모든 JavaScript는 한 단계 앞선 것으로 나타났습니다 예측 2 단계 사전 예측을 얻으려면 단순히 예측 된 값을 시계열 데이터 끝에 추가 한 다음 동일한 계산 단추를 클릭하십시오. 필요한 단기 예측을 얻기 위해이 프로세스를 몇 번 반복 할 수 있습니다 어떤 결론을 내리는가? 모델을 비교하는 방법 주어진 데이터 세트에 여러 회귀 또는 시계열 예측 모델을 적용한 후에는 여러 가지 기준을 적용 할 수 있습니다. 추정 기간의 오차는 제곱 오차, 평균 절대 오차, 평균 절대 오차, 평균 절대 오차, 평균 오차 등의 오차를 나타냅니다. 시료 외 검사를 한 경우 유효 기간 내의 오차 측정 Ditto. Residual diagnostics and fit-fit tests 실제 값과 예측값의 플롯 잔차 대 시간 대 예측 값 대 다른 변수 대 잔차 자기 상관 플롯, 상호 상관 플롯, 정규 분포 에러에 대한 테스트 극한값의 측정 영향력있는 관찰은 과도한 실행, 평균의 변화, OK 일 수도 있고 OK 일 수도없는 많은 변수의 변화를 테스트합니다. 질적 인 고려 사항 모델의 직관적 인 합리성, 모델의 단순성, 무엇보다도 의사 결정의 유용성. 그렇다면 많은 음모 및 통계 및 고려해야 할 사항에 대해 어떤 비교가 가장 중요한지를 아는 것이 때때로 어려운 경우가 있습니다. 실제 수익은 무엇입니까? 평균적으로 다른 것보다 우선 순위가있는 통계는 평균 제곱 오차의 제곱근 인 제곱 평균 제곱근 오차 RMSE입니다. 오차 샘플 크기에서 모델 계수의 수를 뺀 값의 자유도에 맞게 조정하면, 회귀 분석에서 회귀 분석의 표준 오차 또는 회귀 분석에서의 표준 오차 또는 ARIMA 분석에서 추정 된 백색 잡음 표준 편차로 알려져있다. 이것은 매개 변수 추정 과정에서 값이 최소화되는 통계이며, 예측에 대한 신뢰 구간의 폭을 결정 예측 오차의 표준 편차에 대한 하한은 표본이 크고 독립 변수의 값이 극단적이지 않은 경우 엄격한 하한선이므로 예측에 대한 95 신뢰 구간은 대략 지점 예측치 ± 2 표준 오차 - 회귀의 표준 오차의 ± 2 배. 그러나, 절대 또는 상대적인 용어로 모델의 성능을 비교하는 다른 오류 측정치의 수. 평균 절대 오류 MAE는 데이터와 동일한 단위로 측정되며 일반적으로 크기와 비슷하지만 약간 작습니다. 루트 평균 제곱 오류 계산에서 오류를 제곱하지 않기 때문에 때때로 매우 큰 오류에 덜 민감합니다. 수학적으로 어려움을 겪는 사용자는 일반적으로 아래의 RMSE MAE 및 MAPE보다 이해하기 쉬운 통계를 찾습니다. 표준 회귀 출력의 일부가 아닙니다. 그러나 Statgraphics와 같은 시계열 예측 프로 시저의 출력에서 ​​더 일반적으로 발견됩니다. RegressIt에서 계산하기가 상대적으로 쉽습니다. 잔여 테이블을 워크 시트에 저장하는 옵션을 선택하고, 다음 수식 열을 만듭니다 절대 또는 백분율 용어로 오류를 계산하고 AVERAGE 함수를 적용 할 수 있습니다. 평균 절대 오류 백분율 오류 MAPE는 종종 용도에 유용합니다 왜냐하면 이것은 일반적인 지출 비율 용어로 표현되기 때문에 소비 된 달러 또는 위젯 판매에있어 큰 오류를 구성하는 것이 무엇인지 모르는 사람에게조차도 일종의 감각을 줄 것입니다. MAPE는 다음과 같은 데이터에 대해서만 계산 될 수 있습니다. 엄격하게 양의 값을가집니다. 따라서이 통계 값이 출력에서 ​​누락되어 정상적으로 표시 될 것으로 예상되는 경우 음의 데이터 값으로 인해이 값이 표시되지 않을 가능성이 있습니다. 평균 절대 오차 MASE는 시계열 데이터에만 적용 할 수있는 오류 모델의 평균 절대 오차를 임의의 무 변동 워킹 - 드리프트없는 모델의 평균 절대 오차로 나눈 값, 즉 시리즈의 첫 번째 차이의 평균 절대 값 따라서, 그것은 순진한 모델과 비교하여 오차의 상대적인 감소를 측정한다. 이상적으로 그 값은 1보다 훨씬 작을 것이다. Rob Hyndman이 2006 년에 제안한이 통계는 매우 적절하다. 회귀 모델을 비 계절적 시계열 데이터로 변환하기 시계열 회귀 모델은 인상적인 R 제곱 값을 갖지만 아직 실제 모델에 비해 열등한 모델 일 수 있습니다. 제곱 된 노트 시리즈에 강한 계절 패턴이있는 경우 살펴볼 해당 통계는 평균 절대 오류를 계절 차이의 평균 절대 값으로 나눈 것입니다. 즉 계절성 모델의 평균 절대 오류 즉, 주어진 기간은 한 계절 전에 관측 된 값과 동일 할 것입니다. 일부 통계 절차에서보고 된 평균 오차 ME 및 평균 오차 MPE는 예측이 편향되어 있는지 여부를 나타내는 오차 척도입니다. 불균형 적으로 긍정적 인 경향이 있는지 여부를 나타냅니다 또는 음의 바이어스는 일반적으로 나쁜 것으로 간주되지만 최종 결과는 아닙니다. 바이어스는 평균 제곱 오류의 한 요소입니다. 실제로 제곱 평균 오류는 오류의 분산과 MSE VAR E ME 2 평균 제곱 오류를 최소화하려고하면 오류의 편차와 편차가 암시 적으로 최소화됩니다. 상수 항을 포함하는 모델에서 평균 제곱 평균 오차가 정확히 0 일 때 오차가 최소화되므로 상수 기간을 포함하는 모델의 추정 기간 내에 평균 오차가 항상 0이 될 것으로 예상해야합니다. Statgraphics 예측 절차에보고 된 참고, 추정 기간의 평균 오차 통계가 계산되기 전에 예측 및 오류가 자동으로 로그 아웃되기 때문에 모델에 로그 변환이 포함되어있는 경우 0과 약간 다를 수 있습니다. 아래를 참조하십시오. 페이지의 처음으로 돌아 가기. 평균 제곱 오차는 다른 모델보다 더 민감합니다. 가끔 큰 에러에 대한 대책 제곱 프로세스는 매우 큰 오류에 대해 불균형 한 가중치를 부여합니다 가끔 큰 오류가 결정 상황에 문제가되지 않는 경우, 예를 들어 실제 비용 오류의 크기와 대략적으로 비례하므로 MAE 또는 MAPE가 더 적절한 기준이 될 수 있습니다. 많은 경우 이러한 통계는 한꺼번에 다양합니다. 그것들은 다른 것들도 더 좋아질 것입니다. 그러나 오차 분포가 이상 값을 가지지 않을 수도 있습니다. 하나의 모델이 한 측정 값에서 최상이고 다른 측정 값이 다른 측정 값에서 최상일 경우, 평균 오차 이 경우 단순성, 직관적 인 합리성 등 모델 비교에 대한 다른 기준에 더 많은 영향을 주어야합니다. 평균 제곱 오차와 평균 절대 오차는 오류가 동일한 모델에서 서로 비교 될 수 있습니다 달러 또는 일정한 달러 또는 맥주 판매의 경우 또는 기타 모델의 오류가 인플레이션에 대해 조정되거나 다른 모델의 오류가 조정되거나 한 모델의 오류가 절대 단위이고 다른 모형이 기록 단위 인 경우, 일 eir 오류 대책을 직접 비교할 수 없습니다. 이러한 경우 다양한 측정을 계산하기 전에 두 모델의 오류를 비교 가능한 단위로 변환해야합니다. 즉, 한 모델의 예측을 로그 해제 또는 비 압축 해제 또는 다른 모델과 동일한 단위로 변환하거나 그런 다음 실제 값에서 예측치를 뺀 후 유사한 단위로 오류를 구한 다음 해당 오류 통계를 계산하십시오. 오류 통계 자체를 언로깅하거나 해제 해제하여 동일한 효과를 얻을 수는 없습니다. Statgraphics에서 사용자 지정 예측 절차는 후자의 계산 유형 중 예측 및 오류는 자동으로 입력 변수의 원래 단위로 다시 변환됩니다. 즉, 분석 요약 보고서 및 모델에 표시된 통계를 계산하기 전에 예측 절차에서 모델 옵션으로 수행 된 모든 변환이 취소됩니다 비교 보고서 그러나 Statgraphics 및 대부분의 다른 절차 다른 통계 프로그램은 당신을 위해 이것을 쉽게 만들어주지 않습니다. 페이지 맨 위로 돌아 가기 RMSE 또는 MAE의 좋은 가치에 대한 절대적인 기준은 변수가 측정되는 단위와 예측 정확도의 정도에 따라 다릅니다. 특정 단위로 측정되는 단위로 측정 단위의 선택에 따라 가장 좋은 모델의 RMSE 또는 MAE는 zillions 또는 1zillion 단위로 측정 될 수 있습니다. 모델이 좋지 않다고 말하는 것은 의미가 없습니다. 루트 평균 제곱 오류는 예측 응용 프로그램과 관련된 특정 정도의 정확도를 언급하지 않는 한 x보다 작지 않습니다. 조정 된 R 제곱 값의 절대 값에 대한 절대 표준은 없습니다. 다시 상황에 따라 다릅니다. 특히, 종속 변수의 신호 대 잡음비에 대해 회귀 모델을 적용하기 전에 신호의 상당 부분을 적절한 데이터 변환을 통해 설명 할 수 있습니다. 동일한 depen을 사용하는 회귀 모델을 비교할 때 dent 변수와 동일한 추정 기간을 사용하면 조정 된 R 제곱이 올라감에 따라 회귀의 표준 오차가 줄어 듭니다. 따라서 가장 높은 R ​​보정 값을 가진 모델이 회귀의 표준 오차가 가장 낮을 수 있습니다. 랭킹을위한 기준으로 조정 된 R - 제곱을 사용합니다. 그러나 종속 변수가 다른 방식으로 변형 된 회귀 모델을 비교할 때 (예 : 한 사례에서는 차이가 있고 다른 사례에서는 차이가 보이지 않음) 또는 한 사례에 기록되고 다른 사례에 기록되지 않은 경우 또는 추정 기간과 다른 관측 세트, R 제곱은 모델 품질에 대한 신뢰할 수있는 안내서가 아닙니다. R 제곱에 대해 좋은 값은 무엇인지에 대한 참고 사항을 참조하십시오. 3 분의 25의 RMSE를 가진 모델은 크게 하나는 RMSE가 3 32이다. 신뢰 구간의 너비는 RMSE에 비례한다는 것을 기억하고, 신뢰 구간의 너비가 상대적으로 얼마나 감소 하는지를 플롯 만약 한 모델의 RMSE가 다른 모델보다 30 낮고, 아마도 매우 중요하다고 생각하면 백분율로 생각하는 것이 유용 할 것입니다. 10보다 낮 으면, 아마도 다소 중요 할 것입니다. 중요하지 않음 이러한 차이는 오류 측정 값과 모델 복잡성을 교환 할 때 특히 중요합니다. RMSE를 몇 % 더 줄이기 위해 회귀 모델에 또 다른 독립 변수를 추가 할 필요가 없을 것입니다. RMSE 및 조정 된 R 제곱 통계 이미 편향된 평가자로 만들기 위해 추정 된 계수의 수에 대한 사소한 조정을 포함하지만, 모델 선택의 목적으로 모델 복잡성에 대한 더 큰 과중이 부과되어야한다. 자동 모델 선택을위한 정교한 소프트웨어는 일반적으로 Mallows Cp 통계치 Akaike Information Criterion AIC 또는 Schwarz Bayesian Inform과 같은 더 무거운 처벌을 부과한다. ation Criterion BIC이 계산 방법은 현재의 논의 범위를 벗어나지 만 컴퓨터가 아닌 사용자가 모델을 선택할 때 매개 변수가 적은 모델에 대한 선호도를 보여 주어야합니다. 평균 제곱 오차는 신뢰할 수있는 경우에만 상대 모델 품질의 유효한 지표입니다. 모델이 잘못 잘못 지정되었다는 증거가있는 경우 (즉, 크게 실패한 경우 또는 해당 가정의 진단 테스트가 실패한 경우) 추정 기간의 데이터는 과도하게 적용되었다. 즉, 모델이 관측 된 관측 수에 대한 상대적으로 많은 수의 매개 변수를 갖고 유효성 검증 기간에 비교 성능이 나 빠지게되면, 평균 제곱 오차와 기타 모든 오차 측정 추정 기간에 크게 할인해야 할 수도 있습니다. 모델의 사소한 오정격 만의 증거가있는 경우 - 예 : res의 자기 상관의 적당한 양 iduals - 모델 또는 오류 통계를 완전히 무효화하지는 않지만 모델의 미세 조정이 여전히 가능함을 나타냅니다. 예를 들어, 다른 지연 변수가 회귀 또는 ARIMA 모델에 수익성있게 추가 될 수 있음을 나타낼 수 있습니다 페이지 상단으로 돌아갑니다. 추정 기간의 오류 조치가 신뢰할 수 있는지 여부를 확인하기 위해 고려중인 모델이 데이터를 초과 적용 할 가능성이 있는지 고려해야합니다. 가정이 직관적으로 합리적입니까? 설명하기가 쉽지 않습니까? 모델을 다른 사람에게 보여줍니다. 예측 플롯이 과거 데이터의 합리적인 외삽 법처럼 보입니다. 가정이 합리적으로 보인다면, 가정이 의심 스러울 때보다 오류 통계를 신뢰할 수있는 가능성이 더 높습니다. 모델에 하나 또는 두 가지 무작위 걸음, 지수 평활 또는 단순 회귀 모델과 같은 매개 변수는 시계열 데이터의 보통 또는 큰 샘플에 맞춰 졌다고 말합니다. 30 observat 이온 또는 그 이상이면 아마도 데이터를 채우지는 않을 것입니다. 그러나 추정 기간의 관측 수와 관련된 많은 매개 변수가있는 경우 초과 피팅은 명확한 가능성이 있습니다 자동 모델 선택 기술을 적용하여 선택되는 회귀 모델 무차별 적으로 선택된 다수의 후보 변수에 대한 단계적 또는 모든 가능한 회귀는 최종 모형의 회귀 변수의 수가 작더라도 데이터를 초과 적용하는 경향이 있습니다. 초과 적합에 대한 대략적인 지침으로 추정에서 데이터 요소의 수를 계산합니다 계절별 지표를 포함하여 추정 된 계수 당 기간 (예 : 동일한 데이터에서 개별적으로 추정 된 경우) 추정 된 계수 당 10 데이터 점 미만인 경우 과핑 가능성에주의해야합니다. 당신은 하나의 매개 변수, 즉 평균을 엄밀히 말하면, 적절한 표본 크기의 결정을 원한다. 데이터의 신호 대 잡음비, 해결할 의사 또는 추론 문제의 성격, 모델 사양이 올바른지에 대한 사전 지식에 의존해야합니다. 동시에 여러 계수를 추정 할 때 얻을 수있는 효율성도 있습니다 그러나 동일한 데이터로부터의 데이터 포인트에 대한 생각은 여전히 ​​유용한 표본 크기입니다. 특히 샘플 크기가 작고 신호가 약할 때입니다. 페이지의 맨 위로 돌아 가기 회귀 모델을 계절별 시계열 데이터에 맞추고 더미 변수를 사용하여 매월 또는 분기 별 효과를 추정 할 수 있습니다. 모델에 포함해야 할 매개 변수의 수에 대한 선택의 여지가 거의 없을 수 있습니다. 샘플의 크기가 작을지라도 계절 패턴을 추정해야하며 풀 세트, 즉 계수가 0과 크게 다르지 않은 제철 인형을 선택적으로 제거하지 마십시오. 일반적으로 적어도 4 계절의 가치가있는 것이 좋습니다 More는 더 좋을 것이지만 오랜 시간 내역은 현재 일어나고있는 것에 사용 가능하지 않거나 충분히 관련이 없을 수 있으며, 계절 더미 변수를 한 단위로 사용하는 것은 비슷한 종류의 회귀 변수를 사용하는 것과 같은 종류의 과핑 위험을 가지지 않습니다 후보자의 큰 풀에서 선택된 확률 변수 시리즈가 계절적 패턴을 갖는 것이 논리적 인 경우, 그것을 측정하는 변수의 관련성에 대한 의문은 없습니다. 계절적으로 데이터를 자체적으로 조정 한 경우 과거의 회귀 모델을 적용하기 전에 계절 변수를 원칙적으로 더미 변수와 유사한 추가 매개 변수로 계산해야합니다. 작업 할 데이터가 몇 년이라면 필연적으로이 과정에서 과도한 양의 ARIMA 모델이 나타날 것입니다 언뜻보기에는 계절 패턴에 맞는 매개 변수를 상대적으로 적게 요구하지만 이것은 오해의 소지가 있습니다 계절 ARIMA 모델을 초기화하려면 다음을 추정해야합니다 계절별 지표의 전체 집합을 추정하는 문제와 비교되는 0 년에 발생한 계절 패턴 사실 계절별 분해 모델에 적합하기보다는 계절 ARIMA 모델에 적합한 데 더 많은 계절의 데이터가 필요하다고 일반적으로 주장합니다. 한 단계 전진 예측에 대한 신뢰 구간은 거의 전적으로 RMSE를 기반으로하지만, 시계열 모델에 의해 생성 될 수있는 더 긴 수평선 예측에 대한 신뢰 구간은 기본 모델링 가정, 특히 변동성에 대한 가정에 크게 의존합니다. 경향 예측 범위가 길어질수록 일부 모델의 신뢰 구간은 상대적으로 천천히 넓어집니다. 알파 값이 작은 간단한 지수 평활화 모델, 단순 이동 평균, 계절별 임의 산책 모델 및 선형 경향 모델 신뢰 구간은 다른 유형에 비해 훨씬 더 빠르게 넓어집니다 모델의 비 계절 랜덤 보행 모델, 계절별 임의 추세 모델 또는 선형 지수 평활 모멘트 dels 신뢰 구간이 넓어지는 속도는 모델의 품질에 대한 신뢰할 수있는 가이드가 아닙니다. 중요한 것은 모델이 미래가 얼마나 불확실한 지에 대해 올바른 가정을해야한다는 것입니다. 모델이 다양한 잔여 진단 테스트를 통과해야한다는 것이 매우 중요합니다. 안구 테스트를 통해 긴 수평선 예측에 대한 신뢰 구간을 심각하게 고려해야합니다. 페이지 상단으로 돌아갑니다. 모델 상호 유효성 검사에 대한 샘플 밖의 테스트를 수행 한 경우에는 검증 기간 또한 매우 중요합니다 이론적으로 검증 기간의 모델 성능은 미래를 예측할 수있는 능력에 대한 최고의 지침입니다. 여기에서주의 할 점은 유효 기간이 추정 기간보다 훨씬 작은 데이터 샘플이기 때문입니다. 모델이 예기치 못한 상승에 대해 올바른 추측을함으로써 운이 좋거나 불행한 것만으로도 유효성 검사 기간에 비정상적으로 좋거나 나쁘게 작동 할 수 있습니다. 기대되는 기간에 일어날 수있는 비정상적인 사건에 대해 다른 모델보다 덜 민감합니다. 유효성 검사를 위해 크고 대표적인 샘플을 보관할만큼 충분한 데이터가 없다면, 평가 기간 통계를보다 질적 인 방식으로 해석하여 추정 기간에 통계의 신뢰할 수없는 가능성에 관한 빨간색 깃발을 던지거나 그렇지 않은지 여부 Statgraphics가 추정 및 유효성 검사 기간에 대해보고 한 비교 오류 통계는 원래의 변환되지 않은 단위입니다. If 잔차의 이분 산성을 줄이기 위해 로그 변환을 모델 옵션으로 사용 했으므로 유효성 검사 기간에 기록되지 않은 오류가 예상 기간보다 훨씬 클 것으로 예상해야합니다. 물론 유효 기간 통계를 비교할 수 있습니다 이 경우의 모델 페이지의 맨 위로 돌아갑니다. 결론은 오류 측정에 가장 큰 비중을 두어야한다는 것입니다. 추정 기간 - 거의 대부분 RMSE 또는 회귀 분석의 표준 오차 (모형의 상대적인 복잡성에 대해 조정되었지만 때때로 MAE 또는 MAPE) - 모형을 비교할 때 MASE 통계는 모형에 대해 매우 유용한 현실 검사를 제공합니다 시계열 데이터에 잘 어울립니다. 순진한 모델보다 낫습니다. 소프트웨어로 계산할 수 있다면 Cp, AIC 또는 BIC를보고 싶을 수 있습니다. 모델 복잡성에 더 많은 불이익을줍니다. 하지만 잔여에주의해야합니다. 진단 테스트, 가능한 경우 상호 유효성 검사 테스트, 모델의 직관적 인 합리성 및 단순성과 같은 정 성적 고려 사항이 포함됩니다. 잔여 진단 테스트는 결론이 아닙니다. 모델 A가 남은 테스트에 대해 확인하십시오. 작은 오류 또는 더 무작위로 보이는 오류가있는 것은 무엇입니까? 사소한 방법으로 일부 잔여 테스트 또는 현실 검사에 실패한 모델은 아마도 추가 개선이 필요하지만 모델을 신뢰할 수없는 주요한 방법으로 제거하는 모델 인 반면 유효 기간 결과는 모델 A가 유효성이 약간 개선 된 경우 표본 크기의 문제로 인해 반드시 마지막 단어가되는 것은 아닙니다. 모델 B가 크기 40의 추정 기간 동안 훨씬 더 나은 반면 모델 A가 유효 기간에 운이 좋았는지 여부를 확인하기 위해 데이터를 면밀히 연구 할 것입니다. 마지막으로 KISS는 간단하게 유지하십시오. 두 모델 일반적으로 오류 통계 및 기타 진단 측면에서 유사합니다. 더 간단하거나 이해하기 쉬운 모델을 선호해야합니다. 단순한 모델은 진실에 가까울 가능성이 높으며 대개 다른 사람들이 쉽게 받아 들일 수 있습니다. 페이지 상단으로. 매끄러운 데이터는 임의의 변동을 제거하고 경향 및 순환 구성 요소를 보여줍니다. 시간이 지남에 따라 취해진 데이터 수집에 내재적 인 것은 임의의 변형 형태입니다. 취소를 줄이는 방법이 있습니다 무작위 편차로 인한 효과 발생 산업에서 자주 사용되는 기술은 부드럽게 처리됩니다. 이 기법을 적절하게 적용하면 기본 추세, 계절 및 순환 구성 요소를보다 명확하게 나타냅니다. 평활화 방법에는 두 가지 별개의 그룹이 있습니다. 평균화 방법. 지수 평활화 방법 . 평균을 취하는 것이 데이터를 부드럽게하는 가장 간단한 방법입니다. 우리는 먼저 모든 과거 데이터의 단순 평균과 같은 몇 가지 평균 방법을 조사 할 것입니다. 창고 관리자는 일반적인 공급 업체가 1,000 달러 단위로 제공하는 금액을 알고 싶어합니다. 무작위로 12 개 공급 업체를 대상으로 다음과 같은 결과를 얻습니다. 데이터의 평균 또는 평균 계산 관리자는이를 일반 공급 업체의 지출 추정치로 사용하기로 결정합니다. 이 값이 좋거나 나쁨입니다. 제곱 오차 모형이 얼마나 좋은지를 판단하는 방법입니다. 우리는 평균 제곱 오차를 계산할 것입니다. 실제 금액에서 소비 된 금액을 추정 금액에서 뺀 값입니다. 오차 제곱은 위의 오차입니다. SSE는 su입니다. MSE는 제곱 오차의 평균입니다. MSE 결과는 예입니다. 결과는 오차 및 제곱 오차입니다. 추정치 10. 추세를 의심 할 때 평균을 사용하여 예측을 할 수 있습니까? 아래의 그래프를 보면 우리가 이것을해서는 안된다는 것을 분명히 알 수 있습니다. 평균은 과거의 모든 관측치를 균등하게 계량합니다. 요약하면, 과거의 모든 관측치의 단순 평균 또는 평균은 추세가없는 경우의 예측에 유용합니다. If If 추세를 고려한 다른 추정치를 사용하십시오. 평균값은 과거의 모든 관측치를 균등하게 계량합니다. 예를 들어, 값 3, 4, 5의 평균은 4입니다. 물론 평균값은 모든 값을 합하여 값의 합으로 나눈다. 평균을 계산하는 또 다른 방법은 각 값을 값의 수로 나눈 값을 더하는 것입니다. 3 3 4 3 5 3 1 1 3333 1 6667 4. 승수 1 3은 호출됩니다. 일반적으로 체중. bar frac sum 왼쪽 frac right x1 left frac right x2,, 왼쪽 frac 오른쪽 xn. 왼쪽 frac 오른쪽은 가중치이며, 물론 1로 합쳐집니다.

No comments:

Post a Comment