Wednesday 21 March 2018

자기 상관 함수 이동 평균 프로세스


2 1 이동 평균 모델 MA 모델. ARIMA 모델로 알려진 시간 시리즈 모델은 자동 회귀 조건 및 이동 평균 조건을 포함 할 수 있습니다. 1 주에서 변수 xt에 대한 시계열 모델의 자동 회귀 항은 xt의 지연 값입니다. 예를 들어 , lag 1 자동 회귀 항은 x t-1에 계수를 곱한 것입니다. 이과에서는 이동 평균을 정의합니다. 시계열 모델의 이동 평균 항은 과거의 실수에 계수를 곱한 값입니다. N 0, σ 2w 의미 wt는 동일하게 독립적으로 분포하며, 각각 평균 ​​0 및 동일한 분산을 갖는 정규 분포를 갖는다. 1 차 이동 평균 모델은 MA 1로 표시된다. xt mu wt theta1w. MA 2로 표시된 2 차 이동 평균 모델은 다음과 같습니다. xt mu wt θ w θ2w. q q 차 이동 평균 모델은 MA q로 표시됩니다. 많은 교과서와 소프트웨어 프로그램이 용어 앞에 음의 부호를 사용하여 모델을 정의합니다. 모델의 일반 이론적 특성을 변경하지는 않지만 추정 된 계수 값과 대수 기호의 대수 기호를 반전시킵니다. ACF와 변이에 대한 수식 우리가 여기에서와 같이 추정 모델 R이 근본적인 모델에서 양수 부호를 사용하기 위해 음수 또는 양수 부호가 사용되었는지 여부를 확인하기 위해 소프트웨어를 점검해야합니다. 시계열의 이론적 특성 이론적 인 ACF의 유일한 0이 아닌 값은 지연 1에 해당합니다. 다른 모든 자기 상관은 0입니다. 따라서 지연 1에서만 유의 한 자동 상관을 갖는 샘플 ACF는 가능한 MA 1 모델의 지표입니다. 관심있는 학생의 경우, 이 특성에 대한 증명은이 유인물의 부록이다. 예제 1 MA 1 모델은 xt 10 wt 7 w t-1이고 여기서 wt는 N 0,1을 초과한다고 가정한다. 따라서 계수 1 0 7 Th 이론적 인 ACF는 다음과 같이 주어진다. 이 ACF의 플롯이 따른다. 방금 보여준 플롯은 MA 1에 대한 이론적 인 ACF이다. 실제적으로, 샘플은 일반적으로 그러한 명확한 패턴을 제공하지 않는다. 모델을 사용하는 샘플 값 xt 10 wt 7 w t-1 여기서 w t. iid N 0,1이 시뮬레이션의 경우 샘플 데이터의 시계열 플롯이이 플롯에서 많이 알 수 있습니다. 시뮬레이션 된 데이터가 뒤 따른다. lag 1의 스파이크와 그 뒤를 잇는 일반적으로 중요하지 않은 값이 뒤 따른다. 샘플 ACF는 기본 MA 1의 이론적 인 패턴과 일치하지 않는다는 것을 주목한다. 과거의 lag에 대한 모든 자기 상관은 0 A 다른 샘플은 아래에 표시된 약간 다른 샘플 ACF를 갖지만 동일한 광범위한 기능을 가질 수 있습니다. MA 2 모델을 사용하는 시계열의 성적 속성 MA 2 모델의 이론적 속성은 다음과 같습니다. 이론적 인 ACF의 값은 lag 1과 2에 대한 값입니다. Autocorrelat 높은 래그에 대한 이온은 0이다. 따라서 lag 1과 2에서 유의미한 자동 상관을 갖는 샘플 ACF는 더 높은 지연에 대해 유의하지 않은 자기 상관이 가능한 MA 2 모델을 나타낸다. 계수 N 0,1 계수는 1 0 5와 2 0 3이다. 이것은 MA 2이기 때문에 이론적 인 ACF는 1과 2의 래그에서만 0이 아닌 값을가집니다. 두 개의 0이 아닌 자기 상관의 값은 다음과 같습니다. 이론적 인 ACF의 도표가옵니다. 거의 항상 그렇듯이 샘플 데이터는 이론만큼 완전하게 우리는 모델에 대한 n 150 개의 샘플 값을 시뮬레이션했습니다. xt 10 wt 5 w t-1 3 w t-2 여기서 w t. iid N 0,1 데이터의 시계열 그림은 다음과 같습니다. MA 1 샘플 데이터는 그다지 알려줄 수 없습니다. 시뮬레이션 된 데이터에 대한 샘플 ACF는 다음과 같습니다. MA 2 모델이 유용 할 수있는 상황에 대한 패턴이 일반적입니다. 지연 1과 2에 두 개의 통계적으로 중요한 스파이크가 이어지고 - 다른 래그에 대한 중요한 값 샘플링 오류로 인해 샘플 ACF가 일치하지 않았습니다. 일반적으로 MA q 모델의 모델. MA q 모델의 속성은 일반적으로 첫 번째 q 지연에 대한 0이 아닌 자기 상관과 모든 지연 q에 대한 자기 상관 0이 있다는 것입니다. 1과 ρ1의 값 사이의 연결의 비 고유성 MA 1 모델에서. MA 1 모델에서 어떤 값 1에 대해서도 같은 값을 준다. 예를 들어, 1을 0 5로 사용하고 1을 1 0 5 2로 사용한다. rho1 0 4 역행렬 (invertibility)이라고 불리는 이론적 제한을 만족시키기 위해 MA 1 모델은 절대 값이 1보다 작은 값을 갖도록 제한합니다. 주어진 예제에서는 1 0 5가 허용되는 매개 변수 값이되지만 1 1 0 5 2는 그렇지 않습니다. MA 모델의 가역성. MA 모델은 수렴 무한 차수 AR 모델과 대수적으로 등가 인 경우 가역성이라고합니다. 수렴하면 AR 계수는 0으로 감소합니다. coeff를 추정하는데 사용되는 시계열 소프트웨어 MA 조건을 가진 모델의 검증 데이터 분석에서 확인한 것은 아닙니다 MA 1 모델에 대한 가역성 제한에 대한 추가 정보는 부록에 있습니다. 고급 이론 참고 지정된 ACF가있는 MA q 모델의 경우 하나의 가역성 모델 역행렬에 대한 필요 조건은 계수가 방정식 1- 1 y-qyq 0이 단위 원 밖에있는 y에 대한 해를 갖도록하는 값을 갖는다는 것이다. 예제의 R 코드. 예 1에서 우리는 모델 xt 10 wt 7w t-1의 이론적 인 ACF를 계산 한 다음이 모델로부터 n 150 값을 시뮬레이션하고 시뮬레이션 된 데이터에 대해 샘플 시계열과 샘플 ACF를 플로팅했습니다. 이론적 인 ACF를 그리는 데 사용 된 R 명령은 다음과 같습니다. 0 7, theta1 0 7 lags 0과 함께 MA 1에 대한 ACF의 지연 10은 0에서 10까지의 lags라는 변수를 만듭니다. MA 1의 ACF, acfma1, xlim c 1,10, ylab r, type h, MAF theta1 0 7 abline h 0는 플롯에 수평 축을 추가합니다. h 첫 번째 명령은 ACF를 결정하고 acfma1이라는 이름의 객체에 저장합니다. 이름의 선택. 3 번째 명령은 lags 1에서 10까지의 ACF 값보다 lags 명령을 사용합니다. ylab 매개 변수는 y 축 레이블을 지정하고 주 매개 변수는 ACF의 숫자 값을 보려면 단순히 acfma1 명령을 사용하십시오. 시뮬레이션 및 플롯은 다음 명령으로 수행되었습니다. list ma c 0 7 MA에서 150 개의 값을 시뮬 레이션합니다. 1 x xc 10은 평균 10을 더합니다. 시뮬레이션 기본값은 0을 의미합니다. plot x, type b, main 시뮬레이션 된 MA 1 데이터 acf x, xlim c 1,10, 시뮬레이션 된 ACF 예제 2에서 모델 xt 10 wt 5 w t-1 3 w t-2의 이론적 인 ACF를 그려 본 다음이 모델에서 n 150 값을 시뮬레이션하고 시뮬레이션 된 샘플 시간 시리즈 및 샘플 ACF를 플롯했습니다 데이터 사용 된 R 명령은 다음과 같습니다. ARMA2 ARMAmaca 0,0,0,0,0,0,0,0 10 플롯 래그, acfma2, xlim c 1,10, yab r, 유형 h, MA 2에 대한 주 ACF, theta1 0 5, theta2 0 3 abline h 0리스트 ma c 0 5, 0 3 x xc 10 플롯 x, 타입 b, 메인 시뮬레이션 MA 2 시리즈 acf x, xlim c 1,10, 시뮬레이트 된 MA 2에 대한 메인 ACF 데이터. 부록 MA 1의 속성 증명 관심있는 학생들에게 MA 1 모델의 이론적 특성에 대한 증명이 있습니다. 변이 텍스트 xt 텍스트 mu wt θ t w w 텍스트 텍스트 텍스트 θ 1w 시그마 2w θ 21 시그마 2w 1θ 21 시그마 2w. h 1 일 때 이전 식 1 w 2 임의의 h 2 그 이유는, 어떤 kj에 대해 wt E wkwj 0의 독립성의 정의에 의해 그 이유가있다. wt는 평균 0이기 때문에, E wjwj E wj 2 w 2. 시간 계열. For this result AC 모델은 위에서 주어진 AC ​​모델이다. 가역 MA 모델은 무한대 AR 모델로 작성 될 수있는 것이고, AR 계수는 시간이 지나면 무한히 움직이면서 AR 계수가 0으로 수렴하도록한다. MA 1 모델에 대한 역전 성을 입증 할 것이다. 식 1에서 w t-1에 대해 관계 2를 대입하면 다음과 같다. 3 zt wt θ 1 - θ 1w wt θ - θ 2w 시간 t-2 식 2가된다. 그러면 식 3에서 w t-2에 관계 4를 대입한다. theta1 z - theta 21w wt theta1z - theta 21z - theta1w wt theta1z - theta1 2z theta 31w. 우리가 무한히 계속한다면, 우리는 무한 순서 AR 모델을 얻을 것이다. 그러나 z 1의 경우, z의 시차를 곱하는 계수는 시간이지나면서 크기가 무한대로 증가합니다. 이를 방지하려면 1 1이 필요합니다. 이것은 1입니다. 가역 MA 모델의 조건. 무한 순서 MA 모델 .3 번째 주에는 AR 1 모델을 무한 순서 MA 모델로 변환 할 수 있음을 알 수 있습니다. 과거의 화이트 노이즈 항의 합은 AR 1의 인과 적 표현으로 알려져있다. 다시 말해서, xt는 무한 수의 용어를 가진 MA의 특수한 유형이다. 시간에 거슬러 올라갑니다. 이것은 무한 순서 MA 또는 MA라고 불립니다. 유한 순서 MA는 무한 순서 AR이고 유한 순서 AR은 무한 순서 MA입니다. 1 번째 주에 다시 말하지만, 고정 AR 1에 대한 요구 사항은 1 1 Var xt를 인과 적 표현을 사용하여 계산합시다. 이 마지막 단계에서는 phi1이 필요한 지오메트리 시리즈에 대한 기본적인 사실을 사용합니다. 그렇지 않으면 시리즈가 분기됩니다. 용도 체크 임의성. 연관 관계 플롯 Box and Jenkins, pp 28-32는 데이터 집합의 무작위성을 검사하기 위해 사용되는 도구이 임의성은 다양한 시간 지연에서 데이터 값에 대한 자기 상관을 계산하여 확인됩니다. 임의의 경우 이러한 모든 시간 지연 간격에 대해 자기 상관은 제로에 가까워 야합니다. 자기 상관 또한, 자기 상관 그래프는 Box-Jenkins 자동 회귀, 이동 평균 시계열 모델의 모델 식별 단계에서 사용됩니다. 상관 관계는 임의성 측정 중 하나입니다. 비 상관는 반드시 무작위 데이터를 의미하지는 않습니다. 중요한 자기 상관 관계가 무작위 적이 지 않다 그러나 중요한 자기 상관 관계를 보이지 않는 데이터는 다른 방식으로 무작위성을 나타낼 수있다. 자기 상관 관계는 단지 무작위성의 하나의 척도이다. 우리가 핸드북에 소개 한 무작위성의 기본 유형 인 모델 유효성 확인의 맥락에서, 자기 상관 검사는 일반적으로 불량 피팅 모델의 잔차가 미묘한 무작위성을 나타내는 경향이 있기 때문에 일반적으로 임의성 테스트입니다. 그러나 일부 애플리케이션에서는 무작위성을보다 엄격하게 결정해야합니다. 이러한 경우에는 많은 테스트가 필요합니다. 자기 상관 (autocorrelation)은 데이터가 여러 가지 다른 경우에 종종 랜덤이 될 수 있기 때문에 적용됩니다. 랜덤성에 대한보다 엄격한 검사가 필요한 곳은 난수 생성기를 테스트하는 것입니다. 샘플 플롯 자동 상관은 무작위성에 대해 거의 0이어야합니다. 이 예에서는 해당되지 않으므로 무작위 가정이 실패합니다. 이 샘플 자동 상관 관계는 실패합니다. 플롯은 시계열이 무작위가 아니라 인접한 관측치와 가까운 관측치간에 자기 상관의 정도가 높음을 보여줍니다. 정의 rh 대 h. Autocorlation Plots은 수직 축 자기 상관 계수에 의해 형성됩니다. Ch는 자기 공분산 함수입니다. C 0은 분산 함수입니다. R h는 -1과 1. 사이에 있음을 유의하십시오. 일부 소스는 자동 공분산 함수에 대해 다음 수식을 사용할 수 있습니다. 이 정의의 편향성은 낮지 만 1 N 형식에는 몇 가지 바람직한 통계적 특성이 있으며 통계 문헌에서 가장 일반적으로 사용되는 형식입니다. 자세한 내용은 Chatfield의 20 및 49-50 페이지를 참조하십시오. 수평축 시간 지연 hh 1, 2, 3. 위의 행 또한 여러 개의 수평 참조 선을가집니다 중간 선은 0입니다 다른 4 개의 선은 95와 99 신뢰 대역입니다 신뢰 대역을 생성하기위한 두 가지 고유 수식이 있음을 유의하십시오. 자기 상관 플롯이 임의성을 테스트하는 데 사용되는 경우 즉 시간이 없다면 데이터에 대한 의존성을 고려하여 다음 공식을 권장합니다. 여기서 N은 표본 크기, z는 표준 정규 분포의 누적 분포 함수이며 α는 유의 수준입니다. 이 경우 신뢰 띠는 표본에 따라 달라지는 고정 너비입니다 크기 위의 그림에서 신뢰도 밴드를 생성하는 공식입니다. ARIMA 모델에 맞게 모델 식별 단계에서도 상관 관계 그래프가 사용됩니다. 이 경우, 데이터 및 다음 신뢰도 밴드에 대해 이동 평균 모델이 사용됩니다 k는 지연이고, N은 샘플 크기이고, z는 표준 정규 분포의 누적 분포 함수이고, α는 유의 수준이 경우에는 지연이 클수록 신뢰 구간이 증가합니다. 자기 상관 그래프는 다음 질문에 대한 답을 제공 할 수 있습니다. 데이터가 임의입니다. 인접 관측과 관련된 관측입니다. 관측과 관련된 관측입니다. 관찰 된 시계열은 백색 잡음입니다 관찰 된 시계열은 사인파입니다 관측 된 시계열은 자동 회귀합니다 관찰 된 시계열에 적합한 모델은 무엇입니까 모델이 유효하고 충분합니다 공식은 유효합니다 ss sqrt valid 중요성 엔지니어링 결론의 타당성을 보장합니다. 고정 모델, 고정 변동, 고정 분포와 함께 무작위성은 일반적으로 모든 측정 프로세스의 근간을 이루는 4 가지 가정 중 하나입니다. 다음의 세 가지 이유로 인해 난수 가정은 매우 중요합니다. 대부분의 표준 통계 테스트는 randomness 테스트 결론의 타당성은 randomness assumption의 유효성과 직접적으로 연관되어있다. 사용 된 통계 공식은 무작위 가정에 따라 다르며, 가장 일반적인 공식은 표본 평균의 표준 편차를 결정하기위한 공식입니다. 여기서 s는 데이터의 표준 편차입니다. 많이 사용 되긴하지만, 이 수식을 사용한 결과는 무작위 가정은 유지됩니다. 단 변수 데이터의 경우 기본 모델이 무작위가 아닌 경우이 모델은 정확하지 않으며 유효하지 않으며 상수와 같은 매개 변수에 대한 예상치는 무의미 해지고 무효가됩니다. 즉, 분석가가 무작위성을 확인하지 않으면 많은 통계적 결론의 타당성이 의심됩니다. 자기 상관 플롯은 이러한 무작위성을 검사하는 훌륭한 방법입니다. 회귀 적 프로세스. 이 기사에서 선형 자동 회귀 프로세스 또는 자동 회귀의 정의, 속성 및 적용은 다음과 같습니다. review 이들은 stat로 널리 사용되는 자기 회귀 이동 평균 ARMA 프로세스의 중요한 하위 집합을 형성합니다 시계열 데이터에 대한 이오 나이 모델 경험적으로 관찰 된 시계열 와이어를 설명하기 위해 적절한 자동 감쇠를 선택하고 추정하는 문제에 특히주의를 기울인다. Comp Stat 2011 3 316 331 DOI 10 1002 wics 163 Wolfer의 연간 흑점 수 1749 1924. 스펙트럼 밀도 태양 흑점 시리즈에 대한 Yule의 자기 회귀 모델, 1749 1924, 예 3에서 논의되었다. 태양 흑점 시리즈의 경우 1 점, 1749 년 1924 년, 40 년 뒤진 경우에 대해 플롯됩니다.

No comments:

Post a Comment