안정적인 배포. 수치의 통계분석(비모수통계)

안정적이고 무한하게 나눌 수 있는 분포는 통화 환율 및 금융 지수의 행동을 모델링하는 데 전념하는 문헌에서 많은 주목을 받습니다.

안정적이고 무한하게 나눌 수 있는 분포는 P. Levy, J. Polya, A.Ya의 연구에서 연구되었습니다. 힌친.

안정적인 분포의 정의에 대해 살펴보겠습니다. 두 가지 동등한 정의가 있습니다. 그 중 하나를 주자

정의. 무작위 변수는 각각에 대해 다음과 같은 경우에도 안정적이라고 합니다.

여기서는 확률 변수의 독립 복사본입니다. (81) =0인 경우, 즉

그런 다음 확률 변수를 엄격하게 안정적이라고 합니다.

다음과 같은 사실이 증명된 것은 놀라운 일이다.

일부. 이를 지속가능성 지수라고 합니다.

예를 들어 보겠습니다. 정규법칙을 고려하면 합은 정규법칙에 따라 분포되고 확률변수도 같은 방식으로 분포됩니다. 여기. 따라서 가우스 법칙은 안정성 지수를 갖는 안정적인 법칙입니다. 게다가, 만약에 엄격하게 안정적입니다.

그림을 완성하려면, 안정적인 분포를 독립적이고 동일하게 분포된 확률 변수의 무한 합계 분포로 특징짓는 사실에 주목해야 합니다.

안정적인 분포는 독립적이고 동일하게 분포된 확률 변수의 시퀀스와 다음과 같은 양수와 실수의 시퀀스가 ​​있다는 의미에서 매력 영역을 갖습니다.

랜덤 변수의 특성 분포 함수를 고려하십시오.

독립 복사본 합계의 특성 함수

(86)과 (82)를 비교하여 엄격하게 안정적인 분포를 구해 보겠습니다.

따라서 특성 함수의 언어에서 (87)을 만족하는 양수가 존재하는 경우 분포를 엄격하게 안정하다고 합니다. 이후 (87)은 다음과 같은 형식을 취합니다.

포아송 분포를 고려하십시오.

특성 포아송 분포 함수:

따라서 포아송 분포는 안정적인 분포가 아닙니다. 엄격한 안정성의 속성은 분배 법칙의 또 다른 속성과 연관되어 있습니다. 분포 함수의 컨볼루션을 분포 함수라고 부른다는 것을 기억하세요. 분포 함수에 밀도가 있으면 분포 함수에도 밀도가 있습니다. 게다가, 확률변수와 가 독립이면. 표기법을 소개하겠습니다. 이 표기법에서 합계의 분포 함수는 입니다. 따라서 엄격하게 안정된 법칙의 분포 함수는 다음과 같은 속성을 가져야 합니다.

밀도가 있으면

이와 관련하여 Cauchy 분포를 고려하십시오.

직접 통합 및 유도를 통해 다음을 쉽게 확인할 수 있습니다.

Cauchy 분포는 안정성 지수에 따라 엄격하게 안정적입니다.

확률 이론(P. Levy, A.Ya. Khinchin)의 놀라운 결과는 안정적인 확률 변수의 특성 함수를 다음과 같이 표현합니다.


어디. 매개변수의 의미는 다음과 같습니다.

지속가능성 지수

분포 밀도 왜곡 매개변수,

스케일 매개변수

위치 매개변수.

모수는 분포의 꼬리가 감소하는 비율을 결정합니다.

a는 감마 함수입니다.

사례를 생각해 봅시다. (95)로부터 다음과 같다:

이것이 정상법칙의 특징적인 기능이다. 안정성 지수가 있는 일반 법칙의 안정성은 위에서 이미 언급되었습니다. 따라서 제품은 고유하게 결정되지 않습니다. 일반적으로 그렇게 받아들여집니다.

분포 꼬리의 동작 관점에서 볼 때 및 경우는 크게 다릅니다. 사실, 그럼 그렇게 놔두세요

(98)을 (95) 및 (96)과 비교하면 분포의 꼬리가 더 느린 경우 0이 되는 경향이 있다는 결론을 내릴 수 있습니다. 따라서 이러한 분포를 일반적으로 두꺼운 꼬리 분포라고 합니다. 통계 연구에서 알 수 있듯이, 많은 금융 상품은 로그 수익을 가지며 그 분포는 꼬리가 두껍습니다. 이러한 통계적 사실은 로그 수익의 동작을 설명하는 데 안정적인 분포를 매력적으로 만듭니다.

if와 only if에 주의하세요. 실제로, 그렇다면 (95)와 (96)에서 다음과 같습니다. 그렇다면 불평등에서 비롯됩니다. 그런 다음 불평등을 따르십시오.

지수 점근법과 관련하여 밀도가 다음과 같은 파레토 분포에 중점을 둘 것입니다.

매개변수(안정성 지수) 및. 파레토 분포 밀도 그래프는 그림 8에 나와 있습니다.


쌀. 8.

유통 기능

그리고 확률. (95)와의 비교는 무한대에서 안정적인 분포가 파레토 분포와 동일한 방식으로 동작한다는 것을 보여줍니다. 따라서 안정 분포의 꼬리 부분은 파레토 유형에 속합니다.

대칭 파레토 분포를 고려할 수 있습니다.

시퀀스를 모델링할 때 더 자연스러워 보입니다. 왜도(왜도) 매개변수는 분포의 비대칭 정도를 결정합니다. 만약 그렇다면

그러면 분포는 상대적으로 대칭이 됩니다. 1에 가까울수록 분포의 비대칭성이 더욱 뚜렷해집니다. 더욱이, 그렇다면 분포는 왼쪽과 오른쪽으로 더 치우쳐 있습니다.

매개변수는 축척 매개변수입니다.

때, 정규분포의 경우. 언제 - 분산이 없습니다. 따라서 매개변수는 표준편차와 다릅니다.

매개변수는 위에서 언급한 대로 위치 매개변수이며 수학적 기대치가 있습니다. 기대값을 정의할 수 없는 경우 기대값으로 해석하면 안 됩니다.

안정적인 분포에 대한 전통적인 표기법은 표기법입니다. 그럴 때 참고하세요

정규 분포(가우스 분포)는 항상 확률 이론에서 중심적인 역할을 해왔습니다. 왜냐하면 정규 분포는 많은 요인의 영향으로 인해 매우 자주 발생하고 그 중 어느 하나의 기여도는 무시할 수 있기 때문입니다. 중심 극한 정리(CLT)는 사실상 모든 응용 과학에 적용되어 통계 장치를 보편적으로 만듭니다. 그러나 그 사용이 불가능한 경우가 매우 빈번하며, 연구자들은 결과를 가우스에 맞추는 것을 조직화하기 위해 가능한 모든 방법을 시도합니다. 이제 분포에 영향을 미치는 여러 요인이 있는 경우의 대체 접근 방식에 대해 설명하겠습니다.

CPT의 간략한 역사.뉴턴이 아직 살아 있는 동안 Abraham de Moivre는 정규 분포에 대한 일련의 독립적인 테스트를 통해 사건에 대한 중심화되고 정규화된 관측 수의 수렴에 관한 정리를 증명했습니다. 19세기와 20세기 초에 걸쳐 이 정리는 일반화를 위한 과학적 모델로 사용되었습니다. 라플라스는 균등분포의 경우를 증명했고, 푸아송은 확률이 다른 경우에 대한 국소정리를 증명했습니다. 푸앵카레(Poincaré), 르장드르(Legendre) 및 가우스(Gauss)는 오류가 정규 분포로 수렴하는 것에 의존하여 관측 오류에 대한 풍부한 이론과 최소 제곱 방법을 개발했습니다. 체비쇼프는 적률법을 개발하여 확률변수의 합에 대한 훨씬 더 강력한 정리를 증명했습니다. 1900년 리아푸노프는 체비셰프와 마르코프에 의존하여 CLT를 현재 형태로 증명했지만 3차 모멘트가 존재하는 경우에만 가능했습니다. 그리고 1934년에야 펠러는 이를 종식시켰고, 2차 모멘트의 존재가 필요조건이자 충분조건임을 보여주었습니다.

CLT는 다음과 같이 공식화될 수 있습니다. 확률 변수가 독립적이고 동일하게 분포되며 0이 아닌 유한 분산을 갖는 경우 이러한 변수의 합(중심화 및 정규화)은 정규 법칙으로 수렴됩니다. 이 정리는 대학에서 가르치고 수학 전문가가 아닌 관찰자와 연구자가 자주 사용하는 형식입니다. 무슨 문제가 있나요? 실제로 이 정리는 가우스, 푸앵카레, 체비셰프 및 19세기의 다른 천재들이 연구한 영역, 즉 관찰 오류 이론, 통계 물리학, 최소 제곱법, 인구 통계학 연구 및 기타 분야에 완벽하게 적용 가능합니다. 그러나 발견에 대한 독창성이 부족한 과학자들은 일반화에 참여하고 있으며 이 정리를 모든 것에 적용하기를 원하거나 단순히 존재할 수 없는 정규 분포를 귀로 끌기만 합니다. 예를 원하시면 제가 갖고 있습니다.

지능지수 IQ. 처음에는 사람들의 지능이 정규 분포를 따른다는 것을 의미합니다. 그들은 특별한 능력을 고려하지 않고 논리적 사고, 정신 설계, 계산 능력, 추상적 사고 등 동일한 공유 요소를 사용하여 별도로 고려하는 방식으로 미리 준비된 테스트를 수행합니다. 대부분의 사람들이 접근하기 어려운 문제를 해결하는 능력이나 초고속 시간에 테스트를 통과하는 능력은 어떤 식으로든 고려되지 않으며, 테스트를 일찍 통과하면 향후 결과(지능은 아님)가 높아집니다. 그리고 속물들은 “자기보다 두 배나 똑똑할 수는 없다”, “똑똑한 사람들에게서 그것을 빼앗아 나누자”고 믿습니다.

두 번째 예: 재무 지표의 변화. 주가, 통화 시세, 상품 옵션의 변화를 연구하려면 수학적 통계를 사용해야 하며, 특히 여기서는 분포 유형에 실수하지 않는 것이 중요합니다. 적절한 사례: 1997년에 주식 시장 성장의 정규 분포(소위 백색 잡음)에 기초한 블랙숄즈 모델을 제안하여 노벨 경제학상이 수상되었습니다. 동시에 저자는 이 모델에 설명이 필요하다고 분명히 밝혔지만 대부분의 후속 연구자는 단순히 포아송 분포를 정규 분포에 추가하기로 결정했습니다. 여기서는 분명히 긴 시계열을 연구할 때 부정확성이 있을 것입니다. 왜냐하면 포아송 분포는 CLT를 너무 잘 충족하고 이미 20개의 항을 사용하면 정규 분포와 구별할 수 없기 때문입니다. 아래 그림을 보면(매우 심각한 경제 잡지에서 가져온 것임) 상당히 많은 관찰과 명백한 왜곡에도 불구하고 분포의 정규성에 대한 가정이 이루어지고 있음을 알 수 있습니다.


도시 인구 간의 임금 분포, 디스크에 있는 파일 크기, 도시 및 국가 인구 사이의 임금 분포가 정상적이지 않을 것이라는 것은 매우 분명합니다.

이러한 예의 분포의 공통점은 소위 "무거운 꼬리", 즉 평균에서 멀리 떨어진 값과 일반적으로 오른쪽에 눈에 띄는 비대칭이 존재한다는 것입니다. 정규 분포 외에 다른 분포가 무엇인지 생각해 봅시다. 이전에 언급한 푸아송부터 시작하겠습니다. 꼬리가 있지만 각 그룹에서 관찰되는 일련의 그룹에 대해 법이 반복되기를 원합니다(기업의 파일 크기, 여러 도시의 급여 계산). 스케일링(모형 간격 Black - Scholes를 임의로 늘리거나 줄임), 관찰 결과에 따르면 꼬리와 비대칭성은 사라지지 않지만 CLP에 따르면 포아송 분포는 정상이 되어야 합니다. 같은 이유로 Erlang, beta, lognormal 및 기타 분산 분포를 갖는 모든 항목은 적합하지 않습니다. 남은 것은 파레토 분포를 잘라내는 것뿐인데, 표본 데이터를 분석할 때 거의 발생하지 않는 최소값과 모드의 일치로 인해 적합하지 않습니다.

필요한 특성을 갖는 분포가 존재하며 이를 안정 분포라고 합니다.이들의 역사도 매우 흥미롭고, 주요 정리는 펠러의 연구가 있은 지 1년 후인 1935년에 프랑스 수학자 폴 레비(Paul Levy)와 소련 수학자 A.Ya의 공동 노력에 의해 입증되었습니다. 힌친. CLT는 일반화되었으며 분산 존재 조건이 제거되었습니다. 일반 변수와 달리 안정적인 확률 변수의 밀도나 분포 함수는 표현되지 않으며(아래에서 논의되는 드문 예외를 제외하고) 이에 대해 알려진 것은 특성 함수(분포 밀도의 역 푸리에 변환이지만, 본질을 이해하는 것은 불가능합니다.)
따라서 정리는 다음과 같습니다. 확률 변수가 독립적이고 동일하게 분포된 경우 이러한 변수의 합은 안정적인 법칙으로 수렴됩니다.

이제 정의입니다. 임의의 값 엑스특성 함수의 로그가 다음 형식으로 표현되는 경우에만 안정적입니다.

어디 .

사실 여기에는 그다지 복잡한 것이 없습니다. 네 가지 매개변수의 의미만 설명하면 됩니다. 매개변수 sigma 및 mu는 정규 분포에서와 같이 일반적인 스케일 및 오프셋입니다. mu는 존재하는 경우 수학적 기대값과 동일하고 알파가 1보다 클 때 존재합니다. 베타 매개변수는 비대칭이며, 0과 같으면 분포가 대칭입니다. 그러나 알파는 특성 매개변수이며, 양의 모멘트가 존재하는 크기의 차수를 나타내며, 2에 가까울수록 분포가 정규와 더 유사하고, 2와 같을 때 분포가 정규가 되며, 이 경우에만 대량 주문이 발생하는 순간이 있습니까? 정규 분포의 경우 비대칭이 퇴화됩니다. 알파가 1이고 베타가 0인 경우에는 코시(Cauchy) 분포를 구하고, 알파가 절반이고 베타가 1인 경우에는 레비(Lévy) 분포를 구하며, 그 외의 경우에는 표현이 없다. 그러한 양의 밀도 분포를 구적법으로 표현합니다.
20세기에는 안정량과 과정에 대한 풍부한 이론(레비 과정(Lévy process)이라고 함)이 개발되었고, 분수 적분과의 연관성이 밝혀졌으며, 다양한 매개변수화 및 모델링 방법이 도입되었으며, 매개변수가 여러 방식으로 추정되었으며, 일관성이 유지되었습니다. 추정치의 안정성이 나타났습니다. 사진을 보시면 15배 확대된 조각으로 부과금 과정의 시뮬레이션 궤적을 보여줍니다.


Benoit Mandelbrot가 프랙탈을 생각해낸 것은 이러한 프로세스와 금융 분야의 적용을 연구하는 동안이었습니다. 그러나 모든 곳에서 그렇게 좋지는 않았습니다. 20 세기 후반은 응용 과학과 사이버네틱스 과학의 일반적인 추세를 겪었고 이는 순수 수학의 위기를 의미했으며 모두가 생산하고 싶었지만 생각하고 싶지 않았으며 저널리즘을 갖춘 인문주의자들이 수학 영역을 차지했습니다. 예: American Mosteller의 책 "50가지 재미있는 확률론적 문제 해결", 작업 번호 11:


이 문제에 대한 저자의 해결책은 단순히 상식의 패배입니다.

세 가지 모순된 답이 제시된 문제 25에서도 상황은 동일합니다.

하지만 안정적인 분포로 돌아가 보겠습니다. 나머지 기사에서는 그들과 함께 일할 때 추가적인 어려움이 없어야 함을 보여 주려고 노력할 것입니다. 즉, 모수를 추정하고, 분포 함수를 계산하고, 이를 모델링할 수 있는 수치 및 통계 방법이 있습니다. 즉, 다른 분포와 동일한 방식으로 작동합니다.

안정적인 확률 변수의 모델링.모든 것은 비교를 통해 학습되므로 먼저 계산 관점에서 가장 편리한 정규 값 생성 방법(Box-Muller 방법)을 떠올려 보겠습니다.