ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 정규 분포와 멱함수 분포란?
    독서 2021. 3. 5. 22:31
    반응형

    여러분은 딱딱하게 굳은 감자를 벽에 던지면 어떻게 쪼개질 것이라고 생각하나요?

    아마 작은 조각 1~2개, 큰 조각 1~2개를 제외하고는

    거의 비슷비슷한 크기의 조각들로 나누어질 것이라고 생각하지 않나요?

     

    이것을 그래프로 그려보면 아마도 중간이 올라오고 양옆의 부분에는 

    줄어드는 분포가 나타납니다.

     

    이러한 그래프 모양을 사람들이 가장 많이 알고 있으며, 많이 접하게 되는 모양입니다.

     아래와 같이 중간이 올라온 모양의 그래프를 '정규분포'라고 합니다. 

    그러나 감자를 벽에다 던지게 되면 우리의 생각과는 다른 결과가 나타난다고 합니다.

     

    해보신 적은 없으시겠지만 덴마크의 과학자들에 따르면 감자 조각은 정규 분포의 그래프를 띠지 않는다고 하죠.

    연구에서는 조각의 무게가 2배가 되면 개수는 6분의 1로 줄어들게 되는 패턴을 발견하게 됩니다.

     

    감자의 크기가 큰 것일수록 개수가 급격히 감소하는 것을 볼 수 있는데

    이것을 그래프로 나타내게 되면 아까와는 다른 모양이 나타납니다.

     

    그래프는 이렇게 '니은(ㄴ) 자' 모양이 되죠.

    이렇게 오른쪽으로 갈수록 급격히 줄어드는 그래프의 모양을 

     

    '멱함수 분포'라고 합니다.

     

    멱함수 분포는 우리가 생활에서 찾아보기 힘들다고 생각할 수 있지만

    생각보다 다양한 곳에 멱함수 분포가 존재합니다.

    연예인들 중 연예대상, 연기대상 등의 상을 받는 사람들이 얼마나 될까요?

     

    연예인은 많지만 상을 받지 못한 사람, 1개를 받은 사람 , 2개, 3개... n개를 받은 사람들로 늘어날수록 

    점점 줄어드는 멱함수 분포를 따르게 됩니다.

     

    "미국의 언어학자 조지 지프 George Zipf는 성경이나 문학 작품에서 가장 많이 사용되는 영단어의 경우

    두 번째로 자주 쓰이는 단어에 비해 사용 빈도가 2배나 크다는 사실을 발견하고 '지프의 법칙'이라는 말을 세상에 알렸다.

     

    실제로 가장 많이 사용하는 단어인 'the'는 두 번째로 많이 사용되는 of에 비해 

    7%와 3.5%로 사용순위가 낮아질수록 사용빈도가 급격히 적어집니다.

    이렇게 많은 곳에서 멱함수 분포를 찾아볼 수 있지만 우리는 여전히 정규분포의 함정에 빠지곤 합니다.

     

    책에서는 "중국은 인구가 14억명이 넘으니까 1퍼센트만 차지해도 그게 얼마야?"와 같은 식의 사고를 말하게 되죠.

    중국 시장의 1%는 매우 달성하기 쉬울 것이라고 생각할 수 있지만 

     

    연구에 따르면 1000개 기업이 존재할 때 1%를 차지하려면 적어도 13위 내에는 들어야한다고 말합니다.

    적어도 우리가 알고는 있는 기업이 되어야 한다는 것이죠.

     

    이것을 생각한다면 중국 시장의 1%가 결코 쉬운일이 아니라는 것을 뼛속 깊이 느끼게 될 것입니다..

    멱함수 분포가 이런 것이며 이런 곳에 사용된다는 것은 알았으나 

    정작 '정규 분포'가 어디에 사용되는지를 알아보지 못했습니다.

     

    멱함수 분포와 정규 분포를 모두 알아야만이 서로를 혼동하는 일이 없기 때문이죠.


    과연 정규분포는 어떨 때 사용되는 것일까요?

     

    반에서 키 순을 본다면 몇명을 제외한 나머지의 키는 거의 비슷합니다.

    이외에도 성적순의 분포는 정규 분포라고 할 수 있죠.

    반 친구들의 키와 성적, 모두 서로 연관이 없는 독립적인 각자이며 분포에 미치는 영향이 동일합니다.

    그렇기에 독립적이며 분포에 미치는 영향이 동일할 때 정규 분포의 그래프가 나타난다고 할 수 있죠.

     

    기업의 경우를 살펴봅시다.

     

    기업들은 서로 영향을 주고받게 됩니다.

    또한 대기업에 비하여 중소기업은 시장에서 많은 영향력을 주지 못하죠.

     

    이렇게 서로 상호작용하며 서로가 주는 영향력이 다를 때, 멱함수 분포의 그래프가 나타난다고 보면 좋을 것 같네요.

     

    정규 분포와 멱함수 분포가 무엇인지, 또 그들의 차이가 무엇인지,

    멱함수와 정규 분포가 되기 위한 조건은 무엇인지 알 수 있었으면 하는 마음입니다.

     

     만약 부족한 점이나 궁금한점, 보완할 점이
    있다면 댓글로 알려주세요.감사합니다^^

     

    반응형
Designed by Tistory.