:: 게시판

:: 이전 게시판

- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)

Date	2023/05/17 16:29:26
Name	S.hermit
Subject	[질문] 확률문제 계산 부탁드립니다 (수정됨)
https://pgr21.net./qna/170669 삭게로! 안녕하세요 쉽게 계산이 되지 않는 확률문제 계산을 부탁드리려고 합니다. 어떤 회사에 100명의 직원이 있다고 가정하고 직원 개개인의 평가가 매년 랜덤으로 1등에서 100등까지 정해진다고 가정해볼게요 그러면 한 직원이 받은 5년 간 등수를 합하여 평균냈을 때 60 이하일 확률은 얼마일까요? 예를 들면, 5년 간 (2등 + 70등 + 35등 + 80등 + 24등)의 성적을 받으면 평균 42.2등이 되는거죠 각자가 1등부터 100등까지 평가를 받을 확률은 동일합니다. 쉬울 것 같으면서도 아리송하게 계산이 쉽지 않아 수학 고수님들의 도움이 필요합니다. 미리 답변 감사드립니다 (수정) 이해를 돕기 위해 2년간으로 생각해보겠습니다 2년간 평균 60등 안에 들려면 2년간 등수의 합이 120을 넘지 않아야 합니다 반대로 120이 넘는 순서쌍을 구하면 (21, 100) (22, 99), (22, 100) (23, 98), (23, 99), (23, 100) ....(100, 100) (1+80)×80÷2 = 3240 총 3,240개가 나오고 결국 1 - (3240/100^2) = 0.676 즉 67.6%가 나오는 건데요 이걸 5년으로 계산해달라는 겁니다 순서쌍으로 계산하면 너무많으니 뭔가 수학적인 공식이 있을것 같아서 질문드렸습니다 직원수와 시행횟수(평가년도)가 무한대로 커진다면 60%에 수렴할 것이라는 것은 이해됩니다 다만 직원수 100명, 평가년도 5년간 평가 했을때의 확률 계산이 필요합니다

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."

寒雪

해시 아이콘

23/05/17 16:38

등수의 평균이 60보다 작을 확률과 줄 세웠을때 60등 안에 드는것은 엄밀히 다른내용이라고 보는데

100명중 1명을 선택했을때 상위60%= 즉 줄세워서 60등 안이라는 말이면 60%죠. 계산할것도 없습니다....

S.hermit

해시 아이콘

23/05/17 16:44

처음에 말씀하신 게 맞습니다
등수의 평균이 60보다 작을 확률로 계산한다면 그래도 60%인가요?

寒雪

해시 아이콘

23/05/17 17:12

정확한 계산식은 잘 모르겠네요 경우의 수가 100^5 니까요
다만 숫자가 100이 아닌 더 늘어난다는 가정하 생각한다면 60%로 수렴할것같습니다.

Rorschach

해시 아이콘

23/05/17 17:38

그 경우는 수치가 달라집니다. 좀 극단적으로 예를 들면, 한 번 뽑을 때 1등이 될 확률은 1/100이지만 다섯 번 뽑아서도 평균등수가 1이 될 확률은 (1/100)^5 이 되거든요.

수치계산을 간단히 해보니 평균등수가 60보다 작을 확률은 대략 76% 정도가 되네요.

寒雪

해시 아이콘

23/05/17 17:46

아 그러겠네요 숫자가 늘어나면 오히려 정규분포쪽으로 계산해야 할듯하네요

43년신혼시작

해시 아이콘

23/05/17 17:51

평균등수가 1 이 될 확률은 (1/100)^5 만 있는게 아니라
1,1,1,2,2 도 평균 등수는 1등 일거고,
2,2,2,2,2 가 나오더라도 다른 직원이 1,10,10,10,10 이런 식으로 성적이 나오면 5년간의 평균은 2,2,2,2,2 인 직원이 1등이 될 수도 있을 겁니다.
5년 내내 1등일 필요는 없으니까요.

Rorschach

해시 아이콘

23/05/17 17:54

다시 추가로 질문하신 내용이 '순위'가 아니라 등수의 평균값에 대해서 질문하셨으니 해당 문제에서는 (1/100)^5이 맞습니다.

말씀하신대로 그냥 순위라면 %를 따로 논할 필요도 없죠.

S.hermit

해시 아이콘

23/05/17 18:04

네 맞습니다 이해를 돕기 위해 비유를 한것이 오히려 더 헷갈리게 한것 같습니다ㅠ 죄송해요
등수의 평균값이 맞습니다
즉, 1부터 100까지 랜덤 및 복원으로 5회 뽑았을때
숫자의 평균이 60이하가 되는 것, 다시말하면
숫자의 합이 300이하가 되는 확률을 구하는 것입니다

겨울삼각형

해시 아이콘

23/05/17 16:38

상위 60퍼에 들어갈 확률은 60퍼입니다..

그게 확률이니까

은때까치

해시 아이콘

23/05/17 16:44

음? 너무 당연히 60%가 아닐까 하는데요.

고오스

해시 아이콘

23/05/17 17:01

(수정됨) 직원이 5년 동안의 평균 평가에서 상위 60%에 들어갈 확률을 결정하려면 순위를 기준으로 상위 60%에 포함될 수 있는 직원의 수를 고려해야 합니다.

이 시나리오에서 각 직원의 평가는 매년 1위부터 100위까지 무작위로 결정됩니다. 직원이 100명이므로 가능한 순위도 100개입니다.

상위 60%에 들기 위해서는 직원의 순위가 100명 중 상위 60명 안에 있어야 합니다. 따라서 상위 60%에 들어갈 수 있는 직원의 수는 60명입니다.

이제 5년 동안의 평가를 고려하여 직원이 5년 동안 상위 60%에 포함될 확률을 계산해야 합니다. 매년 평가는 독립적이고 임의적이기 때문에 1년 동안 상위 60%에 들 확률은 60/100 또는 0.6입니다.

평가가 독립적이므로 전체 5년 동안 상위 60%에 속할 확률은 개별 확률을 함께 곱하여 계산됩니다.

P(5년간 상위 60%) = P(1차년도 상위 60%) * P(2차년도 상위 60%) * P(3차년도 상위 60%) * P(4차년도 상위 60% year) * P(5년차 상위 60%)
= 0.6 * 0.6 * 0.6 * 0.6 * 0.6
= 0.6^5
≈ 0.07776 또는 7.776%

따라서 직원이 [5년 동안의 평균 평가에서 상위 60%에 들어갈 확률]은 약 7.776%입니다.

by chatGPT

어떤 직원이 5년동안 매 년 마다 상위 60%에 들어간다면 챗gpt 답변이 맞고 그게 아니라면 60%가 맞는거 같습니다

S.hermit

해시 아이콘

23/05/17 17:26

매년마다 상위 60%가 아니고 5년간 평균했을때 상위60% 입니다.
1년차때 100등했더라도 다른 년차에 높은평가를 받으면 만회가 되는 구조이죠
매년 상위 60%에 드는건 너무 당연히 확률 곱연산이죠
그쉬운걸 질문했겠습니까
챗gpt가 문제 이해를 잘못한것 같습니다

오늘

해시 아이콘

23/05/17 17:30

(수정됨) 100명의 평균 등수가 순차적으로 정해질거고 그에 따라 상위 60%에 들어갈 확률이므로 60%가 맞을 듯 합니다.
다만 정확히 평균 60등 이라는 숫자를 기준으로 한다면 약간의 차이가 발생할 수도 있어 보입니다.
동점자의 수도 영향을 줄 듯 하구요.

43년신혼시작

해시 아이콘

23/05/17 17:48

100명의 직원 중 5년 간 평가를 평균을 낸 결과는 100 명중 60명이 60등 안에 들어갑니다.
그러면 어떤 직원이 상위 60% 안에 들어갈 확률은 60% 겠죠.

S.hermit

해시 아이콘

23/05/17 17:54

아니요, 2년짜리를 계산한것만 봐도 60%가 아닙니다
이해를 돕기위해 직원이라는 표현을 썼는데
좀더 간단하게 말해서 1부터 100까지 랜덤 및 복원으로
총 5회 숫자를 뽑았을때 이 숫자의 평균이 60이하가 될 확률을 구하는 겁니다

아론

해시 아이콘

23/05/17 17:49

저도 궁금해서 챗gpt 돌려봤습니다.

1부터 100까지의 숫자 중 하나를 랜덤으로 5회 뽑았을 때 그 합이 300 이상이 될 확률을 계산해 보겠습니다.

먼저, 가능한 모든 조합의 수를 구합니다. 1부터 100까지의 숫자 중에서 5개를 선택하는 경우의 수는 100C5로 계산할 수 있습니다. 이는 약 75,287,520개입니다.

다음으로, 합이 300 이상이 되는 조합의 수를 구해야 합니다. 이를 계산하기 위해서는 가능한 모든 조합을 확인하고, 그 중 합이 300 이상이 되는 조합을 찾아야 합니다.

이러한 계산은 상당히 복잡하며, 시간이 오래 걸리기 때문에 간단한 근사치를 사용하겠습니다.

1부터 100까지의 숫자 중 하나를 뽑을 때, 그 숫자가 50 이상인 경우에는 평균적으로 75/2 = 37.5의 값을 가질 것으로 예상할 수 있습니다. 따라서, 5번을 뽑았을 때의 평균적인 합은 37.5 * 5 = 187.5가 됩니다.

이를 바탕으로, 합이 300 이상이 되는 확률을 추정해보면 약 1/2로 예상할 수 있습니다. 하지만, 이는 근사치일 뿐 정확한 값은 아닙니다.

따라서, 1부터 100까지의 숫자 중 하나를 랜덤으로 5회 뽑았을 때 그 합이 300 이상이 될 확률은 약 1/2로 추정할 수 있습니다.

S.hermit

해시 아이콘

23/05/17 17:59

거의 근접한 답이 나오고 있는것 같습니다~
다만 총 경우의 수는 복원방식이므로 100C5가 아니라
100^5, 즉 10,000,000,000 개입니다
1부터 100까지의 숫자 5개(무작위, 복원) 합이 300이 넘는 경우의 수를 모두 계산하는 수밖에 없을까요?

아론

해시 아이콘

23/05/17 18:09

물어보니 파이썬 코드가 나오는데요 크크
문돌이라 여기까지가 한계일듯 합니다.
직접 이것 저것 물어보시는 게 디테일을 채울거 같네요

파인애플

해시 아이콘

23/05/17 17:49

본문 3째 줄에
[그러면 한 직원이 받은 5년 간 평가를 평균냈을 때 상위 60% 안에 들어갈 확률은 얼마나 될까요?]

상위 60% 가 아니고 평균 60등을 말씀하시는 건가요?

S.hermit

해시 아이콘

23/05/17 18:01

이해를 돕기 위해 직원을 비유로 들은건데 더 어렵게 만든 것 같습니다
간단하게 말해서 1부터 100까지 숫자를 5번 복원방식으로 뽑았을 때 이 숫자들의 평균이 60이하가 될 확률을 구하는 것입니다~

파인애플

해시 아이콘

23/05/17 18:05

chat-gpt한테 물어봤는데요

Q:
1부터 100까지 숫자를 5번 복원방식으로 뽑았을 때 이 숫자들의 평균이 60이하가 될 확률을 알려주세요

A:
이 질문은 통계와 확률에 관련된 내용이며, 중심극한정리(Central Limit Theorem)를 사용하여 근사적으로 답을 찾을 수 있습니다. 중심극한정리는 동일한 분포에서 독립적으로 뽑은 샘플의 평균이 정규분포에 근사한다는 이론입니다.

우선, 1부터 100까지의 숫자들의 평균과 표준편차를 알아야 합니다. 이들 숫자들은 균일분포(Uniform Distribution)을 이루므로 평균은 (1 + 100) / 2 = 50.5가 됩니다. 또한, 균일분포의 표준편차는 sqrt((b-a+1)^2 - 1)/12 로 계산할 수 있는데, 여기서 a는 최소값, b는 최대값입니다. 이를 계산하면 대략 28.8661 정도가 됩니다.

중심극한정리에 따라, 5개의 샘플의 평균은 평균이 50.5이고, 표준편차가 28.8661 / sqrt(5)인 정규분포에 근사합니다. 표준편차를 5의 제곱근으로 나눈 이유는 샘플의 평균의 표준편차가 원래의 표준편차를 샘플 크기의 제곱근으로 나눈 것이기 때문입니다. 이렇게 계산하면 표준편차는 대략 12.9094가 됩니다.

이제 우리는 5개의 샘플의 평균이 60 이하일 확률을 계산할 준비가 되었습니다. 이는 표준정규분포표 또는 z-점수를 이용한 계산을 통해 얻을 수 있습니다. z-점수는 다음과 같이 계산됩니다:

z = (X - μ) / σ

여기서 X는 관심 있는 값(60), μ는 평균(50.5), σ는 표준편차(12.9094)입니다. 이를 대입하면 z 점수는 대략 0.7364가 됩니다.

표준 정규 분포표를 찾아보면, z 점수가 0.7364인 경우의 누적 분포 함수 값은 대략 0.7690입니다. 따라서 5개의 샘플의 평균이 60 이하일 확률은 대략 76.9%라고 할 수 있습니다.

이는 근사치이며, 실제 확률은 시뮬레이션 등을 통해 더 정확하게 알아볼 수 있습니다.

--
라고 하네요

S.hermit

해시 아이콘

23/05/17 18:07

오 제가 원하던 답과 풀이 과정입니다
정말 감사드립니다^^ 역시 pgr 질게 최고
답변 달아주신 모든 분들 감사드립니다

모아

해시 아이콘

23/05/17 18:09

마지막 세줄때문에 질문하신분 의도가 제대로 전달이 안되네요.
시행횟수가 무한에 가까워지면 확률은 100%에 수렴합니다.

지옥천사

해시 아이콘

23/05/17 18:14

Chat GPT를 통해서 알아본 내용입니다.

Q1: 1에서 100까지의 자연수가 적힌 숫자카드가 5세트가 있어. 각각의 세트에서 숫자를 하나씩 뽑았을 때, 이 숫자의 총합이 300이하일 확률이 얼마일지 정확하게 계산해줘
A1: 먼저, 각 세트에서 숫자를 뽑는 행위는 독립적인 사건입니다. 또한, 각 세트는 1부터 100까지의 숫자가 있으므로 100개의 가능한 결과가 있고, 각 숫자가 나올 확률은 동일하게 1/100입니다.

이 문제를 해결하려면 먼저 각 세트에서 숫자를 선택할 때 가능한 합의 분포를 알아야 합니다. 5개 세트에서 각각 숫자를 뽑아 그 합이 x가 되는 경우의 수는 얼마나 될까요?

평균적으로 각 세트에서 뽑힌 숫자의 합은 5 * (1+100)/2 = 255이고, 표준편차는 sqrt(5 * ((100^2-1)/12)) ≈ 72.92입니다. 이는 정규분포를 따르지는 않지만, 이 문제에 대한 대략적인 접근법을 제공할 수 있습니다.

그러나, 이 문제를 정확하게 해결하기 위해서는 5개의 숫자 카드 세트에서 뽑힌 숫자의 합이 300 이하가 될 수 있는 모든 가능한 경우의 수를 계산하고, 이를 전체 경우의 수 (100^5)로 나누어야 합니다.

이는 굉장히 복잡한 계산이며, 단순히 수학적 공식만으로는 어렵습니다. 이런 종류의 문제는 보통 컴퓨터 시뮬레이션, 동적 프로그래밍, 또는 복잡한 조합 통계 기법을 사용하여 해결합니다.

따라서, 이를 위해 정확한 수치를 제공하기는 어렵습니다. 그러나, 위에서 언급한 대략적인 평균과 표준편차를 통해 300이하의 합을 얻을 확률이 상당히 높다는 것을 알 수 있습니다.

Q2: 그럼 평균이 255이고 표준편차가 72.92인 정규분포에서 300이하가 나올 확률은 얼마야?
A2: 평균이 255이고 표준편차가 72.92인 정규분포에서 300 이하가 나올 확률을 계산하려면, 먼저 Z 점수를 계산해야 합니다. Z 점수는 관찰 값이 평균으로부터 얼마나 떨어져 있는지를 표준편차 단위로 나타내는 값입니다.

Z 점수는 다음과 같이 계산됩니다:

Z = (X - μ) / σ

여기서 X는 관찰값 (이 경우에는 300), μ는 평균 (255), σ는 표준편차 (72.92)입니다. 따라서 Z 점수는 다음과 같이 계산됩니다:

Z = (300 - 255) / 72.92 ≈ 0.62

이제 Z 점수를 사용하여 정규분포 테이블에서 해당 확률을 찾을 수 있습니다. Z 점수가 0.62일 때의 누적 확률은 대략 0.7324입니다. 이는 평균이 255이고 표준편차가 72.92인 정규분포에서 300 이하의 값이 나올 확률이 약 73.24%라는 것을 의미합니다.

하지만 이는 근사값이며, 실제 분포는 정확히 정규분포를 따르지 않습니다. 또한, 이 값은 각 세트에서 뽑힌 숫자가 서로 독립적이라는 가정 하에 계산된 것입니다. 그래서 정확한 확률을 계산하려면 더 복잡한 방법을 사용해야 할 수도 있습니다.

S.hermit

해시 아이콘

23/05/17 18:24

답변 감사합니다
다만, 파인애플님의 답변이 좀더 정확한것 같습니다
중심극한정리를 이용해 풀어야한다는걸 배웠네요

지옥천사

해시 아이콘

23/05/17 19:06

정확히 해결하고자 하는 문제는 이산균일분포를 가정하고 있는데, 파인애플님의 답변은 연속균일분포를 가정하고 있는 것으로 보입니다. 아무튼 평균과 표준편차를 갖고 나서 중심극한정리에 따라 정규분포를 한다고 가정하고 확률을 구하면 대략 비슷하게 나올 겁니다.

블랙박스

해시 아이콘

23/05/17 22:07

60%가 답이 아니라는 것을 예시를 들어 직관적으로 이해하기 쉽게 설명하자면, 상위60이 아니라 1등일 경우를 계산해보면 됩니다.
평균 1등이 되려면 5번 모두 1등이 되어야 하는데, 이럴 경우 확률은 0.0000000001이죠. 그냥 한번 1등이 될 확률은 0.01인데 말이죠.
이런 문제를 풀기 위한 가장 기초적인 접근은 적분을 활용하는건데요. 5번이 아니라 2번의 trial일 경우 2차원 사분면에 x는 1차년도 순위, y는 2차년도 순위로 놓고 우리가 계산해야 하는건 x+y<120 영역에 해당하는 영역의 면적입니다. (좀더 정확히는 0<x,y<60 공간 상에서 위 영역이 차지하는 비중)
5년 평균의 경우는 사실상 5차원상의 부피와 관련된 문제가 되는데요, 이론적으로 이해만 하면 어려운 문제가 아니지만 글만으로 자세히 설명하기는 어려우니 더이상 자세한 설명은 생략하겠습니다…

주인없는사냥개

해시 아이콘

23/05/17 22:30

C++로 간단하게 코드 짜서 돌려보니까 총 경우 10^10 중, 7657462560 개의 경우의 수가 해당되고 확률로는 0.7657462560 이네요.

S.hermit

해시 아이콘

23/05/17 23:46

와 코드를 짜서 경우의 수를 세는 방법도 있군요
일일이 센다는 점에서 가장 정확한 확률이겠네요
답변 감사합니다

랑비

해시 아이콘

23/05/18 12:36

재밌네요 크크 딱 들었을땐 쉬운 문제 같은데 풀이를 보니 그렇지 않군요

Steadfast

해시 아이콘

23/05/18 20:07

(수정됨) 수학적으로 위의 문제는 independent and identical, uniform 확률변수의 합에 대한 확률을 구하는 것입니다. 이와 관련하여 기본 uniform 확률변수 U=[0,1]을 n개 더했을 때 만들어지는 새로운 확률변수는 Irwin-Hall 분포를 따르게 됩니다.

https://en.wikipedia.org/wiki/Irwin%E2%80%93Hall_distribution

위의 링크에서 n=5인 경우의 pdf를 적분하여 확률을 구하면,
- (평균적으로 상위40%일 확률) = P(X<=2) = P(0<=X<1) + P(1<=X<=2)
울프람 적분기(https://www.wolframalpha.com)을 이용해 적분하면
- P(0<=X<1) = 1/120 = 0.00833
- P(1<=X<=2) = 0.21667
따라서, 다음의 결과를 얻습니다.
- (평균적으로 상위40%일 확률) = 0.22500
- (평균적으로 하위60%일 확률) = 0.77500

다만, 위의 결과는 등수가 0.1등, 0.01등의 연속적인 실수값을 가질 수 있는 상황을 상정한 것으로, 만일 정수로 값을 제한한다면 위에서 brute-force하게 구한 0.76575가 답이 될 수 있을 것이고, 이는 quantization 효과가 없을 때의 0.77500과 크게 차이나지는 않습니다.

목록 삭게로! 맨위로

번호	제목	이름	날짜	조회
173119	[질문] 홋카이도 2박3일 여행 질문드립니다. [22]	Aiurr9508	23/10/18	9508
173118	[질문] (보증금) 지연이자를 청구하는게 맞을까요? 의견구합니다. [14]	양스독8824	23/10/18	8824
173117	[질문] 미니멀 리스트에게 선물 구매 질문 [6]	따식이7828	23/10/18	7828
173116	[질문] 카메라 영상 촬영용 짐벌 및 렌즈 추가 구입 문의드립니다. [6]	하얀사신7410	23/10/18	7410
173115	[질문] 해외 가족여행지 추천부탁드립니다. [12]	호기심남8426	23/10/18	8426
173114	[질문] 구매한지 한 8년된 컴터가 갑자기 부팅이 안 되거나 윈도 들어가면 화면이 멈추네요. [13]	바카스8046	23/10/17	8046
173113	[질문] 코비 vs 이치로 누가 더 독한 선수였을까요? [7]	한이연9314	23/10/17	9314
173111	[질문] 오늘 서울에 뭐 발사 소식 있나요? [9]	니체8998	23/10/17	8998
173110	[질문] 현 KBO 감독 중에 욕 안먹는 감독이 있나요? [21]	피터파커8038	23/10/17	8038
173108	[질문] 도쿄 3박 4일 여행인데 많이 빡셀가요? [9]	Alfine9526	23/10/17	9526
173107	[질문] 도쿄 긴자쪽 식당 추천부탁드립니다. [8]	민서8668	23/10/17	8668
173106	[질문] 혹시 콘서트 좌석 측면4열 VS 정중앙 15열 어떤게 좋을까요 [3]	제드8258	23/10/17	8258
173105	[질문] 네비별로 도착시간 차이가 꽤 큰데 뭐가 정확한가요 [13]	데비루쥐10392	23/10/17	10392
173104	[질문] 베란다에 김치냉장고 설치해도 될까요? [13]	슬론10552	23/10/17	10552
173103	[질문] 마케팅 책 추천 부탁 드려요. [8]	realwealth8048	23/10/17	8048
173102	[질문] 주말에 세탁기 사러 가려고 하는데요 [9]	Jiny8090	23/10/17	8090
173100	[질문] 실내 러닝화(웨이트 겸용) 추천 부탁드립니다. [9]	밀크티9297	23/10/16	9297
173098	[질문] 혹시 일러스트레이터 한 분만 찾아주실 수 있으려나요 [2]	No.99 AaronJudge8048	23/10/16	8048
173097	[질문] 제주도 고등어회 맛집 있을까요? [15]	모찌피치모찌피치9693	23/10/16	9693
173096	[질문] 세금계산서 발행 질문 [5]	리얼포스9975	23/10/16	9975
173095	[질문] LG헬로비전 요거는 쓸만한가요 [8]	DogSound-_-*9121	23/10/16	9121
173093	[질문] 부동산 공부 관련 질문입니다. [11]	리스 제임스9888	23/10/16	9888
173092	[질문] 특이한 알람시계 없을까요? [12]	펩시제로라임8614	23/10/16	8614

목록 이전 다음

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글

맨 위로

PGR21.com

통합규정 1.3 이용안내 인용