:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
23/05/17 16:38
등수의 평균이 60보다 작을 확률과 줄 세웠을때 60등 안에 드는것은 엄밀히 다른내용이라고 보는데
100명중 1명을 선택했을때 상위60%= 즉 줄세워서 60등 안이라는 말이면 60%죠. 계산할것도 없습니다....
23/05/17 17:12
정확한 계산식은 잘 모르겠네요 경우의 수가 100^5 니까요
다만 숫자가 100이 아닌 더 늘어난다는 가정하 생각한다면 60%로 수렴할것같습니다.
23/05/17 17:38
그 경우는 수치가 달라집니다. 좀 극단적으로 예를 들면, 한 번 뽑을 때 1등이 될 확률은 1/100이지만 다섯 번 뽑아서도 평균등수가 1이 될 확률은 (1/100)^5 이 되거든요.
수치계산을 간단히 해보니 평균등수가 60보다 작을 확률은 대략 76% 정도가 되네요.
23/05/17 17:51
평균등수가 1 이 될 확률은 (1/100)^5 만 있는게 아니라
1,1,1,2,2 도 평균 등수는 1등 일거고, 2,2,2,2,2 가 나오더라도 다른 직원이 1,10,10,10,10 이런 식으로 성적이 나오면 5년간의 평균은 2,2,2,2,2 인 직원이 1등이 될 수도 있을 겁니다. 5년 내내 1등일 필요는 없으니까요.
23/05/17 17:54
다시 추가로 질문하신 내용이 '순위'가 아니라 등수의 평균값에 대해서 질문하셨으니 해당 문제에서는 (1/100)^5이 맞습니다.
말씀하신대로 그냥 순위라면 %를 따로 논할 필요도 없죠.
23/05/17 18:04
네 맞습니다 이해를 돕기 위해 비유를 한것이 오히려 더 헷갈리게 한것 같습니다ㅠ 죄송해요
등수의 평균값이 맞습니다 즉, 1부터 100까지 랜덤 및 복원으로 5회 뽑았을때 숫자의 평균이 60이하가 되는 것, 다시말하면 숫자의 합이 300이하가 되는 확률을 구하는 것입니다
23/05/17 17:01
직원이 5년 동안의 평균 평가에서 상위 60%에 들어갈 확률을 결정하려면 순위를 기준으로 상위 60%에 포함될 수 있는 직원의 수를 고려해야 합니다.
이 시나리오에서 각 직원의 평가는 매년 1위부터 100위까지 무작위로 결정됩니다. 직원이 100명이므로 가능한 순위도 100개입니다. 상위 60%에 들기 위해서는 직원의 순위가 100명 중 상위 60명 안에 있어야 합니다. 따라서 상위 60%에 들어갈 수 있는 직원의 수는 60명입니다. 이제 5년 동안의 평가를 고려하여 직원이 5년 동안 상위 60%에 포함될 확률을 계산해야 합니다. 매년 평가는 독립적이고 임의적이기 때문에 1년 동안 상위 60%에 들 확률은 60/100 또는 0.6입니다. 평가가 독립적이므로 전체 5년 동안 상위 60%에 속할 확률은 개별 확률을 함께 곱하여 계산됩니다. P(5년간 상위 60%) = P(1차년도 상위 60%) * P(2차년도 상위 60%) * P(3차년도 상위 60%) * P(4차년도 상위 60% year) * P(5년차 상위 60%) = 0.6 * 0.6 * 0.6 * 0.6 * 0.6 = 0.6^5 ≈ 0.07776 또는 7.776% 따라서 직원이 [5년 동안의 평균 평가에서 상위 60%에 들어갈 확률]은 약 7.776%입니다. by chatGPT 어떤 직원이 5년동안 매 년 마다 상위 60%에 들어간다면 챗gpt 답변이 맞고 그게 아니라면 60%가 맞는거 같습니다
23/05/17 17:26
매년마다 상위 60%가 아니고 5년간 평균했을때 상위60% 입니다.
1년차때 100등했더라도 다른 년차에 높은평가를 받으면 만회가 되는 구조이죠 매년 상위 60%에 드는건 너무 당연히 확률 곱연산이죠 그쉬운걸 질문했겠습니까 챗gpt가 문제 이해를 잘못한것 같습니다
23/05/17 17:30
100명의 평균 등수가 순차적으로 정해질거고 그에 따라 상위 60%에 들어갈 확률이므로 60%가 맞을 듯 합니다.
다만 정확히 평균 60등 이라는 숫자를 기준으로 한다면 약간의 차이가 발생할 수도 있어 보입니다. 동점자의 수도 영향을 줄 듯 하구요.
23/05/17 17:48
100명의 직원 중 5년 간 평가를 평균을 낸 결과는 100 명중 60명이 60등 안에 들어갑니다.
그러면 어떤 직원이 상위 60% 안에 들어갈 확률은 60% 겠죠.
23/05/17 17:54
아니요, 2년짜리를 계산한것만 봐도 60%가 아닙니다
이해를 돕기위해 직원이라는 표현을 썼는데 좀더 간단하게 말해서 1부터 100까지 랜덤 및 복원으로 총 5회 숫자를 뽑았을때 이 숫자의 평균이 60이하가 될 확률을 구하는 겁니다
23/05/17 17:49
저도 궁금해서 챗gpt 돌려봤습니다.
1부터 100까지의 숫자 중 하나를 랜덤으로 5회 뽑았을 때 그 합이 300 이상이 될 확률을 계산해 보겠습니다. 먼저, 가능한 모든 조합의 수를 구합니다. 1부터 100까지의 숫자 중에서 5개를 선택하는 경우의 수는 100C5로 계산할 수 있습니다. 이는 약 75,287,520개입니다. 다음으로, 합이 300 이상이 되는 조합의 수를 구해야 합니다. 이를 계산하기 위해서는 가능한 모든 조합을 확인하고, 그 중 합이 300 이상이 되는 조합을 찾아야 합니다. 이러한 계산은 상당히 복잡하며, 시간이 오래 걸리기 때문에 간단한 근사치를 사용하겠습니다. 1부터 100까지의 숫자 중 하나를 뽑을 때, 그 숫자가 50 이상인 경우에는 평균적으로 75/2 = 37.5의 값을 가질 것으로 예상할 수 있습니다. 따라서, 5번을 뽑았을 때의 평균적인 합은 37.5 * 5 = 187.5가 됩니다. 이를 바탕으로, 합이 300 이상이 되는 확률을 추정해보면 약 1/2로 예상할 수 있습니다. 하지만, 이는 근사치일 뿐 정확한 값은 아닙니다. 따라서, 1부터 100까지의 숫자 중 하나를 랜덤으로 5회 뽑았을 때 그 합이 300 이상이 될 확률은 약 1/2로 추정할 수 있습니다.
23/05/17 17:59
거의 근접한 답이 나오고 있는것 같습니다~
다만 총 경우의 수는 복원방식이므로 100C5가 아니라 100^5, 즉 10,000,000,000 개입니다 1부터 100까지의 숫자 5개(무작위, 복원) 합이 300이 넘는 경우의 수를 모두 계산하는 수밖에 없을까요?
23/05/17 17:49
본문 3째 줄에
[그러면 한 직원이 받은 5년 간 평가를 평균냈을 때 상위 60% 안에 들어갈 확률은 얼마나 될까요?] 상위 60% 가 아니고 평균 60등을 말씀하시는 건가요?
23/05/17 18:01
이해를 돕기 위해 직원을 비유로 들은건데 더 어렵게 만든 것 같습니다
간단하게 말해서 1부터 100까지 숫자를 5번 복원방식으로 뽑았을 때 이 숫자들의 평균이 60이하가 될 확률을 구하는 것입니다~
23/05/17 18:05
chat-gpt한테 물어봤는데요
Q: 1부터 100까지 숫자를 5번 복원방식으로 뽑았을 때 이 숫자들의 평균이 60이하가 될 확률을 알려주세요 A: 이 질문은 통계와 확률에 관련된 내용이며, 중심극한정리(Central Limit Theorem)를 사용하여 근사적으로 답을 찾을 수 있습니다. 중심극한정리는 동일한 분포에서 독립적으로 뽑은 샘플의 평균이 정규분포에 근사한다는 이론입니다. 우선, 1부터 100까지의 숫자들의 평균과 표준편차를 알아야 합니다. 이들 숫자들은 균일분포(Uniform Distribution)을 이루므로 평균은 (1 + 100) / 2 = 50.5가 됩니다. 또한, 균일분포의 표준편차는 sqrt((b-a+1)^2 - 1)/12 로 계산할 수 있는데, 여기서 a는 최소값, b는 최대값입니다. 이를 계산하면 대략 28.8661 정도가 됩니다. 중심극한정리에 따라, 5개의 샘플의 평균은 평균이 50.5이고, 표준편차가 28.8661 / sqrt(5)인 정규분포에 근사합니다. 표준편차를 5의 제곱근으로 나눈 이유는 샘플의 평균의 표준편차가 원래의 표준편차를 샘플 크기의 제곱근으로 나눈 것이기 때문입니다. 이렇게 계산하면 표준편차는 대략 12.9094가 됩니다. 이제 우리는 5개의 샘플의 평균이 60 이하일 확률을 계산할 준비가 되었습니다. 이는 표준정규분포표 또는 z-점수를 이용한 계산을 통해 얻을 수 있습니다. z-점수는 다음과 같이 계산됩니다: z = (X - μ) / σ 여기서 X는 관심 있는 값(60), μ는 평균(50.5), σ는 표준편차(12.9094)입니다. 이를 대입하면 z 점수는 대략 0.7364가 됩니다. 표준 정규 분포표를 찾아보면, z 점수가 0.7364인 경우의 누적 분포 함수 값은 대략 0.7690입니다. 따라서 5개의 샘플의 평균이 60 이하일 확률은 대략 76.9%라고 할 수 있습니다. 이는 근사치이며, 실제 확률은 시뮬레이션 등을 통해 더 정확하게 알아볼 수 있습니다. -- 라고 하네요
23/05/17 18:14
Chat GPT를 통해서 알아본 내용입니다.
Q1: 1에서 100까지의 자연수가 적힌 숫자카드가 5세트가 있어. 각각의 세트에서 숫자를 하나씩 뽑았을 때, 이 숫자의 총합이 300이하일 확률이 얼마일지 정확하게 계산해줘 A1: 먼저, 각 세트에서 숫자를 뽑는 행위는 독립적인 사건입니다. 또한, 각 세트는 1부터 100까지의 숫자가 있으므로 100개의 가능한 결과가 있고, 각 숫자가 나올 확률은 동일하게 1/100입니다. 이 문제를 해결하려면 먼저 각 세트에서 숫자를 선택할 때 가능한 합의 분포를 알아야 합니다. 5개 세트에서 각각 숫자를 뽑아 그 합이 x가 되는 경우의 수는 얼마나 될까요? 평균적으로 각 세트에서 뽑힌 숫자의 합은 5 * (1+100)/2 = 255이고, 표준편차는 sqrt(5 * ((100^2-1)/12)) ≈ 72.92입니다. 이는 정규분포를 따르지는 않지만, 이 문제에 대한 대략적인 접근법을 제공할 수 있습니다. 그러나, 이 문제를 정확하게 해결하기 위해서는 5개의 숫자 카드 세트에서 뽑힌 숫자의 합이 300 이하가 될 수 있는 모든 가능한 경우의 수를 계산하고, 이를 전체 경우의 수 (100^5)로 나누어야 합니다. 이는 굉장히 복잡한 계산이며, 단순히 수학적 공식만으로는 어렵습니다. 이런 종류의 문제는 보통 컴퓨터 시뮬레이션, 동적 프로그래밍, 또는 복잡한 조합 통계 기법을 사용하여 해결합니다. 따라서, 이를 위해 정확한 수치를 제공하기는 어렵습니다. 그러나, 위에서 언급한 대략적인 평균과 표준편차를 통해 300이하의 합을 얻을 확률이 상당히 높다는 것을 알 수 있습니다. Q2: 그럼 평균이 255이고 표준편차가 72.92인 정규분포에서 300이하가 나올 확률은 얼마야? A2: 평균이 255이고 표준편차가 72.92인 정규분포에서 300 이하가 나올 확률을 계산하려면, 먼저 Z 점수를 계산해야 합니다. Z 점수는 관찰 값이 평균으로부터 얼마나 떨어져 있는지를 표준편차 단위로 나타내는 값입니다. Z 점수는 다음과 같이 계산됩니다: Z = (X - μ) / σ 여기서 X는 관찰값 (이 경우에는 300), μ는 평균 (255), σ는 표준편차 (72.92)입니다. 따라서 Z 점수는 다음과 같이 계산됩니다: Z = (300 - 255) / 72.92 ≈ 0.62 이제 Z 점수를 사용하여 정규분포 테이블에서 해당 확률을 찾을 수 있습니다. Z 점수가 0.62일 때의 누적 확률은 대략 0.7324입니다. 이는 평균이 255이고 표준편차가 72.92인 정규분포에서 300 이하의 값이 나올 확률이 약 73.24%라는 것을 의미합니다. 하지만 이는 근사값이며, 실제 분포는 정확히 정규분포를 따르지 않습니다. 또한, 이 값은 각 세트에서 뽑힌 숫자가 서로 독립적이라는 가정 하에 계산된 것입니다. 그래서 정확한 확률을 계산하려면 더 복잡한 방법을 사용해야 할 수도 있습니다.
23/05/17 19:06
정확히 해결하고자 하는 문제는 이산균일분포를 가정하고 있는데, 파인애플님의 답변은 연속균일분포를 가정하고 있는 것으로 보입니다. 아무튼 평균과 표준편차를 갖고 나서 중심극한정리에 따라 정규분포를 한다고 가정하고 확률을 구하면 대략 비슷하게 나올 겁니다.
23/05/17 22:07
60%가 답이 아니라는 것을 예시를 들어 직관적으로 이해하기 쉽게 설명하자면, 상위60이 아니라 1등일 경우를 계산해보면 됩니다.
평균 1등이 되려면 5번 모두 1등이 되어야 하는데, 이럴 경우 확률은 0.0000000001이죠. 그냥 한번 1등이 될 확률은 0.01인데 말이죠. 이런 문제를 풀기 위한 가장 기초적인 접근은 적분을 활용하는건데요. 5번이 아니라 2번의 trial일 경우 2차원 사분면에 x는 1차년도 순위, y는 2차년도 순위로 놓고 우리가 계산해야 하는건 x+y<120 영역에 해당하는 영역의 면적입니다. (좀더 정확히는 0<x,y<60 공간 상에서 위 영역이 차지하는 비중) 5년 평균의 경우는 사실상 5차원상의 부피와 관련된 문제가 되는데요, 이론적으로 이해만 하면 어려운 문제가 아니지만 글만으로 자세히 설명하기는 어려우니 더이상 자세한 설명은 생략하겠습니다…
23/05/17 22:30
C++로 간단하게 코드 짜서 돌려보니까 총 경우 10^10 중, 7657462560 개의 경우의 수가 해당되고 확률로는 0.7657462560 이네요.
23/05/18 20:07
수학적으로 위의 문제는 independent and identical, uniform 확률변수의 합에 대한 확률을 구하는 것입니다. 이와 관련하여 기본 uniform 확률변수 U=[0,1]을 n개 더했을 때 만들어지는 새로운 확률변수는 Irwin-Hall 분포를 따르게 됩니다.
https://en.wikipedia.org/wiki/Irwin%E2%80%93Hall_distribution 위의 링크에서 n=5인 경우의 pdf를 적분하여 확률을 구하면, - (평균적으로 상위40%일 확률) = P(X<=2) = P(0<=X<1) + P(1<=X<=2) 울프람 적분기(https://www.wolframalpha.com)을 이용해 적분하면 - P(0<=X<1) = 1/120 = 0.00833 - P(1<=X<=2) = 0.21667 따라서, 다음의 결과를 얻습니다. - (평균적으로 상위40%일 확률) = 0.22500 - (평균적으로 하위60%일 확률) = 0.77500 다만, 위의 결과는 등수가 0.1등, 0.01등의 연속적인 실수값을 가질 수 있는 상황을 상정한 것으로, 만일 정수로 값을 제한한다면 위에서 brute-force하게 구한 0.76575가 답이 될 수 있을 것이고, 이는 quantization 효과가 없을 때의 0.77500과 크게 차이나지는 않습니다.
|