:: 게시판
:: 이전 게시판
|
이전 질문 게시판은 새 글 쓰기를 막았습니다. [질문 게시판]을 이용바랍니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
13/03/16 23:43
1번같은경우.. 물어보시는 요지가 무엇인지 잘 모르겠어서 확답은 못드리겠으나 일반적으로 Y라는 확률변수가 어떠한 분포를 따른다는 가정이 있고, 그리고 Y1에서 Yn까지 표본을 추출하여 표본평균을 구하지요. 여기서 각 사건은 보통 iid를 가정하곤 합니다. iid는 independent identically distributed로 각 사건들이 독립이며 동일분포를 따른다는 가정입니다.
이러한 가정하에 뽑힌 n개 표본의 표본평균은 실제 Y의 기대값과 항상 일치합니다. 이는 표본평균이 불편추정량임을 알 수 있는 증거기도 하지요. 이러한 내용은 수리통계책을 참고하신다면 상세히 나와있을 겁니다.
13/03/16 23:49
그리고 2번같은 경우는 회귀분석의 가정에서 오차항은 관측할 수 없는 random error입니다. 따라서 이를 관측할수 없기에 잔차를 통한 검정을 하는것이지요. 잔차는 yi-yi hat이라는 것을 아신다는 가정하에 잔차의 기대값이 0이되는것은 실제로 잔차에 기대값을 취해보면 쉽게 구하실 수 있습니다. yi hat에 들어가는 회귀계수의 추정값들이 위에 1번에서 잠시 언급해드린 불편성을 만족하기 때문에 기대값은 0이라고 간단히 나옵니다.
혹시 더 궁금하신점은 쪽지로 물어봐주시면 아는범위내에 답변해드릴게요.^^ 그리고 iid는 random sample이라는 말로 쓰이기도 하니 참고하시면 되실듯 합니다.
13/03/17 00:38
그리고 1번 같은 경우 질문하신 요지가 제가 받아들인 것과 같다면 표본평균과 기대값에 관한 개념이 아직 명확히 받아지신 것 같지가 않은데요..
음 우선 결론만 말씀드리면 Yi들의 추출확률은 당연히 다 다릅니다. 그리고 표본평균과 기대값은 같을수도 있고 다를 수도 있습니다. 이게 무슨 말인지 이해하시기 힘들 것 같아 예제를 하나 드릴게요. Y라는 확률변수(random sample)을 '동전을 10번 던져 앞면이 나온 횟수' 라고 정의 내립시다. 만약 동전의 앞면이 나올 확률이 1/2이라면 Y의 평균은 당연히 5이겠지요. 이는 확률분포와 기대값에 대한 정의롤 모르시더라도 상식적으로 앞뒤가 반반의 확률도 니오니 10번중 5번은 앞면이다 라고 생각 할 수 있을겁니다. 그렇다면 이런 Y라는 분포를 따르는 표본 3개를 뽑았다고 합시다. 그래서 나온 값이 Y1=1, Y2=3, Y3=5 이라고 칩시다. 이 경우 표본평균은 (1+3+5)/3 = 3이 나옵니다. 그런데 위에서 Y의 기대값은 5라고 했죠. 둘 의 값은 다르다는 것을 알 수 있지요. 그렇다면 표본3개를 더 뽑았고, 나온 값이 Y1=4 , Y2=5, Y3=6이라고 칩시다. 이 경우 표본평균은 (4+5+6)/3 = 5가 나옵니다. 이 경우는 Y의 기대값인 5와 일치합니다. 이 두개의 예를 통해 보면 표본평균은 기대값과 같을수도, 다를수도 있다는 사실을 알았다고 칩시다. 그럼 이제 물어보신 표본평균과 기대값이 같다는 건 Yi들의 추출확률이 같을 경우이고, 표본평균과 기대값이 다른 경우는 Yi들의 추출확률이 다른 경우냐는 질문에 대해서 알아보죠. 위에 예제를 보시면 표본평균이 기대값과 다른경우에서 나온 표본들은 1,3,5였고, 같은 경우는 4,5,6이었습니다. 자, 그렇다면 동전을 10번 던졌을 때 앞면이 한 번 나오는 경우, 세 번 나오는 경우, 다섯 번 나오는 경우의 확률이 어떨까요? 당연히 다 다르겠지요? 그렇다면 앞명니 네 번 나오는 경우, 다섯 번 나오는 경우, 여섯 번 나오는 경우는 어떨까요? 네번, 여섯번은 조합의 성질 때문에 같겠지만 다섯 번 나오는 경우는 다릅니다. 일반적으로 당연히 Yi(표본)들이 가질 수 있는 값들의 확률은 다 다릅니다. 그렇다면 표본평균과 기대값이 일치한다는 말은 언제 쓰이는지 궁금하실텐데요. 사실 이런 말은 쓰질 않습니다. 표본평균과 기대값이 일치한다는 말보다는 '표본평균의 기대값이 Y의 기대값과 일치한다'는 말을 쓰곤 하죠. 이는 불편성이라는 성질입니다. 이런 내용은 수리통계쪽을 공부하셔야 알 수 있는 내용이라 말이 너무 길어질것 같아 곤란하네요.ㅠㅠ 표본평균의 기대값이 Y의 기대값과 일치한다는 말은 E(Ybar) = μ 이렇게 쓰곤 합니다. 조금만 더 자세히 설명드리면 표본평균의 평균이라 함은 다시 위의 예제에서 표본이 어떻게 추출되냐에 따라서 표본평균 Ybar의 값은 다 다른 값을 갖겠지요? 왜냐면 표본이 1,2,3인 경우 표본평균은 3이고 표본평균이 4,5,6,인경우 표본평균은5이고 생각해보면 표본이 어떻게 뽑히냐에 따라 표본평균이 다르다는 것을 알 수 있지요. 그런데 표본평균이 가질수 있는 모든 경우의 수를 생각해 보면 (10개중 3개를 뽑는 경우와 같을 겁니다.) 많은 값들이 나올 텐데 이렇게 나온 모든값들의 평균을 구한다면 실제 Y의 평균 5와 일치해 진다는 말입니다. 그리고 이러한 성질을 '불편성(unbiasedness)' 라고 부르지요.. 이미 답변이 충분히 길어진것같아서 ㅠㅠ 이쯤에서 줄이겠습니다. 혹시 더 이해가 필요하신 부분이 있으시다면.. 쪽지주시면 더 답변해드리겠습니다..!
|