성적과 통계학 (1)
게시글 주소: https://www.orbi.kr/00067993601
평균이 50점이고 표준편차가 20점인 시험이 있다고 합시다.
그렇다면 이 시험에서 70점을 받은 학생은 일반적으로 3등급 후반이 된다는 사실을 아시나요?
이 시험에서 85점을 받으면 웬만하면 1등급이 됩니다. 물론 다 된다는건 아니고, 안되는 특이 케이스도 있기는 하지만 대부분은 1등급이 됩니다.
오늘은 이런 이야기를 한 번 해보려고 합니다.
수능이나 모의고사에서 표준점수는 응시자들의 성적을 적절하게 조작해서 평균과 표준편차를 일정하게 맞춘 점수입니다.
원점수가 100점 만점인 국어, 수학에서는 응시자들의 표준점수 평균이 100점, 표준편차가 20점이 되도록 맞추고,
원점수가 50점 만점인 탐구에서는 응시자들의 표준점수 평균이 50점, 표준편차가 10점이 되도록 맞춥니다.
표준점수의 평균이 100점이고 표준편차가 20점인 국어, 수학에서
표준점수가 100점이라는 것은 어떤 의미일까요? 표준점수의 평균이 100점이라고 했으니 그냥 딱 평균만큼 받았다는 의미입니다.
그렇다면 표준점수가 120점이라는 것은 어떤 의미일까요? 평균보다 1표준편차만큼 잘 봤다는 의미가 됩니다. 평균이 100점, 표준편차가 20점이니까 (평균) + 1×(표준편차)를 하면 딱 120이 되죠
마찬가지로 표준점수가 140점이면 평균보다 2표준편차만큼 잘 봤다는 의미가 되고
표준점수가 130점이면 평균보다 1.5표준편차만큼 잘 봤다는 의미가 됩니다.
이렇게 평균보다 몇 표준편차만큼 잘(못) 봤는지를 따지는게 이번 글 내용의 핵심이라고 할 수 있습니다.
그렇다면 이걸 왜 따지느냐? 이걸 따지면 나의 상대적 위치를 예측해볼 수 있기 때문입니다.
국어나 수학에서 표준점수 100점이면, 그러니까 딱 평균만큼 받았으면 몇 등급이 나올거라고 예상하시나요?
사실 이건 너무 쉽죠. 평균이라고 하면 보통 가운데 등급인 5등급이 연상되잖아요?
실제로 국어나 수학에서 표준점수 100점을 받으면 5등급이 나옵니다.
탐구에서도 마찬가지로 표준점수 50점을 받으면 일반적으로 5등급이 나옵니다.
그러면 처음에 소개했던 것처럼, 평균보다 1표준편차만큼 잘 본 경우에도 등급을 예측할 수 있을까요? 그러니까 국어나 수학에서는 표준점수가 120점, 탐구에서는 표준점수가 60점이라면 보통 몇 등급인지 예측할 수 있을까요?
복잡하게 생각할 것 없이 과거 사례들을 찾아보면 답이 나옵니다.
국어, 수학에서 표준점수 3등급컷은 보통 116 ~ 118에서 형성되는 경향이 있습니다. 작년 뿐만 아니라 그 전년도를 찾아봐도 마찬가지입니다. 3등급컷이 높게 나오면 119까지도 올라가긴 하지만 120을 넘어가는 시험은 거의 찾아보기 어렵습니다. 따라서 표준점수 120점이 나오면 매우 높은 확률로 3등급이 된다는 사실을 알 수 있습니다.
탐구 같은 경우에도 표준점수 60점이면 웬만하면 3등급이 됩니다. 그렇다고 모두 3등급이 된다는건 아니고, 다음과 같이 4등급으로 떨어지는 경우도 있습니다.
이거는 성적 분포 양상에 따라 차이가 있어서 그렇습니다. 평균보다 1표준편차만큼 잘 보면 무조건 3등급이 된다는 절대적인 법칙은 없어요. 하지만 작년 수능의 경우, 한국지리를 제외하면 표준점수 60점이면 모두 3등급이 되었습니다. 따라서 100%는 아니지만, 탐구 표준점수 60점도 높은 확률로 3등급이 된다는 사실을 알 수 있죠.
그렇다면 혹시 내신에서도, 평균과 표준편차만 가지고 나의 상대적인 위치를 파악할 수 있지 않을까요? 오늘 그걸 알아보기 위해 제가 대략 코딩을 해왔습니다.
먼저, 실제 내신 시험처럼 학생 수를 250명으로 가정하였습니다.
그리고 0부터 100까지의 정수를 학생 수만큼 랜덤으로 추출합니다. 학생 수가 250명이니까 250개를 추출하게 되겠군요. 이때 추출된 숫자가 각 학생의 시험 점수가 됩니다.
그리고 추출된 250개 점수의 평균과 표준편차를 구해서, (평균)+z×(표준편차)에 해당하는 학생이 몇 등급에 속하는지를 기록합니다. 이 과정을 10,000번 반복해서 최종적으로 이 학생이 몇 등급에 속할 확률이 가장 높은지 따져보는 것입니다.
먼저 z=0으로 했을 때의 결과입니다. 딱 평균만큼 받았을 때죠. (국어 수학 표준점수 100점, 탐구 표준점수 50점에 해당)
반복 횟수 10,000번에 대해서 10,000번 모두 5등급이 나왔습니다(등급 분포 양상의 왼쪽부터 1등급이 나온 횟수, 2등급이 나온 횟수, ...로 읽으시면 됩니다.). 평균적으로 상위 49.95%로 딱 중간 위치를 차지하고 있다는 것을 알 수 있네요
이번에는 z=1로 해보겠습니다.
예를 들어 원점수 평균이 52점이고 표준편차가 23점인 시험이 있다면, 52+23=75점을 받은 학생은 보통 몇 등급에 속하는지를 알아보려고 합니다. (국어 수학 표준점수 120점, 탐구 표준점수 60점에 해당)
반복 횟수 10,000번에 대해서 3등급이 나온 횟수는 9,183회이고, 4등급이 나온 횟수는 817회입니다.
그러니까 대부분은 3등급이 나오는데 운이 나쁘면 4등급으로 떨어질 수도 있는 것이네요
이렇게 z값을 변경시켜가며 각 z에 대해 응시자들의 등급이 어디에 해당할지 몇 가지 살펴봤습니다.
z=1.2일 때 (국어 수학 표준점수 124점, 탐구 표준점수 62점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.2×23=79.6점은 보통 몇 등급에 해당되는가?
3등급일 확률이 가장 높다!
z=1.5일 때 (국어 수학 표준점수 130점, 탐구 표준점수 65점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.5×23=86.5점은 보통 몇 등급에 해당되는가?
2등급일 확률이 가장 높다!
z=1.8일 때 (국어 수학 표준점수 136점, 탐구 표준점수 68점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.8×23=93.4점은 보통 몇 등급에 해당되는가?
1등급일 확률이 가장 높다!
z=0.5일 때 (국어 수학 표준점수 110점, 탐구 표준점수 55점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+0.5×23=63.5점은 보통 몇 등급에 해당되는가?
4등급일 확률이 가장 높다!
결과 자체는 꽤 일리 있어 보이게 나왔습니다.
그런데 사실 이렇게 점수를 완전 랜덤으로 추출하면 별로 마음에 들지 않는 분포가 나옵니다.
뭐가 마음에 들지 않을까요?
점수를 완전히 랜덤으로 추출했다는 것은, 0부터 100까지의 숫자가 나올 확률이 1/101씩으로 완전 동일하다는 의미입니다.
그러니까 거의
90점대 인원 = 80점대 인원 = 70점대 인원 = ... = 10점대 인원 = 한 자리수 인원
꼴로 인원 분포가 나온다는 것입니다.
그런데 이는 현실적인 성적 분포와 좀 동떨어져 있죠
보통 성적 분포라고 하면 90점대 인원보다 80점대 인원이 조금 더 많고, 80점대보다 70점대가 조금 더 많은 분포를 생각하지, 저렇게 각 점수대별 인원이 다 똑같을 거라고 생각하진 않죠.
실제로 저렇게 추출하면 표준편차가 거의 28~30으로 나오는데, 이것도 현실의 표준편차와 많이 동떨어져 있다고 할 수 있습니다.
따라서 다음 편에서는 확률 분포를 직접 커스터마이징해서 등급 분포 양상을 구해보도록 하겠습니다.
감사합니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
Fait 최종판이 발행 완료되었습니다. 신규 구매자들은 결제 후 발행되는 첫...
-
전년도 Fait20 보고서는 436개 모집 단위에 대해 추정을 했습니다. 436개...
-
Fait Medical 초판 이틀 앞당겨 지금 발행 47
Fait Medical의 기존 예약 구매자 분들은 이제 초판을 다운로드 하실 수...
-
설명 읽기 귀찮은 분들을 위한 동영상 버전...
-
2021학년도 수능 (2020. 12. 3.) RAINBOW TABLES...
-
타임머신 잠정 최종판 발행완료 130
업데이트: 일요일 오후부터 21.3.0판을 다운로드 하실 수 있습니다. 21.3판은...
-
이제 AI모의지원 전국석차 표시 + 타임머신 21.1.0 발행됨 24
이제 오르비 AI 모의지원에 표본을 제출하신 분들은 원점수 기준 자신이 전국 몇 등...
-
Time Machine은 오늘 본 수능 시험 점수를 과거 5개년 수능 점수로 가장...
-
오늘 시험 문제지, 정답지 링크는 아래와 같습니다....
-
수험생 여러분 모두 수고 많으셨습니다. 이제 점수는 정해졌습니다. 하지만 같은...
-
[20-9-16 | 9평] Rainbow Tables 16
2021학년도 9평 (2020. 9. 16.) RAINBOW TABLES...
-
이제 AI모의지원 에 표본을 입력하신 분께는 원점수 기준 전국석차를 표시해줍니다....
-
오르비AI모의지원에서 (링크 클릭) 아래와 같이 "가채점하기" 탭을 이용해 답을...
-
오르비의 각종 입시정보는 #배치표 (클릭) 태그에 잘 정리되어 있습니다. 20년치...
-
[20-6-18 | 6평] Rainbow Tables 17
2021학년도 6평 (2020. 6. 18.) RAINBOW TABLE...
-
오늘 AI모의지원에 표본을 제출하시는 분들께 모레 10,000 XDK 일괄 입금해...
-
[20-6-18 | 6평] 문제지 + 등급컷 설문조사 15
오르비의 각종 입시정보는 #배치표 태그에 잘 정리되어 있습니다. 20년치 입시...
-
[2019 수능] Kaleidoscope 2019 CC (의치한수+자연+인문) 3
이 자료는 2018. 11. 실시된 2019학년도 수능에 관한 분석자료입니다....
-
[2020 수능] Kaleidoscope 2020 CC (의치한수+자연+인문) 34
Kaleidoscope 2019 CC (2018. 11. 실시 수능) 보기 :...
-
[2020 수능] 옯피셜 점공(점수공개) 5천명 돌파 37
오르비 AI모의지원 점공은 서비스 결제 여부와 관계 없이 모든 이용자가 참여할 수...
-
추천글을 보니 지난 밤에 서울대 접수가 끝나서 게시판에서 힘들게 표본을 모으고 계신...
-
[2020 수능] 오르비의 입시 패키지 Fait 이용 방법
Fait이 무엇인지 모르는 분들을 위한 간단한 안내 + 아주 쉽게 설명한...
-
[2020 수능] 입시FAQ + AI모의지원 추정치 업데이트 알림 0
오늘 저녁에 오르비 AI모의지원에 전반적인 추정치 업데이트가 있었습니다. 보통은...
-
Fait는 오르비가 20년 간 축적한 정시모집 노하우를 응축해 만든 정시모집 합격...
-
[2020 수능] Rainbow Tables (전과목) 202
2020 RAINBOW TABLE powered by fait 국어/수학 나형/가형...
-
평가원 공식 수능 문제/정답 발표 서버 (여기를 클릭/터치하세요) 모든 시험이...
-
[19-9-4 | 9평] Rainbow Tables 55
Rainbow Table에 관한 주의사항 * Rainbow Table 은 국, 수,...
-
전과목 가채점을 끝내고 나면 오르비 AI모의지원2020에 참여해서 과목별 등급컷,...
-
[19-6-4 | 6평] Rainbow Tables 37
Rainbow Table에 관한 주의사항 * Rainbow Table 은 국, 수,...
-
수요일 밤 11시 59분 전까지 오르비 AI모의지원2020 에 가채점 결과를...
-
[2019 수능] Rainbow Tables (원점수-표점-백분위-등급 대조표) 455
국어 만점자 0.03% 수학 가형 만점자 0.39% 수학 나형 만점자 0.24%...
-
평가원 공식 수능 문제/정답 발표 서버 (여기를 클릭/터치하세요) 모든 시험이...
-
오르비는 매년 10~11월 대학AH 조사를 통해 수험생과 학부모, 입시관계자들의...
-
가끔 탐구 조합 궁금해 하시는 분들이 계셔서 개발팀에서 의 도움을 받아...
-
[18-9-5 | 9평] Rainbow Tables 22
Rainbow Table에 관한 주의사항 * Rainbow Table 은 국, 수,...
-
목요일 23시 59분 이전까지 오르비 AI모의지원2019 에 가채점 결과를 입력하고...
-
[18-6-7 | 6평] Rainbow Tables 35
Rainbow Table에 관한 주의사항 * Rainbow Table 은 국, 수,...
-
[18-6-7 | 6평] 수학 만점자 비율 0.1% 수준 추정 50
오르비 AI모의지원 2019의 분석 결과 어제 실시된 6월 모의평가에서, 1등급...
-
일단 게시물 협찬 업체 5초 광고 보시고 시작 .. 의외로 오래전(2012년..)에...
-
[Fait Book] Fait17 합격선 형성지점 최초컷~최종컷 비교 4
지난 수요일, https://orbi.kr/00014912391 에 작년판...
-
[Fait Book] Fait 17 합격선 형성 지점 총정리
Fait 보고서가 표시하는 합격 확률에 대해 설명할 때 더 이해하기 쉽도록 종종...
-
저를 "팔로우" 해주시면 입시 관련 정보를 가장 먼저 받아보실 수 있습니다. 1컷...
-
국어 1컷 설문조사 수학 가형 1컷 설문조사 수학 나형 1컷 설문조사 영어 1등급...
-
[2018 수능] 2018학년도 대학/학과 순위 조사 개시 46
오르비는 매년 10월 수험생과 학부모, 교사 등 실제 입시 수요자/소비자들의 각...
-
[17-9-6 | 9평] Rainbow Tables 39
오르비 여러분 모두 수고하셨습니다 남은 50일도 마무리 잘 하셔서 수능에서 꼭...
-
오후 5시 4분에 영어영역 정답표가 공개되고, 오후 8시 10분에 탐구영역 정답표가...
-
[17-6-1 | 6평] Rainbow Tables 35
저를 "팔로우" 해주시면 입시 관련 정보를 가장 먼저 받아보실 수 있습니다....
-
저를 팔로우 해주시면 앞으로도 입시 관련 속보를 제일 먼저 받아보실 수 있습니다....
-
[Fait Book] Fait 16 합격선 형성 지점 총정리
Fait 보고서가 표시하는 합격 확률에 대해 설명할 때 더 이해하기 쉽도록 종종...
Sexual & statistics
그 성적 아니고...
개재미따