본문 바로가기
심리학

심리검사의 타당도

by 럭키리타 2023. 10. 12.
반응형

좋은 심리검사의 또 다른 요건은 타당도다. 타당도란 검사에서 얻은 점수가 그 검사를 통해 측정하고자 하는 개념을 잘 반영하는 정도를 말한다. 어떤 검사의 신뢰도가 높다 하더라도 타당도가 높지 않으면 검사에서 얻은 점수의 해석은 정확할 수가 없다. 타당도의 종류에는 크게 내용 타당도 있다. 내용타당도란 심리검사에서 사용한 문항의 내용이 그 검사에서 측정하고자 하는 개념의 여러 가지 측면들을 잘 나타내는 정도를 말한다. 예를 들어 '성격장애'를 평가하기 위한 심리검사라면, 자기상 정서 지각 및 대인관계 대한 태도 및 일하는 방식 등 성격장애의 여러 가지 양상들을 문항에 잘 포함하고 있을 때 그 검사의 내용타당도가 높다고 할 수 있다. 내용타당도를 객관적으로 판단할 수 있는 기준은 일반적으로 설정하기 어렵다. 이 때문에 흔히 검사의 문항들이 해당 개념을 얼마나 잘 나타내고 있는지에 대한 관련 전문가들의 의견을 취합하여 판단한다. 준거 타당도란 현재의 심리검사 외의 다른 외적 준거에 비추어 이 검사의 타당도를 판단하는 방법이다. 이때의 외적 준거로는 현재의 심리검사에서 측정하는 것과 동일한 개념을 평가하는 다른 측정치가 사용된다. 예를 들어 제작한 지능검사가 타당한지 확인하기 위해 이미 존재하는 다른 지능검사를 함께 실시하여 두 검사에서 각각 산출된 IQ가 얼마나 일치하는지 살펴볼 수 있다. 두 IQ가 매우 유사하게 나왔다면 이는 새로운 지능검사가 타당하다는 증거가 될 수 있다. 또 다른 예로 어떤 기업체에서 신입사원을 선발하는 절차 중의 하나로 업무 적성검사를 사용하는 경우를 생각해 보자. 이 업무 적성검사의 타당도를 평가할 수 있는 외적 준거로 무엇을 사용할 수 있을까? 아마도 입사 후 일정 기간의 업무성과를 외적 준거로 사용할 수 있을 것이다. 입사 당시 업무적성 검사 점수가 높은 사람이 2년 후의 업무성과가 우수했고 업무적성 검사 점수가 낮은 사람이 2년 후의 업무성과가 낮았다면, 이 적성검사는 업무성과를 잘 예측해 주는 타당한 검사라고 할 수 있다. 구인타당도란 심리검사가 측정하고자 하는 구인 또는 이론을 제대로 측정하고 있는지를 검증하여 검사의 타당도를 판단하는 방법으로, 앞에서 소개한 여러 가지 타당도를 포함하는 개념이다. 구인타당도에는 검사에서 측정하고자 하는 개념의 이론적 성분을 밝히기 위한 요인분석, 그 개념과 유사한 개념 그리고 구분되는 다른 개념과의 관계를 밝히는 수렴 및 변별타당도 등 매우 다양한 입증 방법이 존재한다. 한 예로, 어떤 수학 적성 검사를 음대생과 공대생에게 실시했을 때 공대생이 평균적으로 더 높은 점수를 얻었다면, 이것은 이 검사의 구인타당도를 입증하는 것이 될 수 있다. 

표준화
표준화란 심리검사의 실시와 채점을 일관성 있게 그리고 통일된 방식으로 할 수 있게 절차를 명세화하는 것을 의미한다. 실시와 채점의 명세화에는 다음과 같은 것들이 포함된다. 예를 들어 각 문항에서 사용하는 질문은 명확하게 정해져 있어야 하며, 수검자가 과제의 내용이나 수행 절차를 잘 이해하지 못하는 경우 검사자가 어느 정도까지 보충 설명을 해줄 것인지 그 지침을 정해두어야 한다. 또 반응시간을 측정해야 하는 검사의 경우 시간을 어떻게 측정할 것인지에 대해서도 지침을 정해두어야 한다. 채점의 경우에도 선다형 문항이 아닌 서술형 문항의 응답 내용에 따라 점수를 부여할 때 명확한 기준과 예시를 제공하여 누가 채점하든 일관성 있는 채점이 가능해야 한다. 검사의 표준화가 잘 되어 있으면 검사를 누가 실시하든 같은 내용, 같은 절차에 따라 실시와 채점을 할 수 있다. 검사 결과의 개인 간 비교를 위해서는 검사의 표준화가 특히 중요하다.심리검사에서 얻은 점수를 제대로 해석하기 위해서는 검사의 표준화와 함께 검사의 규준이 있어야 한다. 예를 들어보자. 고등학교 1 학년생용으로 개발한 한 음악 적성검사에서 어떤 학생이 100점 만점 기준으로 67점에 의미를 붙이기 위해서는 이 검사에서 다른 학생들은 평균적으로 어느 정도의 점수를 받았는지를 아는 것이 도움이 된다. 이 학생이 속한 학급의 학생 30명의 평균이 74점, 표준편차가 6점이고, 1학년 전체 학생 150명의 평균이 62점, 표준편차가 5점이라고 가정해 보자. 그러면 이 학생의 음악 성적은 어떻다고 할 수 있을까? 학급을 기준으로 볼 때 이 학생은 음악 적성이 상대적으로 낮다고 할 수 있고 전체를 기준으로 볼 때는 상대적으로 높다고 할 수 있다. 개인이 얻은 점수에 의미를 붙이기 위해서는 그 점수를 그 개인이 속한 집단의 점수 분포에 비추어 상대적으로 해석할 수 있어야 한다. 평균과 표준편차로 요약되는 이 집단의 점수 분포를 규준이라고 한다. 이 예에서 학급과 학년 중 어떤 것을 기준으로 하는가에 따라 학생의 점수를 다르게 해석할 수 있다. 이 예에서 학생의 점수를 판단할 때 사용할 수 있는 가장 이상적인 집단은 전국의 고등학교 1학년생으로 이루어진 집단이다. 그러나 현실적으로 약 50만명에 이르는 전국의 고1 학생들 모두에게 이 검사를 실시할 수는 없고 또 굳이 그렇게 할 필요도 없다. 이러한 경우 통상적으로 심리학자들은 전집인 50만명을 잘 대표하는 소수의 표본 집단을 대상으로 이 검사를 실시하여 얻은 평균과 표준편차를 사용하여 개인의 점수를 분류한다. 이 소수의 표본집단을 규준집단 또는 표준화 집단이라고 한다. 여기서 관건은 소수의 표본 집단이 전집을 얼마나 잘 대표하는가이다. 표집의 전집 대표성이 좋을수록 점수에 대한 해석이 정확해진다. 심리학자들은 검사 규준을 제작할 때 전집 대표성이 높은 규준 집단을 얻기 위해 고심한다.
심리검사의 해석 즉, 검사의 점수가 갖는 의미를 찾아나가는 과정은 개인 간 비교와 개인 내 비교를 통해 이루어진다. 개인 간 비교란 한 개인의 특정한 속성이 다른 사람들에 비해 상대적으로 어떠한지를 알아보는 것이다. 개인 내 비교란 한 개인이 가지고 있는 특정한 속성이 그 개인의 다른 속성들에 비해 상대적으로 어떠한지를 알아보는 것이다. 개인 내 비교는 수검자가 얻은 여러 점수를 서로 비교하여 강점과 약점을 밝혀나가는 과정이다. 이 비교를 위해서는 속성에 대한 수량화, 특히 표준 점수화가 필요하다. 표준 점수란 단위가 다른 여러 가지 측정치들을 서로 비교하기 위해 통일된 단위의 점수로 변환한 것을 말한다. 예를 들어, 한 수검자의 IQ가 115라는 것은 표준화 집단의 평균적인 능력 100에 비해 표준편차 15점 즉 1 표준편차만큼 우수한 지능을 가졌다는 것으로 해석할 수 있다. 이것은 개인 간 비교에 해당한다. 또한 이 수검자의 언어성 IQ는 130이고, 동작성 IQ는 100이라면 이 사람은 비언어적 능력에 비해 언어적 능력이 월등하게 뛰어나다는 것을 말해준다. 이것은 개인 내 비교에 해당한다.

반응형