준거지향평가는 학습자가 미리 정해진 기준에 도달했는지를 평가하는 교육평가 방식이다.[2] 학습자 개인의 절대적 성취 수준을 확인하는 데 초점을 둔다.

1. 개요

교육평가는 학습자의 학습 성과와 행동 발달 정도를 사전에 설정된 교육목표에 비추어 측정하고 판단하는 체계적인 과정이다. 이러한 평가는 평가의 시기에 따라 진단평가, 형성평가, 총괄평가로 구분되며, 평가의 기준을 무엇으로 삼느냐에 따라 규준지향평가와 준거지향평가로 분류된다.[2] 준거지향평가는 학습자가 타인과의 상대적 비교가 아닌, 미리 정해진 특정 기준에 도달했는지를 확인하는 평가 방식이다.[3]

규준지향평가는 본래 학생들을 서열화하여 선발하기 위한 목적으로 설계된 평가 체계이다.[1] 반면 준거지향평가는 개인이 특정 목표를 어느 정도 성취했는지를 측정하는 데 초점을 맞춘다.[3] 1963년 로버트 글레이저가 처음 도입한 준거지향 측정 개념은 교육 현장에서 학습자의 성취 수준을 명확히 파악하기 위한 도구로 활용되어 왔다.[7] 이는 학습자가 무엇을 할 수 있고 무엇을 할 수 없는지를 구체적으로 제시한다는 점에서 규준지향평가와 차별화된다.[3]

준거지향평가는 교육과정의 운영을 개선하고 교육의 질적 향상을 도모하는 데 중요한 역할을 수행한다.[2] 예를 들어 세 자리 수의 덧셈 능력을 평가할 때 20개의 문항을 활용하여 학생의 숙달 정도를 판단하는 방식이 이에 해당한다.[3] 이러한 평가는 학습자의 실제 역량을 파악하는 데 유용하며, 교육 현장에서 교수 활동의 효과를 직접적으로 확인하는 근거가 된다.[1] 따라서 교육목표의 달성도를 정밀하게 측정하는 것은 교육의 질적 발전을 위한 핵심 요소로 평가받는다.[2]

다만 준거지향평가가 본래의 잠재력을 충분히 발휘하기 위해서는 평가 설계와 운영 과정에서의 혼란을 최소화해야 한다는 지적이 존재한다.[7] 평가 목적의 설정부터 도구 제작, 결과 해석 및 활용에 이르는 일련의 과정이 체계적으로 이루어질 때 교육적 효과를 극대화할 수 있다.[2] 앞으로도 다양한 평가 방법의 개발과 개선을 통해 학습자의 성취를 정확히 진단하고 교육의 질을 높이는 노력이 지속되어야 한다.[2]

2. 개념 및 기본 원리

준거지향평가는 개별 학습자가 특정 교육목표를 어느 정도 수준으로 달성하였는지를 확인하는 데 주된 목적을 둔다. 이는 타인의 성취도와 비교하여 상대적인 위치를 결정하는 방식이 아니라, 사전에 설정된 절대적인 기준에 비추어 학습자의 성취 수준을 판단하는 평가 체계이다.[3] 따라서 모든 학습자가 정해진 기준을 충족한다면 전원이 합격할 수 있는 구조를 가지며, 이는 운전면허 시험과 같이 특정 지식이나 기술의 숙달 여부를 확인해야 하는 상황에서 주로 활용된다.[4]

이 평가 방식은 학습자가 무엇을 알고 무엇을 모르는지에 대한 구체적인 정보를 제공하는 데 강점이 있다. 예를 들어 세 자리 수의 덧셈 능력을 평가할 때 20개의 문항을 구성하여 학습자가 해당 연산 원리를 완벽히 이해했는지 정밀하게 측정할 수 있다.[3] 이러한 특성 덕분에 교육과정 운영 과정에서 학습자의 발달 상태를 진단하고, 부족한 부분을 보완하여 교육의 질적 향상을 도모하는 데 효과적인 도구로 평가받는다.[2]

결과적으로 준거지향평가는 학습자가 습득해야 할 특정 지식기술의 영역을 명확히 정의하는 것에서 출발한다. 평가 결과는 교사에게 학습자의 현재 수행 능력을 정확히 전달하며, 이는 개별 학습자의 학습 결손을 파악하고 맞춤형 지도를 제공하는 기초 자료가 된다.[3] 결과적으로 이러한 평가는 의학 교육과 같이 전문적인 역량 평가가 필수적인 분야에서 학생의 숙달 정도를 판단하는 데 중요한 역할을 수행한다.[1]

3. 규준지향평가와의 비교

규준지향평가는 학습자의 성취도를 타인과 비교하여 상대적인 위치를 결정하는 데 초점을 맞춘다.[1] 반면 준거지향평가는 개인이 사전에 설정된 특정 기준에 도달했는지 여부를 확인하는 것을 목적으로 한다. 따라서 준거지향평가는 타인과의 비교보다는 학습자가 무엇을 할 수 있고 무엇을 할 수 없는지에 대한 구체적인 정보를 제공하는 데 유용하다.[3]

평가 도구의 설계 측면에서도 두 방식은 뚜렷한 차이를 보인다. 규준지향평가는 집단 내에서 변별력을 확보하는 것이 중요하므로 문항의 난이도나 분포가 상대적 서열을 가리는 데 최적화되어 있다. 이와 달리 준거지향평가는 특정 교육목표의 달성도를 측정하기 위해 설계된다.

결과 해석 방식에 있어서도 규준지향평가는 학습자의 상대적 순위를 산출하는 데 그치지만, 준거지향평가는 학습자가 도달해야 할 절대적인 기준을 제시한다. 이러한 차이로 인해 규준지향평가는 교수 학습 과정의 변화에 둔감할 수 있다는 한계가 지적되기도 한다.[1] 교육 현장에서는 교육과정의 운영을 개선하고 질적 향상을 도모하기 위해 이러한 평가 방법들의 특성을 이해하고 적절히 활용하는 과정이 요구된다.[2]

4. 교육 현장에서의 활용

준거지향평가는 개별 학습자의 학습행동 발달 정도를 사전에 수립된 교육목표에 비추어 측정하고 판단하는 핵심적인 도구로 활용된다. 교사는 이 평가를 통해 학생이 특정 과제를 수행할 수 있는지 여부를 명확히 파악할 수 있다. 예를 들어 세 자리 수의 덧셈 능력을 평가할 때 20개의 문항을 구성하여 학습자가 도달해야 할 기준을 설정하고 이를 충족하는지 확인하는 방식이 대표적이다.[3] 이러한 과정은 학생이 무엇을 할 수 있고 무엇을 할 수 없는지에 대한 구체적인 정보를 제공하여 개별화된 피드백을 가능하게 한다.

평가 시기에 따른 분류를 살펴보면, 준거지향평가는 진단평가, 형성평가, 총괄평가의 모든 단계에서 유용하게 쓰인다. 교육 과정의 시작 단계에서는 학습자의 선수 지식을 점검하는 진단평가로 활용되며, 수업이 진행되는 동안에는 학습의 진전 상황을 확인하는 형성평가의 역할을 수행한다. 학기나 단원이 종료된 시점에서는 총괄평가를 통해 교육목표의 최종 달성도를 측정한다.[2] 이처럼 시기별로 적절한 평가를 시행함으로써 교사는 교육과정 운영의 문제점을 발견하고 이를 개선할 수 있다.

궁극적으로 준거지향평가는 교육의 질적 향상을 촉진하는 기능을 수행한다. 단순히 학생의 서열을 매기는 선발 목적의 평가와 달리, 학습자의 성취 수준을 정확히 진단하여 교육활동의 계획과 실천을 보완하는 데 중점을 둔다.[1] 교육 현장에서는 이러한 평가 결과를 바탕으로 교수법을 수정하거나 보충 학습을 제공함으로써 교육의 질적 발전을 도모한다. 따라서 다양한 평가 도구의 개발과 체계적인 결과 해석은 성공적인 교육과정 운영을 위한 필수적인 요소로 평가받는다.[2]

5. 평가 방법의 한계와 비판

준거지향평가는 학습자의 성취 수준을 절대적인 기준에 비추어 파악한다는 이론적 장점에도 불구하고, 실제 교육 현장에서 이를 구현하는 과정에서는 여러 난관이 존재한다. 특히 평가의 목적을 달성하기 위한 구체적인 교육평가 도구를 제작하고, 설정된 기준을 타당하게 운용하는 과정에서 측정상의 혼란이 빈번하게 발생한다. 이러한 기술적 어려움은 평가 결과의 신뢰성을 저해하는 요인으로 작용하며, 교육 목표와 실제 평가 결과 사이의 괴리를 심화시키기도 한다.[2]

지난 반세기 동안 학계에서는 이러한 평가 방법론에 대한 비판적 논의가 지속되어 왔다. 특히 의학 교육과 같은 전문 분야에서는 규준지향평가가 본래 학생들의 서열을 매겨 선발하기 위한 목적으로 설계되었다는 점을 지적하며, 이를 역량 평가에 도입할 때 발생하는 한계를 비판해 왔다.[1] 준거지향평가 역시 학습자가 무엇을 할 수 있는지에 대한 명확한 정보를 제공해야 한다는 본연의 취지와 달리, 실제 측정 과정에서 교수 학습 활동의 변화에 민감하게 반응하지 못한다는 지적이 제기된다.[3]

결국 교육의 질적 향상을 도모하기 위해서는 단순히 평가 방식을 선택하는 것을 넘어, 평가 도구의 선정부터 결과 해석에 이르는 전 과정에 대한 정교한 재검토가 요구된다. 교육 목표의 실현 여부를 판단하는 과정에서 발생하는 측정 오차를 줄이고, 학습자의 발달 정도를 보다 정확하게 반영할 수 있는 새로운 평가 체계의 개발이 필수적이다. 이는 교육 과정의 운영을 개선하고 궁극적으로 교육의 효과성을 높이는 데 핵심적인 과제로 남아 있다.[2]

6. 평가 도구 제작 및 설계

준거지향평가의 체계적인 설계를 위해서는 우선 명확한 교육목표를 설정하고 평가하고자 하는 구체적인 상태를 선정하는 과정이 선행되어야 한다.[2] 이러한 준비 단계는 학습자의 학습 및 행동 발달 정도를 객관적으로 측정하기 위한 기초가 된다. 평가 목적이 구체화되면 이를 달성하기 위한 적절한 평가도구를 제작하는 과정으로 진입한다. 이때 도구는 학습자가 특정 과제를 수행할 수 있는지 여부를 판별할 수 있도록 정교하게 구성되어야 한다.[3]

평가 도구 제작 과정에서는 설정된 준거에 부합하는 문항을 개발하는 것이 핵심이다. 예를 들어 수학적 연산 능력을 평가할 경우, 학습자가 도달해야 할 수준을 반영한 다수의 문항을 배치하여 성취도를 측정한다.[3] 이러한 도구는 교육과정의 계획과 실천 과정에서 목표가 올바르게 설정되었는지 확인하는 기능을 수행한다.[2] 또한 평가의 실시 및 결과 처리는 사전에 정의된 기준에 따라 엄격하게 이루어지며, 이는 교육의 질적 향상을 도모하는 중요한 절차로 기능한다.

평가 결과의 해석과 활용은 단순히 점수를 산출하는 데 그치지 않고, 학습자의 실제적인 능력과 부족한 부분을 파악하는 데 중점을 둔다.[3] 교사는 도출된 데이터를 바탕으로 교육 활동의 계획과 과정을 개선하며, 이는 결과적으로 교육평가의 본질적인 목적인 교육의 질적 발전을 촉진한다.[2] 이러한 일련의 과정은 진단평가, 형성평가, 총괄평가 등 다양한 평가 시기에 맞추어 유연하게 적용될 수 있다. 지속적인 평가 방법의 개발은 교육 현장의 효율성을 높이고 학습자의 성취를 극대화하는 데 기여한다.[2]

7. 관련 문서

8. 인용 및 각주

[1] What is ... normative versus criterion-referenced assessment, PubMed, Ppubmed.ncbi.nlm.nih.gov(새 탭에서 열림)

[2] 교육평가, 한국민족문화대백과사전, Eencykorea.aks.ac.kr(새 탭에서 열림)

[3] Criterion-Referenced Evaluation, Springer, Llink.springer.com(새 탭에서 열림)

[4] Criterion- and Standards- Referenced Tests, FairTest, Ffairtest.org(새 탭에서 열림)

[7] Criterion-Referenced Measurement: Half a Century Wasted?, ASCD, Wwww.ascd.org(새 탭에서 열림)