내적타당도는 연구 설계 안에서 인과 추론이 실제 현상을 얼마나 정확하게 반영하는지를 설명하는 핵심 개념이다. 연구 결과가 처치 효과를 반영하는지, 아니면 다른 요인의 개입이 섞인 것인지를 가늠할 때 중심 기준이 된다.[1][2]
1. 개요
2. 핵심 의미
3. 내적 타당도를 위협하는 요인
내적타당도를 흔드는 대표적 요인으로는 역사 효과, 성숙 효과, 검사 효과, 측정 도구 변화, 평균으로의 회귀, 선발 편향, 탈락, 그리고 여러 위협의 상호작용이 있다.[1][3]
- 역사 효과는 연구 기간 중 발생한 외부 사건이 결과에 개입하는 상황이다.
- 성숙 효과는 참여자나 대상이 시간 경과에 따라 자연스럽게 변하는 현상이다.
- 검사 효과는 사전 검사가 이후 응답이나 행동에 영향을 주는 문제다.
- 측정 도구 변화는 평가 기준이나 측정 방식이 달라져 결과 비교가 흔들리는 경우다.
- 평균으로의 회귀는 극단값이 다음 측정에서 자연스럽게 중간으로 돌아오는 현상이다.
- 선발 편향은 비교 집단이 처음부터 같지 않아 처치 효과가 왜곡되는 문제다.
- 탈락은 중도 이탈이 한쪽 집단에 더 많이 발생해 해석이 비뚤어지는 상황이다.
이런 위협은 무작위-배정만으로 자동 해소되지 않는다. 그래서 연구자는 설계 단계에서 무엇이 실제 위협이 될 수 있는지 따로 점검하고, 분석 단계에서 남은 편향 가능성도 함께 살펴야 한다.[1][3]
4. 높이는 방법
내적타당도를 높이려면 연구 조건을 표준화하고, 무작위-배정과 비교 집단을 활용하며, 사전·사후 측정의 기준을 일관되게 유지해야 한다. 필요하면 실험-설계를 더 엄격하게 조정해 외부 요인의 개입을 줄인다.[1][2]
특히 무작위-대조-시험은 이런 통제를 체계적으로 구현하는 대표적 틀이다. 실험 조건이 명확할수록 결과를 처치 효과로 해석하기 쉬워지고, 실험과 연구-방법론의 논리도 더 분명해진다.[1][3]
같은 데이터라도 어떤 편향을 어떻게 막았는지에 따라 해석이 달라진다. 따라서 방법론 문헌은 단순히 결과를 보고하는 것보다, 연구 설계가 어떤 위협을 줄였는지를 먼저 설명하는 쪽에 무게를 둔다.[1][3]