수량은 셀 수 있는 사물을 세어서 나타낸 값을 의미하며, 수학적 관점에서 수치로 표현되는 데이터를 지칭한다.[3] 이는 대상의 크기, 빈도, 혹은 정도를 숫자로 나타낸 것으로, '얼마나 많은가' 또는 '얼마나 자주 발생하는가'와 같은 수치형 변수의 특성을 가진다.[1]

1. 개요

수량으로 표현되는 데이터는 측정하거나 계수할 수 있는 모든 값을 포함하며, 범주형 데이터 내에서도 수치적 코드로 표현될 수 있다.[2] 관측되는 데이터가 수치적 변수에 관한 것이라면 이는 항상 정량적 데이터의 범주에 포함된다.[1] 이러한 데이터의 특성은 연구자가 어떤 통계적 방법론을 선택할지를 결정하는 중요한 기준이 된다.

수량의 개념은 인류가 생활상의 필요에 따라 이라는 기교적인 조작을 통해 수를 지각하면서 시작되었다.[3] 초기 인류는 가축이나 군대의 수를 기록하기 위해 나무에 금을 긋거나 돌멩이를 쌓는 방식을 사용하였으며, 이는 1대1 대응이라는 기초적인 수 조작 방식에 해당한다.[3] 이러한 과정을 통해 추상적인 수 개념이 형성되었고, 이는 현대의 복잡한 데이터 과학적 분석을 가능하게 하는 근간이 되었다.

수량은 그 수학적 성질에 따라 크게 이산 데이터연속 데이터로 분류된다.[2] 이산 데이터는 학생 수와 같이 정수 단위로 셀 수 있는 현상을 다루는 반면, 연속 데이터는 키와 같이 특정 범위 내의 값을 가지는 측정 가능한 현상을 의미한다.[2] 이러한 분류는 데이터 시각화 방식이나 분석 결과의 해석, 그리고 실무적인 비즈니스 분석의 적용 방식에 직접적인 영향을 미친다.[4]

2. 수량의 수학적 정의와 발생

수학적 관점에서 수량은 셀 수 있는 사물을 세어서 나타낸 값을 의미한다.[3] 이는 수치로 표현되는 데이터의 일종으로, 대상의 크기나 빈도, 혹은 정도를 나타내는 수량적 데이터에 해당한다.[2] 이러한 데이터는 변수의 성격에 따라 분류되는데, 정수 형태로 셀 수 있는 이산 데이터와 특정 범위 내의 값을 가지는 연속 데이터로 구분된다.[4]

인류가 수를 어떻게 지각하게 되었는지에 대한 정확한 역사는 문명 이전의 시기에 가려져 있어 명확히 알 수 없다.[3] 다만 인류가 생활 속에서 필요한 이라는 기교적 조작을 수행하며 수를 인식하기 시작했다는 점은 분명하다.[3] 이러한 셈의 과정은 우주를 수로 표현할 수 있게 만든 핵심적인 동력이 되었으며, 추상적인 수개념을 형성하는 기초가 되었다.[3]

수학적 개념을 형성하는 방법에는 셈을 거치는 방식 외에도 집합의 원소를 하나씩 맞추는 1대1 대응 방식이 존재한다.[3] 초기 인류의 수 기술은 주로 이러한 1대1 대응에 국한되어 나타났다.[3] 예를 들어 가축이나 군대의 규모를 기록하기 위해 나무에 칼로 금을 긋거나 돌멩이를 쌓아두는 방식이 사용되었다.[3]

수량적 데이터는 '얼마나 많은가', '얼마나 자주 발생하는가'와 같은 수치적 변수에 관한 정보를 담고 있다.[1] 이는 대상의 유형을 나타내는 질적 데이터와 구별되는 특징을 가진다.[1] 현대의 데이터 과학 분야에서는 이러한 수량적 변수를 이산형과 연속형으로 분류하여 통계적 방법을 선택하고 시각화를 수행하는 근거로 활용한다.[4]

3. 수량 데이터의 분류: 이산 변수와 연속 변수

수량 데이터는 그 성격에 따라 크게 이산 변수연속 변수로 분류된다. 이산 변수는 개별적인 값을 하나씩 셀 수 있는 형태를 의미하며, 주로 정수 단위의 계수를 통해 표현된다. 예를 들어 특정 학급에 재학 중인 학생 수와 같이 끊어지는 값을 가지는 것이 특징이다.[2] 이러한 데이터는 대상의 개수를 명확히 파악할 수 있는 계수 데이터의 성격을 띠며, 통계학적 분석에서 빈도 분포나 확률 모형의 기초 단위로 활용된다.

반면 연속 변수는 특정 범위 내에서 어떤 값이라도 가질 수 있는 측정 가능한 형태를 의미한다. 이는 나 몸무게와 같이 정해진 구간 내에서 무한히 세분화될 수 있는 측정 데이터를 포함한다.[1] 연속 변수는 단순히 숫자로 나타나는 것을 넘어, 측정 도구의 정밀도에 따라 소수점 이하의 값을 가질 수 있는 실수 체계의 특성을 보인다. 따라서 연속적인 흐름을 가진 현상을 기술할 때 주로 사용된다.

이 두 변수의 수학적 성질과 분석적 함의의 차이는 데이터 과학통계학적 방법론을 선택하는 데 결정적인 영향을 미친다. 이산 변수는 개별적인 사건의 빈도를 다루는 데 적합하며, 연속 변수는 값의 분포와 변화량을 분석하는 데 중점을 둔다. 이러한 분류 방식은 데이터 시각화 기법의 선정이나 통계적 추론을 위한 모델 구축 과정에서 결과의 해석을 결정짓는 핵심적인 기준이 된다.[4]

4. 측정 척도와 데이터 유형

데이터는 그 성격에 따라 정량적 데이터와 정성적 데이터로 구분된다. 정량적 데이터는 수치로 표현되는 수치형 변수를 다루며, 대상의 개수나 크기, 빈도 등을 나타낸다.[1] 이는 '얼마나 많은가' 또는 '얼마나 자주 발생하는가'와 같은 질문에 대한 답을 제공한다. 반면 정성적 데이터는 대상의 '유형'을 측정하는 것으로, 이름이나 기호, 또는 숫자 코드를 통해 범주형 변수를 나타낸다.[2]

정량적 데이터는 세부적으로 이산 데이터연속 데이터로 분류할 수 있다. 이산 데이터는 학급의 학생 수와 같이 정수 단위로 셀 수 있는 값을 의미한다. 이와 달리 연속 데이터는 키와 같이 특정 범위 내에서 어떤 값이라도 가질 수 있는 측정 가능한 형태를 의미한다. 또한 범주형 데이터는 국가와 같이 특정 집단이나 그룹을 나타내는 속성을 포함한다.[2]

데이터 과학에서 이러한 데이터 유형을 정확히 이해하는 것은 필수적이다. 수집된 데이터가 수치형 변수에 관한 것이라면 이는 항상 정량적 데이터에 해당한다.[1] 데이터의 성격에 따라 적절한 측정 척도를 적용해야 하며, 이는 통계적 분석의 방향을 결정하는 기초가 된다. 따라서 데이터의 유형을 분류하는 작업은 대상의 속성을 정량적으로 파악하고 분석 모델을 설계하는 핵심적인 과정이다.

5. 양적 연구와 질적 연구의 비교

양적 연구는 수치로 표현 가능한 수량을 기반으로 하는 통계적 접근 방식을 취한다. 이 방식에서 다루는 양적 데이터는 수치 변수에 관한 정보로, 대상이 얼마나 많은지, 어느 정도의 크기를 가지는지, 혹은 얼마나 자주 발생하는지를 나타낸다.[1] 이러한 데이터는 측정하거나 계수할 수 있는 모든 값을 포함하며, 숫자로 표현된다.[2] 구체적으로는 정수 형태로 나타나는 이산 데이터와 특정 범위 내의 값을 가지는 연속 데이터로 분류될 수 있다.[2]

반면 질적 연구는 대상의 특성이나 유형을 파악하기 위해 질적 데이터를 활용한다. 질적 데이터는 범주형 변수에 관한 정보를 담고 있으며, 대상의 종류가 무엇인지를 설명하는 데 목적이 있다.[1] 이는 이름, 기호, 또는 특정 분류를 위한 숫자 코드의 형태로 나타날 수 있다.[1] 양적 데이터가 '얼마나 많은가'라는 질문에 답한다면, 질적 데이터는 '어떤 유형인가'라는 질문에 대한 정보를 제공하며 단어나 관찰 등을 통해 비수치적인 성격을 드러낸다.

두 연구 방식의 핵심적인 차이는 데이터가 나타내는 성격에 있다. 수치 변수에 대해 수집된 데이터는 항상 양적 데이터의 성격을 띠게 된다.[1] 양적 연구가 객관적인 수치를 통해 현상을 일반화하고 법칙을 찾아내는 데 집중한다면, 질적 연구는 대상이 가진 고유한 속성과 질적 특성을 기술하는 데 중점을 둔다. 따라서 연구의 목적에 따라 수량을 직접적으로 다루는 방식과 대상의 유형을 분류하는 방식이 구분되어 적용된다.

6. 사회과학에서의 수량 측정

사회과학 분야에서 수량적 연구는 수치로 표현 가능한 변수를 통해 현상을 파악하는 핵심적인 방법론이다. 연구자는 개념화 과정을 거쳐 추상적인 사회적 현상을 측정 가능한 형태로 변환하며, 이를 위해 조작적 정의를 활용한다.[5] 이러한 과정은 데이터를 수집하고 분석하여 사회적 현상의 규모나 빈도, 강도를 객관적으로 파악하는 데 목적이 있다.

수량적 데이터는 대상의 수량이나 값을 나타내는 숫자로 표현된다.[1] 이는 무엇이 얼마나 많은지, 혹은 얼마나 자주 발생하는지와 같은 수치적 변수에 대한 정보를 제공한다.[1] 구체적으로는 개수를 셀 수 있는 이산 데이터와 특정 범위 내의 값을 가지는 연속 데이터를 모두 포함하며, 국가와 같이 집단을 구분하는 범주형 데이터의 형태를 띠기도 한다.[2]

과학적 조사 과정에서 수량 측정은 엄밀한 기준을 요구하며, 연구자는 측정의 타당성을 확보해야 한다. 특히 사회복지와 같은 실천 학문에서는 빈곤, 정신 건강, 인종 차별 등 민감한 사회적 문제를 다루기 때문에 윤리적 고려사항이 필수적으로 수반된다.[5] 연구 과정에서 발생할 수 있는 인종주의나 성차별과 같은 편향을 경계하며, 측정 도구가 실제 연구 대상의 상태를 정확히 반영하는지 검토하는 것이 중요하다.[5]

7. 관련 문서

8. 인용 및 각주

[1] Quantitative and qualitative data, Wwww.abs.gov.au(새 탭에서 열림)

[2] Qualitative vs Quantitative Research: What's the Difference?, Wwww.simplypsychology.org(새 탭에서 열림)

[3] 수, Eencykorea.aks.ac.kr(새 탭에서 열림)

[4] Chapter 2.3: Discrete vs. Continuous Variables, Eexpress.excelsior.edu(새 탭에서 열림)

[5] Measurement in quantitative research – Scientific Inquiry in Social Work (2nd Edition), Ppressbooks.library.vcu.edu(새 탭에서 열림)