1. 개요

데이터-조작은 수집된 데이터의 내용을 의도적으로 왜곡하거나 변형하여 사실과 다른 정보를 생성하는 행위를 의미한다. 이는 정보의 본질적인 가치를 훼손하며, 데이터가 담고 있는 실제 현상과 기록된 수치 사이의 불일치를 야기한다. 이러한 행위는 데이터 무결성을 파괴하여 정보 시스템이 유지해야 할 정확성과 일관성을 근본적으로 무너뜨린다.[7]

데이터의 신뢰성은 통계공공데이터를 활용한 분석 결과의 타당성을 결정짓는 핵심 요소이다.[1] 공공기관이 생성하는 자료는 국민의 소통과 협력을 이끌어내는 공적인 자산으로서 높은 수준의 정확성이 요구된다.[7] 만약 데이터가 조작될 경우, 통계데이터센터와 같은 전문 기관에서 제공하는 마이크로데이터의 분석 결과 역시 왜곡될 수 있으며, 이는 데이터 기반의 과학적 접근을 불가능하게 만든다.[1]

데이터 조작은 사회적 의사결정 과정에 치명적인 영향을 미친다. 정부지방자치단체열린데이터광장 등을 통해 제공하는 API 서비스나 생활인구 데이터가 조작될 경우, 정책 수립의 기초가 되는 근거가 잘못 설정된다.[3] 잘못된 데이터에 기반한 정책은 자원의 비효율적 배분을 초래하며, 전자정부 시스템에 대한 국민의 신뢰를 저하시키는 결과를 낳는다.[2]

변동성이 큰 사회적 환경에서 데이터의 조작은 더욱 심각한 위험을 초래할 수 있다. 통계조사 결과가 왜곡되면 경제적 예측이나 사회적 현상 분석에 오류가 발생하여 국가적 차원의 손실로 이어진다.[2] 특히 데이터 서비스의 현행화 과정이나 시스템 운영 중에 발생하는 데이터의 변질은 정보의 유효성을 상실하게 만들며, 향후 데이터 중심 사회에서 발생할 수 있는 다양한 정보 보안 및 윤리적 문제를 예고한다.[3]

2. 데이터 조작의 유형과 방법

데이터 조작은 수집된 통계 자료를 임의로 수정하거나 변형하는 행위를 포함한다. 이는 수치통계데이터를 의도적으로 변경하여 실제 현상과 기록된 값 사이에 괴리를 만드는 방식이다. 조작자는 특정 목적을 달성하기 위해 데이터 분석 과정에서 결과값을 왜곡하거나, 자신에게 유리한 방향으로 데이터셋을 재구성할 수 있다.

데이터의 일부를 의도적으로 누락하거나 특정 부분만을 선택적으로 보고하는 방식도 주요한 조작 유형에 해당한다. 이는 전체적인 맥락을 왜곡하여 정보의 객관성을 상실하게 만든다. 예를 들어, 공공데이터 플랫폼에서 제공하는 인구, 교통, 안전 등 다양한 분야의 자료를 다룰 때, 특정 조건에 부합하는 데이터만을 추출하여 전체를 대표하는 것처럼 제시하는 행위가 이에 속한다. 이러한 선택적 보고는 데이터 기반의 정책 수립이나 의사결정 과정을 방해하는 요소가 된다.[3]

알고리즘을 활용하여 왜곡된 결과를 생성하는 고도화된 방법도 존재한다. 인공지능이나 소프트웨어를 이용해 데이터의 패턴을 인위적으로 조작함으로써, 실제로는 존재하지 않는 상관관계를 만들어내거나 기존의 경향성을 완전히 뒤바꿀 수 있다. 이는 데이터 서비스의 신뢰성을 근본적으로 저해하며, 디지털 환경에서 유통되는 정보의 무결성을 파괴하는 결과를 초래한다.[1]

3. 통계 및 공공데이터에서의 왜곡 사례

국가 통계 자료는 정책 수립과 사회적 의사결정의 기초가 되므로, 데이터의 오류나 조작 가능성은 사회 전반에 큰 영향을 미친다. 대한민국 정부는 통계조사를 통해 다양한 사회 지표를 산출하며, 이를 관리하기 위해 통계데이터센터와 같은 전문 기관을 운영한다.[2] 만약 인구 추계나 주요 사회 지표가 실제 현상과 다르게 왜곡될 경우, 국가의 장기적인 자원 배분사회 복지 계획에 심각한 차질을 초래할 위험이 있다.

공공데이터 제공 과정에서는 수집된 정보의 현행화 문제가 왜곡의 원인이 될 수 있다. 공공데이터포털교육, 국토관리, 재난안전, 교통물류 등 다양한 분야의 국가중점데이터를 제공하며, 교통사고 정보와 같은 구체적인 자료도 포함한다.[5] 그러나 데이터가 최신 상태로 유지되지 않거나 제공 기관의 관리 미흡으로 인해 정보가 실제 상황과 일치하지 않을 경우, 이용자는 잘못된 통계적 판단을 내릴 수 있다.

통계데이터센터마이크로데이터 서비스와 데이터 분석 소프트웨어를 지원하며 데이터의 활용성을 높이는 역할을 수행한다.[1] 하지만 데이터가 생성되고 유통되는 과정에서 데이터 무결성이 훼손된다면, 통계 빅데이터를 활용한 정밀한 분석 결과조차 신뢰할 수 없게 된다. 특히 재정 금융이나 산업 고용과 같이 경제적 이해관계가 밀접한 분야에서의 데이터 왜곡은 경제 지표의 불확실성을 증폭시키는 결과를 낳는다.

4. 데이터 플랫폼과 관리 체계

서울특별시 디지털도시국 데이터전략과공공데이터를 체계적으로 관리하기 위해 서울 데이터 허브를 운영한다.[4] 이 플랫폼은 시민연구자, 공무원이 서울시의 행정 데이터를 무료로 검색하고 시각화하거나 다운로드할 수 있는 환경을 제공한다. 제공되는 데이터는 인구, 교통, 안전, 복지, 교육, 관광, 보건, 경제, 일반행정, 도시관리, 건설, 환경 등 12개 분야에 걸쳐 300여 종에 달한다.[4]

공공데이터 포털은 다양한 데이터 분류 체계를 통해 정보 접근성을 높인다. 테마별 검색, 카테고리별 링크, 국가중점데이터제공기관유형에 따른 분류 방식을 활용하여 사용자가 원하는 자료를 효율적으로 찾을 수 있도록 지원한다.[5] 주요 테마로는 국토관리, 공공행정, 재정금융, 산업고용, 사회복지, 식품건강, 보건의료, 재난안전, 교통물류, 환경기상, 과학기술, 농축수산, 통일외교 안보, 법률 등이 포함된다.[5]

데이터의 정확성을 유지하기 위해 데이터 서비스현행화개편 프로세스가 수행된다. 열린데이터광장에서는 서비스의 품질을 관리하기 위해 특정 데이터 서비스의 현행화를 중지하거나 시스템을 개편하는 과정을 거친다.[3] 예를 들어 지하철 실시간 도착정보 API 서비스의 일시 중단이나 서울시 생활인구 및 생활이동(집계구) 데이터의 서비스 현행화 중지 및 개편 사례가 이에 해당한다.[3] 이러한 관리 체계는 데이터의 최신성을 확보하고 플랫폼의 안정적인 운영을 목적으로 한다.

5. 데이터 무결성 확보를 위한 기술적 조치

통계데이터센터는 데이터의 보안과 분석 환경의 안정성을 유지하기 위해 가상환경(VDI)을 운영한다. 해당 시스템은 운영체제(OS) 업그레이드 등의 작업을 통해 분석 환경을 최신 상태로 관리하며, 데이터 분석 소프트웨어의 현황을 주기적으로 점검하여 분석 도구의 신뢰성을 확보한다.[1] 또한, 파일의 업로드와 다운로드 과정에서 발생할 수 있는 보안 문제를 방지하기 위해 특정 보안 솔루션인 이노릭스를 설치하고 설정하는 등의 기술적 조치를 시행한다.

공공데이터 서비스의 정확도를 높이기 위해 데이터의 실시간성과 현행화 상태를 관리하는 과정이 필수적이다. 서울 데이터 허브와 같은 플랫폼에서는 지하철 실시간 도착정보 API 서비스와 같이 실시간성이 요구되는 데이터의 중단이나 개편 사항을 공지하며 서비스의 연속성을 관리한다.[3] 특히 생활인구생활이동 데이터와 같은 주요 지표의 경우, 데이터 서비스의 현행화 중지나 개편 안내를 통해 데이터의 최신성을 유지하려는 노력이 이루어진다.

데이터의 무결성을 보장하기 위한 체계는 관련 규정에 근거하여 운영된다. 통계빅데이터센터의 운영 및 이용에 관한 규정은 센터 내에서 다뤄지는 데이터의 관리 기준을 제시한다.[1] 이러한 기술적, 제도적 장치들은 데이터 기반의 정책 수립 과정에서 발생할 수 있는 오류를 최소화하고, 제공되는 정보의 정확도를 유지하는 데 목적이 있다.

6. 데이터 조작 방지 및 분쟁 조정

공공데이터의 신뢰성을 유지하기 위해 공공기관은 데이터 오류를 신고하고 이를 바로잡는 정정 절차를 운영한다. 사용자는 제공되는 자료에서 오류를 발견할 경우 이를 신고할 수 있으며, 기관은 해당 내용을 검토하여 데이터의 정확성을 확보해야 한다. 이러한 과정은 데이터 투명성을 높이기 위한 필수적인 제도적 장치로 기능한다.

공공데이터 제공 과정에서 발생하는 이해관계자 간의 갈등을 해결하기 위해 공공데이터 제공신청 분쟁조정 제도가 시행되고 있다.[7] 이 제도는 공공데이터의 제공 신청과 관련하여 발생하는 다양한 분쟁을 공정하게 조정하는 것을 목적으로 한다. 이를 통해 데이터 이용자와 공급자 사이의 권리 관계를 명확히 하고, 원활한 데이터 활용 환경을 조성한다.

통계데이터센터와 같은 전문 기관은 데이터의 품질을 관리하기 위해 내부적인 운영 규정을 수립하여 시행한다.[1] 예를 들어 통계빅데이터센터의 경우, 운영 및 이용에 관한 구체적인 규정을 마련하여 데이터 관리의 체계성을 높이고 있다. 또한 마이크로데이터 서비스와 같은 민감한 정보 취급 시에도 정해진 절차에 따라 데이터의 무결성을 유지하며 관리한다.

7. 같이 보기

[1] Ddata.kostat.go.kr(새 탭에서 열림)

[2] Mmods.go.kr(새 탭에서 열림)

[3] Ddata.seoul.go.kr(새 탭에서 열림)

[4] Ddata.seoul.go.kr(새 탭에서 열림)

[5] Wwww.data.go.kr(새 탭에서 열림)

[7] Wwww.data.go.kr(새 탭에서 열림)

8. 관련 문서