데이터 품질인증은 데이터의 중복·오류·검증 등 데이터 품질 영향요소 전반을 심사하는 제도로, 심사 결과에 따라 플래티넘·골드·실버 등급으로 구분되며, 최고 등급인 플래티넘은 데이터 정합률이 99.977% 이상인 경우 획득할 수 있다.
보건복지부 '분산형 연구 네트워크 구축‧운영' 사업의 일환으로 구축된 심사평가원의 HIRA CDM은, 건강보험 청구데이터를 OMOP-CDM 형태로 변환‧구축한 데이터로, 총 15개 테이블과 222개 칼럼으로 구성된다.
심사평가원은 이번 심사에서 2010~2020년 데이터(약 101억 개의 청구건)를 대상으로 정합성을 심사한 결과, 99.99%라는 높은 정합률을 보였다고 설명했다.
김수아 빅데이터뉴스 기자 news@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>