사진출처=게티이미지뱅크

[일간투데이 한지연 기자] 과학기술정보통신부는 인공지능(AI) 데이터 표준안을 한국정보통신기술협회(TTA) 단체표준으로 만드는 방안을 단체표준화기구(TTA PG 1005)에 공식제안하기로 했다고 5일 밝혔다.

이번 표준안에는 AI 데이터 품질 개념과 범위, 세부 요구사항 등이 담겼다.

AI 데이터 품질은 '인공지능 기술에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준'으로 정의했다.

표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에 적용할 수 있는 범용표준 형태로 개발됐다.

데이터 품질을 확보하고 상호호환성을 높일 수 있도록 ▲ 원시데이터 수집단계 다양성, 사실성 등 품질 요구사항과 기술 적합성 요구사항 ▲ 정제단계 데이터 중복방지 및 비식별화 조치 요구사항 ▲ 라벨링 규격 요구사항 ▲ 유효성 등 검수 요구사항 등 표준 절차와 품질 요구사항도 담겼다.

이번 표준안은 작년의 '인공지능 학습용 데이터 구축 및 품질관리 공통기준'을 보완해 개발했다.

과기정통부는 이 표준안을 10대 분야 150종 데이터를 구축하는 데이터 댐 사업에 적용하고 있다.

향후 TTA 단체 표준화 기구 내 산·학·연 전문가 의견수렴을 거쳐 단체 표준화를 추진하고, 국립전파연구원을 통해 '인공지능 국제 표준화회의(ISO/IEC JTC1/SC42)'에 제안할 계획이다.

한편 과기정통부는 AI 개발자, 공공기관 관계자 등이 데이터 품질을 체계적으로 관리할 수 있도록 올 연말까지 '인공지능 데이터 품질관리 가이드'를 개발 배포할 예정이다.

저작권자 © 일간투데이 무단전재 및 재배포 금지