본문으로 건너뛰기

인공지능 학습용 데이터 품질관리 가이드라인

· 약 4분

인공지능 학습용 데이터 품질관리 가이드라인 개념

  • 인공지능 학습용 데이터 구축시 구축계획수립 단계부터 데이터 획득, 수집, 정제, 가공 등에 대한 절차 및 활동에 대한 기준서
  • 수집 데이터 일관성, 데이터 유용성/신뢰성, 품질 문제 사전 예방/해결방안 제공

인공지능 학습용 데이터 품질관리체계 개념도, 범위, 지표

인공지능 학습용 데이터 품질관리체계 개념도

 ------------------------------------------------------------------------------------
| 품질관리 원칙/대상/기준/조직/절차 |
-----------------------------------------------------------------------------------|
| 계획 | 품질관리 | 구축단계 품질관리 | 적재 | 운영/학습단계 품질관리 |
| 단계 | -------> |---------------------------| -----> |--------------------------|
| 품질 | 계획 | 구축 프로세스 | 구축 데이터 | | 품질오류 | 데이터품질진단 |
| 관리 | | 품질관리 | 품질관리 | | 신고관리 | 개선관리 |
------------------------------------------------------------------------------------
| 품질관리 도구 및 지원 인프라 |
------------------------------------------------------------------------------------

인공지능 학습용 데이터 품질관리 범위

구분범위활동
구축 프로세스 품질 관리데이터 획득/수립/정제/가공 과정 원하는 수준의 품질 보장 활동 수행데이터 품질관리 관점 구축 과정 모니터링
구축 데이터 품질관리원시/원천/라벨링 데이터 등 품질 검사, 오류 개선 활동 수행구축 사업 중 생성 데이터 자체 품질 조치
개방 데이터 품질관리AI Hub 적재 데이터 대상 학습용 데이터셋 품질 향상 활동 수행개방 데이터 품질 개선의견 수용

인공지능 학습용 데이터 품질관리 지표

구분지표내용
구축 공정준비성기본 정책, 규정, 조직, 절차 마련 여부
데이터 적합성기준 적합성데이터의 학습용도 적합성, 다양성, 충분성
데이터 정확성의미 정확성데이터 참값 확인을 위한 정확도, 정밀도, 재현율 등 측정
학습 모델알고리즘 적정성인공지능 학습 알고리즘의 유효성 측정

인공지능 학습용 데이터 품질관리 고려사항

  • 데이터의 수집과 활용 단계에서 개인정보 보호 및 법적 규정 준수 필요

참조