인공지능 학습용 데이터 품질관리 가이드라인
· 4 min read
인공지능 학습용 데이터 품질관리 가이 드라인 개념
- 인공지능 학습용 데이터 구축시 구축계획수립 단계부터 데이터 획득, 수집, 정제, 가공 등에 대한 절차 및 활동에 대한 기준서
- 수집 데이터 일관성, 데이터 유용성/신뢰성, 품질 문제 사전 예방/해결방안 제공
인공지능 학습용 데이터 품질관리체계 개념도, 범위, 지표
인공지능 학습용 데이터 품질관리체계 개념도
------------------------------------------------------------------------------------
| 품질관리 원칙/대상/기준/조직/절차 |
-----------------------------------------------------------------------------------|
| 계획 | 품질관리 | 구축단계 품질관리 | 적재 | 운영/학습단계 품질관리 |
| 단계 | -------> |---------------------------| -----> |--------------------------|
| 품질 | 계획 | 구축 프로세스 | 구축 데이터 | | 품질오류 | 데이터품질진단 |
| 관리 | | 품질관리 | 품질관리 | | 신고관리 | 개선관리 |
------------------------------------------------------------------------------------
| 품질관리 도구 및 지원 인프라 |
------------------------------------------------------------------------------------
인공지능 학습용 데이터 품질관리 범위
구분 | 범위 | 활동 |
---|---|---|
구축 프로세스 품질 관리 | 데이터 획득/수립/정제/가공 과정 원하는 수준의 품질 보장 활동 수행 | 데이터 품질관리 관점 구축 과정 모니터링 |
구축 데이터 품질관리 | 원시/원천/라벨링 데이터 등 품질 검사, 오류 개선 활동 수행 | 구축 사업 중 생성 데이터 자체 품질 조치 |
개방 데이터 품질관리 | AI Hub 적재 데이터 대상 학습용 데이터셋 품질 향상 활동 수행 | 개방 데이터 품질 개선의견 수용 |
인공지능 학습용 데이터 품질관리 지표
구분 | 지표 | 내용 |
---|---|---|
구축 공정 | 준비성 | 기본 정책, 규정, 조직, 절차 마련 여부 |
데이터 적합성 | 기준 적합성 | 데이터의 학습용도 적합성, 다양성, 충분성 |
데이터 정확성 | 의미 정확성 | 데이터 참값 확인을 위한 정확도, 정밀도, 재현율 등 측정 |
학습 모델 | 알고리즘 적정성 | 인공지능 학습 알고리즘의 유효성 측정 |