본문으로 건너뛰기

합성데이터

· 약 3분

합성데이터의 개념

  • 실제 데이터의 대체재로서 컴퓨터 시뮬레이션이나 알고리즘을 통해 생성하는 임의의 데이터
  • 모델 학습시 충분한 양의 데이터 확보, 양질의 데이터 확보, 개인정보, 저작권 등 이슈 없는 안전한 데이터 확보

합성데이터의 유형 개념도, 구성요소, 사례

합성데이터의 개념도

합성데이터 구성요소

구분내용비고
완전 합성 데이터공개하려고 하는 데이터에 측정된 실제 데이터가 없는 가상 데이터정보보호 보안성
부분 합성 데이터공개하려는 변수 중 일부만을 선택하여 합성 데이터로 대체한 데이터민감정보 대체
복합 합성 데이터일부 변수 값을 합성 데이터로 생성, 합성된 데이터와 실제 데이터를 모두 사용하여 일부 변수 값을 다시 도출하는 방법으로 생성정확성

합성데이터 사례

구분내용비고
국내자율주행용 합성 비디오데이터셋네이버 Virtual KITTI
국외이미지와 사람 수가 압도적인 군중 계수 데이터셋GTA5 Crowd Counting
-실내 장면 이해를 위한 하이퍼 리얼리즘 장면 데이터셋애플 Hypersim

합성데이터 고려사항

  • 데이터 합성시 목표대로 데이터가 만들어졌는지 검증할 수 있는 측정 기준 마련 필요