본문으로 건너뛰기

"pe/algorithm" 태그로 연결된 53개 게시물개의 게시물이 있습니다.

기술사 알고리즘, 인공지능 토픽

모든 태그 보기

인공지능 학습용 데이터 품질관리 가이드라인

· 약 4분

인공지능 학습용 데이터 품질관리 가이드라인 개념

  • 인공지능 학습용 데이터 구축시 구축계획수립 단계부터 데이터 획득, 수집, 정제, 가공 등에 대한 절차 및 활동에 대한 기준서
  • 수집 데이터 일관성, 데이터 유용성/신뢰성, 품질 문제 사전 예방/해결방안 제공

인공지능 학습용 데이터 품질관리체계 개념도, 범위, 지표

인공지능 학습용 데이터 품질관리체계 개념도

 ------------------------------------------------------------------------------------
| 품질관리 원칙/대상/기준/조직/절차 |
-----------------------------------------------------------------------------------|
| 계획 | 품질관리 | 구축단계 품질관리 | 적재 | 운영/학습단계 품질관리 |
| 단계 | -------> |---------------------------| -----> |--------------------------|
| 품질 | 계획 | 구축 프로세스 | 구축 데이터 | | 품질오류 | 데이터품질진단 |
| 관리 | | 품질관리 | 품질관리 | | 신고관리 | 개선관리 |
------------------------------------------------------------------------------------
| 품질관리 도구 및 지원 인프라 |
------------------------------------------------------------------------------------

인공지능 학습용 데이터 품질관리 범위

구분범위활동
구축 프로세스 품질 관리데이터 획득/수립/정제/가공 과정 원하는 수준의 품질 보장 활동 수행데이터 품질관리 관점 구축 과정 모니터링
구축 데이터 품질관리원시/원천/라벨링 데이터 등 품질 검사, 오류 개선 활동 수행구축 사업 중 생성 데이터 자체 품질 조치
개방 데이터 품질관리AI Hub 적재 데이터 대상 학습용 데이터셋 품질 향상 활동 수행개방 데이터 품질 개선의견 수용

인공지능 학습용 데이터 품질관리 지표

구분지표내용
구축 공정준비성기본 정책, 규정, 조직, 절차 마련 여부
데이터 적합성기준 적합성데이터의 학습용도 적합성, 다양성, 충분성
데이터 정확성의미 정확성데이터 참값 확인을 위한 정확도, 정밀도, 재현율 등 측정
학습 모델알고리즘 적정성인공지능 학습 알고리즘의 유효성 측정

인공지능 학습용 데이터 품질관리 고려사항

  • 데이터의 수집과 활용 단계에서 개인정보 보호 및 법적 규정 준수 필요

참조

튜링테스트

· 약 2분

튜링테스트 개념

  • 인공지능의 수준을 평가하기 위해 인간과 인공지능의 사고능력을 비교하는 블라인드 테스트
  • 자연어 처리기술 발전, 기계와 인간 구분의 모호성, AI활용 서비스 증가

튜링테스트 구성도, 구성요소, 활용사례

튜링테스트 구성도

튜링테스트 구성요소

구분내용비고
심판AI와 인간을 구별하는 역할익명 대화
AI인간처럼 행동하는 인공지능언어모델 등
인간별도 공간에서 질의응답대조군 역할

튜링테스트 활용사례

구분사례비고
챗봇 개발고객지원 및 서비스 챗봇으리 자연스러운 대화능력 평가사용자 만족도 평가 활용
AI 어시스턴트Siri 등 가상비서의 대화 성능 측정사용자 경험 개선 기여
AI 연구AI 시스템의 지능 수준 평가AI 발전지표

튜링테스트 고려사항

  • LLM의 발전으로 사람보다 더 뛰어난 답변으로 GPT4o모델을 구별해낼 수 있어 튜링테스트 실패 가능
  • 인공지능 품질속성을 기반으로 새로운 평가체계마련 필요

K-means, DBSCAN 클러스터링

· 약 3분

클러스터링 개념

  • 데이터 포인터들을 여러 군집으로 나누어 각 군집 간 유사성을 최소화, 군집 내 유사성을 최대화하는 비지도학습 알고리즘
  • 데이터 내 잠재적 패턴, 그룹 발견, 군집별 맞춤 전략 수립, 군집별 전처리 및 축소

K-means, DBSCAN 클러스터링 개념, 비교

K-means 클러스터링 개념 및 특징

구분내용
개념도k-means
개념데이터셋을 K개의 클러스터로 나눠 각 데이터가 가장 가까운 클러스터 중심에 할당하여 군집화하는 알고리즘
특징초기 중심점 설정 민감, 이상치 민감
가벼운 시간 복잡도, 구형 클러스터 적합

DBSCAN 클러스터링 개념 및 특징

구분내용
개념도dbscan
개념밀도가 높은 지역에서 클러스터를 형성하고, 밀도가 낮은 지역은 노이즈로 간주하는 알고리즘
특징클러스터 모양이 불규칙해도 좋은 성능
입실론 거리와 최소 포인트 수 조정이 성능의 핵심 요소

K-means, DBSCAN 클러스터링 비교

구분K-meansDBSCAN
기반거리기반밀도기반
클러스터 형태구형 클러스터 적합임의 모양 식별 가능
노이즈 처리약함강함
처리 속도빠름느림
초기화초기 중심점 선택 중요덜 민감

클러스터링 고려사항

  • 데이터 크기, 형태, 노이즈에 따라 적절한 알고리즘 선택 필요
  • Dunn Index, Silhouette Coefficient 등의 지표로 클러스터링 결과 평가 후 하이퍼파라미터 조정

DSML, MLOps

· 약 3분

DSML 개념

  • 데이터 사이언스와 머신러닝을 활용하여 데이터에서 가치를 창출하고 예측모델을 구축하는 프로젝트
  • 복잡한 워크플로우, 협업의 어려움, 모델 배포의 어려움, 모델 신뢰성과 지속가능성 문제
  • 효율적인 모델관리, 지속적 통합 배포, 모델 모니터링, 유지보수, 향상된 협업을 위해 MLOps

MLOps 개념도, 구성요소, 적용방안

MLOps 개념도

MLOps 구성요소

구분내용비고
자동화 파이프라인데이터준비, 모델훈련/배포과정 자동화로 효율성 증대개발 및 운영 프로세스
버전 관리모델 리뷰, 변경 관리, 롤백 절차 수립VCS 사용
플랫폼 엔지니어링데이터사이언티스트, 엔지니어, 이해관계자 협업 플랫폼 제공모델 거버넌스 확립

MLOps 성숙단계

레벨단계내용
2최적화ML 파이프라인 오케스트레이션, 모델 추적 관리
1통합ML 파이프라인 자동화, 지속적 모델 훈련
0도입수동 워크플로우로 데이터 사이언티스트와 엔지니어가 별도 작업

MLOps 고려사항

  • ISO25029 AI품질속성에 따라 모델의 품질 검증 절차 자동화 필요

머신러닝 최적화 알고리즘

· 약 3분

머신러닝 최적화 알고리즘

  • 머신러닝 모델 학습과정에서 모델의 오차를 최소화하거나, 정확도를 최대화하기 위해 파라미터를 조정하여 모델 성능을 최적화하는 알고리즘
  • 손실함수를 최소화하여 정확도 향상, 학습 효율화, 과적합 방지

머신러닝 최적화 개념도, 주요 알고리즘, 고려사항

머신러닝 최적화 개념도

머신러닝 최적화 주요 알고리즘

구분내용비고
경사하강법, GD기울기를 사용하여 손실함수 값 최소화하여 파라미터 업데이트보편적 알고리즘
확률적 경사하강법, SGD한 개의 데이터 셋을 샘플링하여 파라미터 업데이트학습속도 향상
미니배치 경사하강법, MBGD적당한 크기의 미니 데이터셋으로 나눠 경사하강법 적용병렬 컴퓨팅
모멘텀 최적화이전 기울기를 사용하여 관성기반 파라미터 업데이트 가속화지역최소값 회피
RMSProp기울기 크기에 따라 학습률을 조정하여 파라미터 최적화효율적, 지속적 학습
Adam모멘텀과 RMSProp 장점 결합 최적화 수행높은 성능

머신러닝 최적화 알고리즘 고려사항

구분내용비고
모델 선택문제 특성에 맞는 모델 선택데이터 크기, 특성
하이퍼파라미터 튜닝학습률, 배치 크기 등 하이퍼파라미터 조정하여 모델 성능 최적화실험적 접근 필요
초기화방법파라미터 초기화는 수렴속도와 성능에 영향을 주므로, 적절한 초기화 전략 선택무작위, Xavier 초기화
정규화L1, L2 정규화를 통한 과적합 방지리지 패널티, 라쏘, 티코노프

강화학습

· 약 3분

강화학습 개념

  • 에이전트가 환경과 상호작용하여 보상을 최대화하는 행동을 학습하는 방법
  • 복잡한 환경에서의 문제 해결, 환경 상호작용, 보상 기반 학습

강화학습 구성도, 주요 알고리즘, 적용방안

강화학습 구성도

  • 상태를 인식하고, 행동을 취하며, 보상을 최대화하는 최적의 정책 학습

강화학습 주요 알고리즘

구분내용비고
Q-Learning가치기반 학습방법, 각 상태-행동 쌍에 대한 가치를 업데이트하여 최적 정책 학습오프라인학습, 단순 문제
SARSA실제 정책을 사용하여 상태-행동 가치함수를 학습하는 시간차 방법온라인 학습
DQN딥러닝을 이용한 Q-Learning, 신경망을 사용하여 Q값을 근사 처리복합한 문제
Policy Gradient보상 기대값을 최대화하는 방향의 정책을 직접 학습연속적 행동 적합
Actor-Critic정책기반과 가치기반 알고리즘 결합, 액터는 정책경사모델로 행동 결정, 크리틱은 Q러닝으로 행동 비평안정성, 효율성

강화학습 적용방안

구분내용비고
게임AI게임 내 최적 전략을 학습하여 사람과 경쟁가능한 AI 개발Starcraft, Dota2
로봇제어로봇 움직임을 강화학습하여 자율적 환경 탐색 및 작업 수행자율주행, 드론제어
금융거래거래 데이터로 강화학습하여 최적의 거래 전략 학습/적용리스크 관리, 포트폴리오 최적화

강화학습 고려사항

  • Exploitation과 Exploration 사이의 적절한 균형을 찾는 알고리즘 선택

알고리즘 시간복잡도, 공간복잡도

· 약 4분

알고리즘 시간복잡도, 공간복잡도 개념

  • 시간복잡도: 주어진 입력에 따라 알고리즘이 실행되는데 걸리는 시간의 양
  • 공간복잡도: 주어진 입력에 따라 필요한 저장 공간의 양
  • 성능 예측, 효율성 비교, 자원 최적화

알고리즘 복잡도 표기법, 빅오표기법

알고리즘 복잡도 표기법

구분내용비고
Big O알고리즘이 최악의 성능일 때 평가일반적 분석
Big Ω알고리즘이 최상의 성능일 때 평가최적 상황 분석
Big θ알고리즘의 평균 성능 평가전반적 성능 분석
  • 주로 Big O 표기법으로 알고리즘의 복잡도 평가 및 측정

빅오표기법 유형

Big O Chart

연산시간유형설명
매우빠름O(1)O(1)자료의 크기와 무관하게 항상 같은 속도로 작용
O(logn)O(logn)일정한 크기로 잘라서 해결하는 유형
빠름O(n)O(n)입력순서대로 처리, 자료 크기와 수행시간 정비례
O(nlogn)O(nlogn)분할과 합병, 정렬 알고리즘의 최소한의 복잡도
O(n2)O(n^2)입력한 n 크기가 작을시 nlognnlogn보다 빠르나, 데이터 크기가 증가시 급격하게 비효율
느림O(2n)O(2^n)지수형으로 가능한 해결방법 모두 검사, 매우 비효율적
O(n!)O(n!)입력 N에 따라 시간복잡도가 매우 빠르게 증가, 재고려 필요

알고리즘 시간복잡도, 공간복잡도

알고리즘 시간복잡도

구분내용사례
O(1)O(1)상수 시간복잡도, 입력 크기와 관계 없이 실행해시테이블
O(logn)O(logn)로그 시간복잡도, 입력에 따라 로그에 비례이진 검색
O(n)O(n)선형 시간복잡도, 입력에 따라 시간 증가선형 검색
O(nlogn)O(nlogn)선형로그 시간복잡도, 효율적 정렬 알고리즘병합정렬, 퀵정렬
O(n2)O(n^2)이차 시간복잡도, 중첩 루프 사용버블정렬, 삽입정렬
O(2n)O(2^n)지수 시간복잡도, 피보나치 수열 계산피보나치 재귀
O(n!)O(n!)팩토리얼 시간복잡도, 매우 비효율적순열 생성

알고리즘 공간복잡도

구분내용사례
O(1)O(1)상수 공간복잡도, 입력 상관없이 일정 공간 사용스왑 알고리즘
O(n)O(n)선형 공간복잡도, 입력 크기 비례 공간 사용배열, 리스트
O(n2)O(n^2)이차 공간복잡도, 이차원 배열 사용 공간행렬 곱셈

알고리즘 복잡도 측정방법

구분시간복잡도공간복잡도
실제 측정실행시간 측정하여 복잡도 측정메모리 프로파일러 통한 사용량 측정
이론적 측정빅오 표기법 등 복잡도를 수학적 유도로 분석알고리즘이 사용하는 변수, 자료구조 분석
  • 데이터의 정렬 여부, 중복 여부에 다른 알고리즘의 성능 차이 고려

전이학습

· 약 3분

전이학습 개념

  • 한 도메인에서 학습된 모델이나 지식을 다른 모데인으로 전이하여 학습 성능을 향상시키는 기법
  • 데이터 부족 문제 해결, 학습시간 단축, 모델성능 향상, 컴퓨팅 리소스 절약

전이학습 구성도, 구성요소, 적용방안

전이학습 구성도

  • 전이학습시 전수되는 은닉층은 가중치 고정, 나머지 은닉층은 타겟도메인에 맞게 파인튜닝

전이학습 구성요소

구분내용비고
소스도메인기존 학습 데이터 및 모델이 있는 도메인풍부한 데이터 보유
타겟도메인지식 전이하여 학습할 신규 도메인데이터 부족 해결
특징 추출기소스 도메인에서 추출된 중요 특징을 타겟 도메인 모델 활용초기 가이드라인 제공
모델 최적화타겟도메인 데이터를 통해 모델 재학습 또는 미세조정성능 최적화

전이학습 적용방안

구분내용비고
자연어 처리번역 및 감정분석시 사전학습 언어모델 활용하여 신규언어 적용확장성, 적응력 향상
게임 개발캐릭터 및 환경 생성시 사전학습 모델활용 컨텐츠 생성학습시간 단축, 현실감
의료 진단X-Ray, MRI 등 의료 이미지 분석시 사전 학습모델 미세조정 활용희귀 질병 진단 가능

전이학습 고려사항

  • 소스도메인에서 사용된 모델이 타켓도메인에 적합한지 적절성 평가 필요
  • 학습률 조정, 드롭아웃 등 정규화 기법을 통해 과적합 방지

정렬 알고리즘, 버블정렬, 삽입정렬, 퀵정렬

· 약 2분

정렬 알고리즘 개념

  • 데이터를 특정 기준에 따라 순서대로 나열하는 기법
  • 검색 효율성 향상, 데이터 중복 관리, 알고리즘 성능 향상, 데이터 분석 및 시각화

버블정렬, 삽입정렬, 퀵정렬 개념

버블정렬 개념

구분내용
개념도2 <-4-> 3 5
개념두 인접요소를 비교하고 필요시 치환
시간복잡도평균 O(n2)O(n^2), 최상 O(n)O(n)

삽입정렬 개념

구분내용
개념도2->4 3 5
개념리스트 요소를 하나씩 탐색하여 비교 후 올바른 위치에 삽입
시간복잡도평균 O(n2)O(n^2), 최상 O(n)O(n)

퀵정렬 개념

구분내용
개념도2 <-4 pivot-> 3 5
개념피벗을 기준으로 리스트를 분할 후 각각 정렬한 뒤 결합
시간복잡도최악 O(n2)O(n^2), 평균 O(nlogn)O(nlogn)

버블정렬, 삽입정렬, 퀵정렬 비교

구분버블정렬삽입정렬퀵정렬
시간복잡도O(n2)O(n^2)O(n2)O(n^2)O(nlogn)O(nlogn)
공간복잡도O(1)O(1)O(1)O(1)O(logn)O(logn)
안정성안정적안정적불안정
구현난이도쉬움쉬움어려움
사용사례소량 데이터거의 정렬된 소량 데이터대량 데이터

정렬 알고리즘 고려사항

  • 어셈블리로 컴파일 후 AI를 활용하여 기계어의 병렬성을 최적화, 추가 정렬 성능 확보

인공지능 파운데이션 모델

· 약 3분

인공지능 파운데이션 모델 개념

  • 대량의 무라벨 데이터로 학습되어 목적에 맞는 다운스트림 작업에 적용될 수 있는 일반화된 기초 모델
  • 데이터의 증가와 하드웨어의 연산 속도 증가로 다양한 작업에서 높은 성능을 보여주는 파운데이션 모델 등장

인공지능 파운데이션 모델 개념도, 핵심요소, 기술동향

인공지능 파운데이션 모델 개념도

인공지능 파운데이션 모델 핵심요소

구분요소내용
모델방대한 학습데이터텍스트, 이미지, 데이터 이해
대규모 파라미터최소 수억개 이상 파라미터
기술트랜스포머순차 데이터 내 관계 학습
Few-Shot 러닝적은 양의 데이터로 미세 조정
기능범용성생성형 기반 추론 가능
유연성자연어 처리, 영상 인식 등 다수 분야 활용

인공지능 파운데이션 모델 기술동향

구분모델내용
OpenAISora텍스트에서 영상 생성
GPT4o뛰어난 감정표현 가능
XGrok1.5오픈소스기반 대규모 컨텍스트 처리
MetaLlama3.1오픈소스기반, sLLM

인공지능 파운데이션 모델 고려사항

  • 지적재산권, 생성물저작권
  • 모델 운영 전력, 훈련시 탄소배출 비용
  • 편향, 환각 등 역기능 제거 노력, 윤리원칙 준수 필요