본문으로 건너뛰기

"pe/algorithm" 태그로 연결된 53개 게시물개의 게시물이 있습니다.

기술사 알고리즘, 인공지능 토픽

모든 태그 보기

인공신경망

· 약 5분

인공신경망의 개념, 구성요소

인공신경망 개념

  • 인간의 뇌 신경 구조를 모방한 기계학습 모델로 뉴런 간 연결과 가중치를 통해 데이터를 학습하고 패턴을 인식

인공신경망 구성요소

구분설명비고
입력층학습을 위한 데이터 입력 계층입력 데이터, 특징
은닉층입출력층 사이에서 데이터 특징 추출특징 추축, 학습, 가중치
출력층최종 결과를 제공하는 층결과 예측, 분류
가중치뉴런 간 연결 강도를 나타내는 값연결 강도, 학습 조정
활성화함수뉴런의 출력값을 결정하는 함수비선형성, 출력 결정

피드포워드 뉴럴네트워크 개념, 절차

FNN 개념

  • 입력값이 출력까지 순방향으로 전달되는 구조를 가진 인공신경망

FNN 절차

절차세부절차설명
초기화모델 설계인공신경망 구조 설계
가중치 초기화가중치 및 편향 초기화
순방향 전파데이터 전달입력층에서 출력층까지 데이터 순방향 전달
예측값 계산입력X가중치+편향 값에 활성화함수 적용
출력출력값 계산분류 및 회귀 출력 값 계산
검증모델 성능 평가

역전파 개념, 절차

역전파 개념

Backpropagation

  • 역방향으로 오차를 전파시켜 각 층의 가중치를 업데이트하고 최적의 학습 결과를 찾아가는 방법

역전파 절차

단계설명세부 내용
순전파입력 데이터를 통해 출력값 계산입력층 → 은닉층 → 출력층으로 데이터 전달
오차 계산출력값과 실제값 비교손실 함수를 사용해 오차 계산
가중치 업데이트역전파를 통해 가중치 조정경사하강법 등 최적화 알고리즘 사용

활성화함수 종류 및 역할

활성화함수 종류

구분그래프설명
SigmoidSigmoid이진 분류 문제에 적합
경사 기울기 소실 문제
ReLUReLU음수는 0, 양수는 그대로 출력
DNN 가능, 계산 효율성 높음
TanhTanhSigmoid보다 수렴속도 빠름
경사 기울기 소실 문제
Leaky ReLULeaky ReLUReLU 음수 기울기 문제 해결
x에 0.01 등 작은 값을 곱해줌
SwishSwishReLU보다 부드러운 활성화 함수
딥러닝 모델에서 성능 개선
음수에서 미세한 값 유지, 양수에서 x와 유사한 출력

활성화함수 역할

역할설명예시
비선형성 부여xor 등 복잡한 패턴을 학습할 수 있게 도움ReLU, Sigmoid
출력값 제한출력 값을 틍정 범위로 제한, 안정적 학습Sigmoid, Tanh
계산 효율성 향상불필요 계산을 줄이고 학습속도 개선ReLU 음수값 제거

PLM, LLM

· 약 3분

자연어 모델 개요

LLM History

  • 트랜스포머 구조 등장으로 자연어 처리능력이 비약적으로 상승, 생성형 AI시대 진입

PLM 개념 및 특성

PLM 개념

  • 대규모 텍스트 코퍼스로부터 언어 패턴을 사전 학습한 자연어 처리 모델
  • BERT, GPT 등이 주요한 Pre-trained Language Model로 활용

PLM 특성

특성설명비고
사전학습대규모 텍스트 데이터로 비지도학습 수행
언어의 통계적 특성 학습
BERT, GPT
범용성다양한 NLP 작업에 적용 가능
전이학습으로 성능 개선 가능
텍스트생성, 감정분석
언어이해능력중요 단어에 더 큰 가중치 부여하여 학습
문맥적 의미 반영한 표현 생성
어텐션 매커니즘

LLM 생성과정 및 특성

LLM 생성과정

  • PLM에서 파라미터를 비약적으로 늘려 범용 성능을 가진 LLM 생성

LLM 특성

특성설명기대효과
초대형 파라미터수십억-수천억개 이상 파라미터 확장
다양한 문맥정보를 정교하게 표현
Few-shot, Zero-shot 응답
범용성 확대파인튜닝, RLHF 등을 통해 응답 품질개선
다중언어, 다분야 처리능력향상
범용 AI
인간수준 자연어생성최적화를 통한 완결성있는 문장 생성
대화의 맥락 추론 가능
태스크 자동화, 효율화

PLM과 LLM 비교

구분PLMLLM
데이터규모수억-수십억 토큰수십억-수조 토큰
모델파라미터수천만-수억 개수십억-수천억 개
학습방식사전학습, 파인튜닝사전학습, 파인튜닝, 인스트럭션 튜닝
응용범위특정 작업시 전이학습 필요다양한 작업에 높은 성능
컴퓨팅 파워상대적 낮음고성능 GPU 필요

머신러닝 성능지표

· 약 3분

머신러닝 성능지표 개념

  • 실제 값과 모델에 의해 예측된 값을 비교하여 머신러닝 모델이 얼마나 잘 학습했는지 평가하기 위한 지표
  • 지도학습, 비지도학습, 강화학습 별 다른 성능지표 활용

머신러닝 성능지표 상세

지도학습 성능지표

구분성능지표설명
회귀MSE오차를 제곱하여 평균, 값이 작을수록 우수
RMSEMSE의 제곱근, 해석을 용이하게 변환
MAE오차의 절대값의 평균, 이상치에 덜 민감
R^2회귀모델의 설명력을 표현, 1에 가까울수록 우수
분류정확도올바르게 예측한 비율, 클래스 불균형에 민감
정밀도Positive로 예측한 것 중 실제 Positive 비율
재현율실제 Positive 중 Positive로 예측한 비율
F1 Score정밀도와 재현율의 조화평균, 불균형 데이터셋에 우수
AUCROC Curve의 면적, 종합적 성능 평가, 1에 가까울수록 우수
  • 분류모델 성능 평가시 혼동행렬 작성 선행 필요

비지도학습 성능지표

구분성능지표설명
클러스터링실루엣 지수클러스터의 밀집 정도를 계산, 1에 가까우면 높은 성능
Dunn Index군집 간 거리의 최소값, 군집 내 요소 간 거리 최대값의 비율
차원축소재구성오차축소 복원시 원본과의 오차를 평가
설명분산비율축소된 차원에서 전체 데이터 분산 중 설명되는 비율
스트레스저차원 공간에서 고차원 데이터 간 거리의 보존 정도를 평가

강화학습 성능지표

  • 환경과 상호작용하며 보상이 최대화되는지 평가

SOM, 자기조직화지도

· 약 3분

SOM 개념

  • 고차원 데이터의 위상을 보존하여 저차원 그리드로 매핑하는 비지도학습 기반 인공 신경망
  • 차원축소, 위상보존, 경쟁학습, 시각화 및 군집화

SOM 구성도, 구성요소, ANN과의 차이점

SOM 구성도

SOM

  • 경쟁층 뉴런들이 2차원 격자구조로 배열, 고차원 입력 데이터를 저차원 공간에 시각적으로 표현하는 구조

SOM 구성요소

구분구성요소설명
레이어입력층고차원 입력 특성을 받는 층
경쟁층(출력층)2D 그리드 구조로 입력 데이터와의 거리 측정 후 가장 가까운 뉴런 선정
연결요소연결가중치입출력층 연결, 초기 무작위 가중치 설정 후 경쟁학습을 통해 업데이트
BMV입력벡터와 가장 유사한 출력층 뉴런, 유클리드 최소 거리 계산
  • 역전파와 체인룰 없이 승자 독식 경쟁학습 알고리즘 사용

SOM과 ANN의 차이점

구분SOMANN
학습방식비지도학습비지도/지도학습
학습알고리즘경쟁학습역전파 등 오류수정기반
주요목적시각화, 군집화, 차원축소분류, 회귀, 예측
출력구조2차원 격자다층 퍼셉트론
데이터 요구사항레이블 불필요레이블 필요
활용사례데이터 시각화, 군집 분석이미지 인식, 음성 인식, 자연어 처리
해석가능성결과의 직관적 해석블랙박스, 해석 어려움

이미지 데이터 어노테이션

· 약 2분

이미지 데이터 어노테이션 개념

  • 인공지능 모델을 학습시키기 위해 이미지 데이터에 레이블을 붙이는 과정
  • 이미지 수준, 객체 수준, 픽셀 수준으로 추가 정보 부여

이미지 데이터 어노테이션의 유형과 기법

이미지 데이터 어노테이션의 유형

  • 픽셀 수준으로 갈수록 높은 정밀도, 어노테이션 비용 증가
  • 이미지 데이터 활용 목적과 수준 및 범위에 따라 적절한 수준의 어노테이션 유형 선택

이미지 데이터 어노테이션의 기법

유형기법설명
이미지 수준이미지 분류이미지 파일 단순 분류
객체 수준바운딩 박스객체의 최소 사각형으로 분류
폴리곤객체의 윤곽을 따라 다각형으로 어노테이션
키포인트객체의 주요 특징점 어노테이션
3D 큐보이드객체를 3차원 박스로 식별하여 위치 및 크기 판별
픽셀 수준시맨틱 세그멘테이션이미지 각 픽셀별 클래스 지정
인스턴스 세그멘테이션클래스 내에서 개별 객체를 구분해 픽셀 레이블 지정

감정 인식 기술

· 약 4분

감정 인식 기술 개념

  • 자연어로 전달되는 감정을 분류하는 감정 분석 대비 표정, 음성, 자세 등을 관찰하여 광범위한 감정상태를 식별하는 기술
  • 감정 임베딩과 대화형 봇 감정 인식 기술을 통해 다양한 상황과 사용자 요구 대응

감정 인식 기술 유형, 활용 분야

감정 임베딩 기술 유형

구분설명관련 기술
감정 단어 임베딩감정 정보를 단어 임베딩으로 임베딩하는데 중점Emo2Vec, SSWE
이모티콘 임베딩감정을 표현하기 위해 채팅 메세지 내부 이모티콘을 임베딩Emoji2Vec, DeepMoji
다중감정 인식용 단어 인베딩여러 감정 레이블을 동시 할당하여 감정을 더 자세히 설명다중라벨분류, SGM

대화형 봇 감정 인식 기술 유형

구분설명비고
앙상블 모델 기반 감정인식여러 개별 모델을 결합하여 포괄적, 강인한 모델 구성주요 감정 모델 간 가중 평균 처리
지식 표현 기반 감정인식사전 지식에 정서어휘, 상식, 언어패턴, 정서의미규칙 등 포함하여 표현향상어휘기반 감성 지식 통합
감정인식 위한 전이학습부족한 훈련 데이터 문제 완화, 유도적 전이학습 사용순차전이학습, 다중작업학습
이모티콘수용 감정인식이모티콘 기반에 SVM 등 분류기로 감정 주석 추가이모티콘 포함 텍스트 희소
맥락이해기반 감정인식상황적 표현 학습 위해 발화 및 컨텍스트 수준에서 셀프 어텐션 사용GPT-4o 등 LLM

감정 인식 기술 활용분야

구분활용분야비고
공공SNS 공개 데이터 분석, 감정 모니터링 자살예방, 테러리스트 탐지범죄예방, 안전
의료긴급 상황에서 환자의 감정 예측환자 의도 파악
민간대화형 봇 감정인식 활용 감정기반 응답시스템 구축고객응대, 마케팅

감정 인식 기술 고려사항

  • 사용자 데이터의 최소 수집 및 목적 제한을 위한 법, 제도 마련 필요

가상화폐 스캠탐지

· 약 4분

가상화폐 스캠 개념

  • 폰지사기라고 표현되며 가격의 높은 변동성과 익명성을 악용해 투자자들을 속이는 위협
  • 블록체인, 가상화폐의 급속한 발전으로 폰지사기, 피싱공격, 가짜 ICOs, 러그풀, 다중서명지갑 해킹 등 다양한 유형의 사기 범죄 출현

가상화폐 스캠 탐지 개념도, 분석 유형, 탐지 절차

가상화폐 스캠탐지 개념도

가상화폐 스캠탐지 분석 유형

기반유형내용
기계학습 기반로지스틱 회귀거래 데이터의 다양한 속성 기반으로 확률 분석하여 결정 경계 정의
랜덤포레스트다수의 결정 트리로 거래 특성 분석, 종합하여 스캠 여부 판별
SVM거래 데이터를 고차원에서 분류하여 최적 결정경계를 찾아서 높은 정확도
ADABoost약분류기 결합, 반복학습, 스캠 특성 포착
LGBM복잡한 거래 뎅치터를 수직적 방식으로 빠르게 탐지
딥러닝 기반LSTM-FCN&BPLSTM-FCN과 BP 신경망을 결합한 하이브리드 모델 사용
LSTM-CNN순차 데이터 처리용 LSTM과 구조적 특징 파악용 CNN 결합
그래프 기반 경로임베딩Trans2Vec거래량과 타임스탬프에 랜덤워크 기법과 SVM 활용 분류
Node2VecEtherScanDB로 Node2Vec과 SVM 활용 분류
그래프신경망 기반 그래프 임베딩GCN노드와 이웃 간 정보 집계 후 노드 임베딩 생성
TTAGN거래내역 시간, 구조적 정보를 통합, LSTM, 어텐션 활용 스캠 탐지

가상화폐 스캠탐지 절차

가상화폐 스캠탐지시 고려사항

  • 클래스 불균형으로 인한 오탐 방지 위해 오버샘플링, 언더샘플링, 가중치 조정 등 고려
  • 가상화폐 거래 네트워크의 지속적 변화 학습

앙상블 모델, 배깅, 부스팅

· 약 3분

앙상블 모델의 개념

  • 여러 개별 모델을 결합하여 하나의 강력한 예측 모델을 만드는 기법
  • 배깅은 독립적으로 학습시킨 모델의 결과를 취합하고, 부스팅은 순차학습시켜 이전 모델의 오차를 보완하는 기법

배깅, 부스팅의 구성도, 구성요소

배깅의 구성도, 구성요소, 비교

  • 다수 모델을 학습시켜 예측 결과 도출
구분내용비고
랜덤 샘플링원본 데이터셋을 복원 추출개별 모델 다양성 확보, 과적합 방지
병렬모델학습각 모델을 독립적으로 학습 수행랜덤 포레스트 등 결정 트리 기반
예측 결합각 예측 데이터를 합산하여 결과 도출평균, 투표

부스팅의 구성도, 구성요소

  • 모델을 순차적으로 학습, 가중치 반영하여 예측 결과 도출
구분내용비고
순차모델 학습이전 모델의 오차를 보완하여 학습오차 감소
가중치 업데이트오차가 큰 데이터에 높은 가중치 부여오답 집중 학습
반복 학습가중치 반영 모델 반복 학습순차 실행
예측 결합모든 모델 예측에 가중치 반영한 평균 계산그라디언트 부스팅, XGBoost, CatBoost

배깅, 부스팅 비교

구분배깅부스팅
목표분산 감소, 과적합 방지편향 감소
계산 비용빠름, 병렬느림, 순차
결합 방식평균, 투표가중 평균
  • 데이터 분산, 편향을 참조하여 앙상블 기법 선택

연합학습

· 약 7분

연합학습 개념

  • 데이터를 중앙 저장하지 않고 다수의 로컬 디바이스에서 모델 훈련 후, 훈련된 모델 파라미터를 중앙서버로 전송해 모델을 업데이트하는 분산 인공지능 학습모델
  • 데이터 프라이버시, 보안, 통신비용 절감, 확장성, 속도
필요성설명사례
데이터 프라이버시 보호민감한 데이터가 중앙 서버로 이동하지 않아 보안 강화헬스케어에서 환자 데이터 보호
네트워크 부하 감소대량 데이터 전송 없이 로컬에서 처리하여 트래픽 절감자율주행 차량 간 통신 부하 경감
실시간 데이터 처리로컬 디바이스에서 즉각적으로 데이터 분석 및 의사 결정스마트 시티의 실시간 교통 관리
분산 학습 가능다양한 지역에서 수집된 데이터를 활용해 AI 모델 학습산업 IoT에서 분산된 공장 데이터 활용

연합학습 구성도, 핵심요소, 주요 기법

연합학습 구성도

연합학습 핵심요소

구분설명주요 기술
엣지 디바이스데이터 수집 및 로컬 학습 수행IoT 디바이스, 스마트폰, 차량 센서
연합 학습모델 업데이트만 공유하여 프라이버시 보호Federated Averaging, Differential Privacy
통신 프로토콜중앙 서버와 엣지 디바이스 간 안전한 데이터 전송 및 동기화gRPC, MQTT
모델 집계 서버각 엣지에서 전송된 모델 업데이트를 통합하여 최적화된 모델 생성클라우드 서버, AI 오케스트레이션 시스템
보안 및 인증 기술데이터 보호 및 무결성 검증블록체인, 데이터 암호화, Zero Trust Security

연합학습 주요 기법

구분내용비고
FedSGD모든 로컬 디바이스에서 계산된 그라디언트를 중앙에서 평균화하여 모델 업데이트데이터 이질성 취약
FedAVG로컬에서 여러 배치 업데이트를 수행 후 결과를 중앙 서버로 전송통신 비용 절감
FedDyn이질적 데이터셋에서 로컬 손실함수에 동적으로 정규화 적용, 글로벌 손실 수렴처리데이터 이질성에 강건함
HyFDCA하이브리드 연합학습으로 클라이언트 다양성을 고려한 모델의 조정과 개인화적응적 개인화 가능

연합학습 보안 강화 기법, 활용 방안

연합학습 보안

구분내용비고
데이터 암호화모델 업데이트 정보 암호화전송구간 보호
차등프라이버시모델 업데이트시 노이즈 추가, 개인 데이터 노출 방지프라이버시 강화
인증, 접근제어로컬장치-서버 간 신뢰할 수 있는 통신 보장무단 접근 차단, HMAC, OAuth
안전한 집계값 노출 없이 중앙서버에서 각 장치의 업데이트 처리중간자 공격 방어

연합학습 활용 방안

분야활용 방안사례
스마트 시티엣지 디바이스에서 교통 및 공공 데이터 실시간 분석바르셀로나 스마트 시티 프로젝트
헬스케어환자의 의료 데이터를 보호하며 AI 기반 진단 지원Google의 Federated Learning 웨어러블 기기 활용
산업 IoT(IIoT)제조 공정 데이터를 분석해 생산성 향상 및 고장 예측Siemens의 예측 유지보수 시스템
자율주행지역별 주행 데이터를 활용해 AI 기반 자율주행 최적화Tesla의 자율주행 AI

연합학습 고려사항

고려사항설명해결 방안
데이터 동기화 문제분산된 디바이스 간 데이터 학습 결과를 일관되게 유지해야 함클라우드-엣지 협력 강화 및 최적화된 통신 프로토콜 적용
컴퓨팅 자원 제한엣지 디바이스의 연산 능력이 제한적임경량화된 AI 모델 사용(MicroNet) 및 하드웨어 가속기 활용
보안 및 신뢰성데이터 도난 및 변조 위험이 존재블록체인 기반 데이터 무결성 보장 및 강화된 인증 시스템 적용
표준화 부족Federated AI 및 엣지 컴퓨팅 간의 상호운용성이 낮음IEEE, ISO 등 글로벌 표준 개발 및 채택 추진

귀납적 사고, 머신러닝

· 약 3분

귀납적 사고 개념

  • 특정한 사례나 데이터에서 패턴을 발견하고 일반적인 결론이나 규칙을 도출하는 사고방식
  • 데이터 기반 의사결정, 예측 가능성, 지식 확장

귀납적 사고와 머신러닝 관계도, 유형, 활용방안

귀납적 사고와 머신러닝 관계도

귀납적 머신러닝 유형

구분내용비고
지도학습라벨링된 데이터로 모델학습, 새로운 데이터 예측 수행분류, 회귀 등
비지도학습라벨링 없는 데이터로 구조나 새로운 패턴 발견군집화, 차원 축소 등
강화학습에이전트가 환경과 상호작용하여 보상을 통해 학습게임, 로봇공학 등

머신러닝 활용방안

구분활용방안비고
이미지 인식이미지에서 객체, 인물 인식 기술얼굴 인식, 의료 영상 인식
자연어 처리텍스트 데이터 분석, 의미 이해/처리번역, 챗봇, 감정 분석
추천 시스템사용자 데이터 분석, 개인화 서비스상품 추천, 콘텐츠 추천

머신러닝 고려사항

  • 안전하고 지속가능한 AI 생태계를 위해 AI 거버넌스 확립 필요