55 posts tagged with "pe/algorithm"

기술사 알고리즘, 인공지능 토픽

점추정, 구간추정

January 12, 2025 · One min read

Owner

점추정, 구간추정 개념 비교

구분	점추정	구간추정
개념도
개념	모집단의 모수를 단일 값으로 추정하는 방법	모집단의 모수가 포함될 것으로 예상되는 구간을 추정하는 방법
특징	추정 간편, 간단한 계산	추정값의 신뢰도를 포함한 정보 제공

점추정, 구간추정 개념도, 상세 비교

점추정, 구간추정 개념도 비교

점추정은 하나의 값, 구간추정은 신뢰 구간을 추정하는 방법

점추정, 구간추정 상세 비교

구분	점추정	구간추정
추정값	단일수치값	하한값과 상한값 범위
불확실성표현	직접표현안함	신뢰구간을 통해 표현
성질	불편성, 효율성, 일치성, 충분성	신뢰성
방법	MSE, 적률법, 최대가능도	표준정규분포, t분포
사용용이성	계산 간단, 해석 용이	계산 복잡, 높은 신뢰도
정보량	단일 추정치, 제한된 정보	범위, 신뢰수준 등 추가 정보 제공

베이지안 최적화

January 12, 2025 · One min read

Gracefullight

Owner

베이지안 최적화 개념

가우시안 프로세스 등 확률적 모델을 통해 함수 분포를 추정하고, 획득함수를 통해 탐색 지점을 결정하는 블랙박스 함수의 최적화 기법
기존 Grid Search, Random Search 기법 비효율 개선, 목적함수 평가 비용 최소화, 사전 지식을 통합한 확률적 모델 필요성

베이지안 최적화 개념도, 구성요소, 절차

베이지안 최적화 개념도

베이지안 최적화

이미지 출처

베이지안 최적화 구성요소

구분	내용	비고
확률적 모델	데이터와 사전지식을 결합하여 함수 분포와 불확실성 모델링	가우시안 프로세스 등
목적함수	실제 최적값을 목표로 예측의 기준이 되는 함수	블랙박스 함수
획득함수	기존 입력값과 다음 최적값을 확률로 찾는 함수	탐색지점 결정

베이지안 최적화 절차

절차	세부절차	내용
모델링	초기 데이터 수집	변수 공간에서 초기 표본 데이터 수집
	가우시안 프로세스 모델링	함수 사전 분포 정의
예측	획득 함수 계산	현재 사후 분포 기반 계산
	다음 탐색 지점 선정	획득 함수 최대화하여 우선순위 선정
평가	목적 함수 평가	선정지점에서 목적함수 평가 수행
	확률적 모델 업데이트	모델 업데이트 및 반복

인공신경망

January 8, 2025 · 2 min read

Gracefullight

Owner

인공신경망의 개념, 구성요소

인공신경망 개념

인간의 뇌 신경 구조를 모방한 기계학습 모델로 뉴런 간 연결과 가중치를 통해 데이터를 학습하고 패턴을 인식

인공신경망 구성요소

구분	설명	비고
입력층	학습을 위한 데이터 입력 계층	입력 데이터, 특징
은닉층	입출력층 사이에서 데이터 특징 추출	특징 추축, 학습, 가중치
출력층	최종 결과를 제공하는 층	결과 예측, 분류
가중치	뉴런 간 연결 강도를 나타내는 값	연결 강도, 학습 조정
활성화함수	뉴런의 출력값을 결정하는 함수	비선형성, 출력 결정

피드포워드 뉴럴네트워크 개념, 절차

FNN 개념

입력값이 출력까지 순방향으로 전달되는 구조를 가진 인공신경망

FNN 절차

절차	세부절차	설명
초기화	모델 설계	인공신경망 구조 설계
	가중치 초기화	가중치 및 편향 초기화
순방향 전파	데이터 전달	입력층에서 출력층까지 데이터 순방향 전달
	예측값 계산	입력X가중치+편향 값에 활성화함수 적용
출력	출력값 계산	분류 및 회귀 출력 값 계산
	검증	모델 성능 평가

역전파 개념, 절차

역전파 개념

Backpropagation

역방향으로 오차를 전파시켜 각 층의 가중치를 업데이트하고 최적의 학습 결과를 찾아가는 방법

역전파 절차

단계	설명	세부 내용
순전파	입력 데이터를 통해 출력값 계산	입력층 → 은닉층 → 출력층으로 데이터 전달
오차 계산	출력값과 실제값 비교	손실 함수를 사용해 오차 계산
가중치 업데이트	역전파를 통해 가중치 조정	경사하강법 등 최적화 알고리즘 사용

활성화함수 종류 및 역할

활성화함수 종류

구분	그래프	설명
Sigmoid		이진 분류 문제에 적합 경사 기울기 소실 문제
ReLU		음수는 0, 양수는 그대로 출력 DNN 가능, 계산 효율성 높음
Tanh		Sigmoid보다 수렴속도 빠름 경사 기울기 소실 문제
Leaky ReLU		ReLU 음수 기울기 문제 해결 x에 0.01 등 작은 값을 곱해줌
Swish		ReLU보다 부드러운 활성화 함수 딥러닝 모델에서 성능 개선 음수에서 미세한 값 유지, 양수에서 x와 유사한 출력

활성화함수 역할

역할	설명	예시
비선형성 부여	xor 등 복잡한 패턴을 학습할 수 있게 도움	ReLU, Sigmoid
출력값 제한	출력 값을 틍정 범위로 제한, 안정적 학습	Sigmoid, Tanh
계산 효율성 향상	불필요 계산을 줄이고 학습속도 개선	ReLU 음수값 제거

PLM, LLM

January 7, 2025 · 2 min read

Gracefullight

Owner

자연어 모델 개요

LLM History

트랜스포머 구조 등장으로 자연어 처리능력이 비약적으로 상승, 생성형 AI시대 진입

PLM 개념 및 특성

PLM 개념

대규모 텍스트 코퍼스로부터 언어 패턴을 사전 학습한 자연어 처리 모델
BERT, GPT 등이 주요한 Pre-trained Language Model로 활용

PLM 특성

특성	설명	비고
사전학습	대규모 텍스트 데이터로 비지도학습 수행 언어의 통계적 특성 학습	BERT, GPT
범용성	다양한 NLP 작업에 적용 가능 전이학습으로 성능 개선 가능	텍스트생성, 감정분석
언어이해능력	중요 단어에 더 큰 가중치 부여하여 학습 문맥적 의미 반영한 표현 생성	어텐션 매커니즘

LLM 생성과정 및 특성

LLM 생성과정

PLM에서 파라미터를 비약적으로 늘려 범용 성능을 가진 LLM 생성

LLM 특성

특성	설명	기대효과
초대형 파라미터	수십억-수천억개 이상 파라미터 확장 다양한 문맥정보를 정교하게 표현	Few-shot, Zero-shot 응답
범용성 확대	파인튜닝, RLHF 등을 통해 응답 품질개선 다중언어, 다분야 처리능력향상	범용 AI
인간수준 자연어생성	최적화를 통한 완결성있는 문장 생성 대화의 맥락 추론 가능	태스크 자동화, 효율화

PLM과 LLM 비교

구분	PLM	LLM
데이터규모	수억-수십억 토큰	수십억-수조 토큰
모델파라미터	수천만-수억 개	수십억-수천억 개
학습방식	사전학습, 파인튜닝	사전학습, 파인튜닝, 인스트럭션 튜닝
응용범위	특정 작업시 전이학습 필요	다양한 작업에 높은 성능
컴퓨팅 파워	상대적 낮음	고성능 GPU 필요

머신러닝 성능지표

January 6, 2025 · 2 min read

Gracefullight

Owner

머신러닝 성능지표 개념

실제 값과 모델에 의해 예측된 값을 비교하여 머신러닝 모델이 얼마나 잘 학습했는지 평가하기 위한 지표
지도학습, 비지도학습, 강화학습 별 다른 성능지표 활용

머신러닝 성능지표 상세

지도학습 성능지표

구분	성능지표	설명
회귀	MSE	오차를 제곱하여 평균, 값이 작을수록 우수
	RMSE	MSE의 제곱근, 해석을 용이하게 변환
	MAE	오차의 절대값의 평균, 이상치에 덜 민감
	R^2	회귀모델의 설명력을 표현, 1에 가까울수록 우수
분류	정확도	올바르게 예측한 비율, 클래스 불균형에 민감
	정밀도	Positive로 예측한 것 중 실제 Positive 비율
	재현율	실제 Positive 중 Positive로 예측한 비율
	F1 Score	정밀도와 재현율의 조화평균, 불균형 데이터셋에 우수
	AUC	ROC Curve의 면적, 종합적 성능 평가, 1에 가까울수록 우수

분류모델 성능 평가시 혼동행렬 작성 선행 필요

비지도학습 성능지표

구분	성능지표	설명
클러스터링	실루엣 지수	클러스터의 밀집 정도를 계산, 1에 가까우면 높은 성능
	Dunn Index	군집 간 거리의 최소값, 군집 내 요소 간 거리 최대값의 비율
차원축소	재구성오차	축소 복원시 원본과의 오차를 평가
	설명분산비율	축소된 차원에서 전체 데이터 분산 중 설명되는 비율
	스트레스	저차원 공간에서 고차원 데이터 간 거리의 보존 정도를 평가

강화학습 성능지표

환경과 상호작용하며 보상이 최대화되는지 평가

SOM, 자기조직화지도

January 4, 2025 · One min read

Gracefullight

Owner

SOM 개념

고차원 데이터의 위상을 보존하여 저차원 그리드로 매핑하는 비지도학습 기반 인공 신경망
차원축소, 위상보존, 경쟁학습, 시각화 및 군집화

SOM 구성도, 구성요소, ANN과의 차이점

SOM 구성도

SOM

경쟁층 뉴런들이 2차원 격자구조로 배열, 고차원 입력 데이터를 저차원 공간에 시각적으로 표현하는 구조

SOM 구성요소

구분	구성요소	설명
레이어	입력층	고차원 입력 특성을 받는 층
	경쟁층(출력층)	2D 그리드 구조로 입력 데이터와의 거리 측정 후 가장 가까운 뉴런 선정
연결요소	연결가중치	입출력층 연결, 초기 무작위 가중치 설정 후 경쟁학습을 통해 업데이트
	BMV	입력벡터와 가장 유사한 출력층 뉴런, 유클리드 최소 거리 계산

역전파와 체인룰 없이 승자 독식 경쟁학습 알고리즘 사용

SOM과 ANN의 차이점

구분	SOM	ANN
학습방식	비지도학습	비지도/지도학습
학습알고리즘	경쟁학습	역전파 등 오류수정기반
주요목적	시각화, 군집화, 차원축소	분류, 회귀, 예측
출력구조	2차원 격자	다층 퍼셉트론
데이터 요구사항	레이블 불필요	레이블 필요
활용사례	데이터 시각화, 군집 분석	이미지 인식, 음성 인식, 자연어 처리
해석가능성	결과의 직관적 해석	블랙박스, 해석 어려움

이미지 데이터 어노테이션

October 19, 2024 · One min read

Gracefullight

Owner

이미지 데이터 어노테이션 개념

인공지능 모델을 학습시키기 위해 이미지 데이터에 레이블을 붙이는 과정
이미지 수준, 객체 수준, 픽셀 수준으로 추가 정보 부여

이미지 데이터 어노테이션의 유형과 기법

이미지 데이터 어노테이션의 유형

픽셀 수준으로 갈수록 높은 정밀도, 어노테이션 비용 증가
이미지 데이터 활용 목적과 수준 및 범위에 따라 적절한 수준의 어노테이션 유형 선택

이미지 데이터 어노테이션의 기법

유형	기법	설명
이미지 수준	이미지 분류	이미지 파일 단순 분류
객체 수준	바운딩 박스	객체의 최소 사각형으로 분류
	폴리곤	객체의 윤곽을 따라 다각형으로 어노테이션
	키포인트	객체의 주요 특징점 어노테이션
	3D 큐보이드	객체를 3차원 박스로 식별하여 위치 및 크기 판별
픽셀 수준	시맨틱 세그멘테이션	이미지 각 픽셀별 클래스 지정
	인스턴스 세그멘테이션	클래스 내에서 개별 객체를 구분해 픽셀 레이블 지정

감정 인식 기술

October 5, 2024 · 2 min read

Gracefullight

Owner

감정 인식 기술 개념

자연어로 전달되는 감정을 분류하는 감정 분석 대비 표정, 음성, 자세 등을 관찰하여 광범위한 감정상태를 식별하는 기술
감정 임베딩과 대화형 봇 감정 인식 기술을 통해 다양한 상황과 사용자 요구 대응

감정 인식 기술 유형, 활용 분야

감정 임베딩 기술 유형

구분	설명	관련 기술
감정 단어 임베딩	감정 정보를 단어 임베딩으로 임베딩하는데 중점	Emo2Vec, SSWE
이모티콘 임베딩	감정을 표현하기 위해 채팅 메세지 내부 이모티콘을 임베딩	Emoji2Vec, DeepMoji
다중감정 인식용 단어 인베딩	여러 감정 레이블을 동시 할당하여 감정을 더 자세히 설명	다중라벨분류, SGM

대화형 봇 감정 인식 기술 유형

구분	설명	비고
앙상블 모델 기반 감정인식	여러 개별 모델을 결합하여 포괄적, 강인한 모델 구성	주요 감정 모델 간 가중 평균 처리
지식 표현 기반 감정인식	사전 지식에 정서어휘, 상식, 언어패턴, 정서의미규칙 등 포함하여 표현향상	어휘기반 감성 지식 통합
감정인식 위한 전이학습	부족한 훈련 데이터 문제 완화, 유도적 전이학습 사용	순차전이학습, 다중작업학습
이모티콘수용 감정인식	이모티콘 기반에 SVM 등 분류기로 감정 주석 추가	이모티콘 포함 텍스트 희소
맥락이해기반 감정인식	상황적 표현 학습 위해 발화 및 컨텍스트 수준에서 셀프 어텐션 사용	GPT-4o 등 LLM

감정 인식 기술 활용분야

구분	활용분야	비고
공공	SNS 공개 데이터 분석, 감정 모니터링 자살예방, 테러리스트 탐지	범죄예방, 안전
의료	긴급 상황에서 환자의 감정 예측	환자 의도 파악
민간	대화형 봇 감정인식 활용 감정기반 응답시스템 구축	고객응대, 마케팅

감정 인식 기술 고려사항

사용자 데이터의 최소 수집 및 목적 제한을 위한 법, 제도 마련 필요

가상화폐 스캠탐지

October 5, 2024 · 2 min read

Gracefullight

Owner

가상화폐 스캠 개념

폰지사기라고 표현되며 가격의 높은 변동성과 익명성을 악용해 투자자들을 속이는 위협
블록체인, 가상화폐의 급속한 발전으로 폰지사기, 피싱공격, 가짜 ICOs, 러그풀, 다중서명지갑 해킹 등 다양한 유형의 사기 범죄 출현

가상화폐 스캠 탐지 개념도, 분석 유형, 탐지 절차

가상화폐 스캠탐지 개념도

가상화폐 스캠탐지 분석 유형

기반	유형	내용
기계학습 기반	로지스틱 회귀	거래 데이터의 다양한 속성 기반으로 확률 분석하여 결정 경계 정의
	랜덤포레스트	다수의 결정 트리로 거래 특성 분석, 종합하여 스캠 여부 판별
	SVM	거래 데이터를 고차원에서 분류하여 최적 결정경계를 찾아서 높은 정확도
	ADABoost	약분류기 결합, 반복학습, 스캠 특성 포착
	LGBM	복잡한 거래 뎅치터를 수직적 방식으로 빠르게 탐지
딥러닝 기반	LSTM-FCN&BP	LSTM-FCN과 BP 신경망을 결합한 하이브리드 모델 사용
	LSTM-CNN	순차 데이터 처리용 LSTM과 구조적 특징 파악용 CNN 결합
그래프 기반 경로임베딩	Trans2Vec	거래량과 타임스탬프에 랜덤워크 기법과 SVM 활용 분류
	Node2Vec	EtherScanDB로 Node2Vec과 SVM 활용 분류
그래프신경망 기반 그래프 임베딩	GCN	노드와 이웃 간 정보 집계 후 노드 임베딩 생성
	TTAGN	거래내역 시간, 구조적 정보를 통합, LSTM, 어텐션 활용 스캠 탐지

가상화폐 스캠탐지 절차

가상화폐 스캠탐지시 고려사항

클래스 불균형으로 인한 오탐 방지 위해 오버샘플링, 언더샘플링, 가중치 조정 등 고려
가상화폐 거래 네트워크의 지속적 변화 학습

앙상블 모델, 배깅, 부스팅

August 24, 2024 · 2 min read

Gracefullight

Owner

앙상블 모델의 개념

여러 개별 모델을 결합하여 하나의 강력한 예측 모델을 만드는 기법
배깅은 독립적으로 학습시킨 모델의 결과를 취합하고, 부스팅은 순차학습시켜 이전 모델의 오차를 보완하는 기법

배깅, 부스팅의 구성도, 구성요소

배깅의 구성도, 구성요소, 비교

다수 모델을 학습시켜 예측 결과 도출

구분	내용	비고
랜덤 샘플링	원본 데이터셋을 복원 추출	개별 모델 다양성 확보, 과적합 방지
병렬모델학습	각 모델을 독립적으로 학습 수행	랜덤 포레스트 등 결정 트리 기반
예측 결합	각 예측 데이터를 합산하여 결과 도출	평균, 투표

부스팅의 구성도, 구성요소

모델을 순차적으로 학습, 가중치 반영하여 예측 결과 도출

구분	내용	비고
순차모델 학습	이전 모델의 오차를 보완하여 학습	오차 감소
가중치 업데이트	오차가 큰 데이터에 높은 가중치 부여	오답 집중 학습
반복 학습	가중치 반영 모델 반복 학습	순차 실행
예측 결합	모든 모델 예측에 가중치 반영한 평균 계산	그라디언트 부스팅, XGBoost, CatBoost

배깅, 부스팅 비교

구분	배깅	부스팅
목표	분산 감소, 과적합 방지	편향 감소
계산 비용	빠름, 병렬	느림, 순차
결합 방식	평균, 투표	가중 평균

데이터 분산, 편향을 참조하여 앙상블 기법 선택

점추정, 구간추정 개념 비교​

점추정, 구간추정 개념도, 상세 비교​

점추정, 구간추정 개념도 비교​

점추정, 구간추정 상세 비교​

베이지안 최적화 개념​

베이지안 최적화 개념도, 구성요소, 절차​

베이지안 최적화 개념도​

베이지안 최적화 구성요소​

베이지안 최적화 절차​

인공신경망의 개념, 구성요소​

인공신경망 개념​

인공신경망 구성요소​

피드포워드 뉴럴네트워크 개념, 절차​

FNN 개념​

FNN 절차​

역전파 개념, 절차​

역전파 개념​

역전파 절차​

활성화함수 종류 및 역할​

활성화함수 종류​

활성화함수 역할​

자연어 모델 개요​

PLM 개념 및 특성​

PLM 개념​

PLM 특성​

LLM 생성과정 및 특성​

LLM 생성과정​

LLM 특성​

PLM과 LLM 비교​

머신러닝 성능지표 개념​

머신러닝 성능지표 상세​

지도학습 성능지표​

비지도학습 성능지표​

강화학습 성능지표​

SOM 개념​

SOM 구성도, 구성요소, ANN과의 차이점​

SOM 구성도​

SOM 구성요소​

SOM과 ANN의 차이점​

이미지 데이터 어노테이션 개념​

이미지 데이터 어노테이션의 유형과 기법​

이미지 데이터 어노테이션의 유형​

이미지 데이터 어노테이션의 기법​

감정 인식 기술 개념​

감정 인식 기술 유형, 활용 분야​

감정 임베딩 기술 유형​

대화형 봇 감정 인식 기술 유형​

감정 인식 기술 활용분야​

감정 인식 기술 고려사항​

가상화폐 스캠 개념​

가상화폐 스캠 탐지 개념도, 분석 유형, 탐지 절차​

가상화폐 스캠탐지 개념도​

가상화폐 스캠탐지 분석 유형​

가상화폐 스캠탐지 절차​

가상화폐 스캠탐지시 고려사항​

앙상블 모델의 개념​

배깅, 부스팅의 구성도, 구성요소​

배깅의 구성도, 구성요소, 비교​

부스팅의 구성도, 구성요소​

배깅, 부스팅 비교​

점추정, 구간추정 개념 비교

점추정, 구간추정 개념도, 상세 비교

점추정, 구간추정 개념도 비교

점추정, 구간추정 상세 비교

베이지안 최적화 개념

베이지안 최적화 개념도, 구성요소, 절차

베이지안 최적화 개념도

베이지안 최적화 구성요소

베이지안 최적화 절차

인공신경망의 개념, 구성요소

인공신경망 개념

인공신경망 구성요소

피드포워드 뉴럴네트워크 개념, 절차

FNN 개념

FNN 절차

역전파 개념, 절차

역전파 개념

역전파 절차

활성화함수 종류 및 역할

활성화함수 종류

활성화함수 역할

자연어 모델 개요

PLM 개념 및 특성

PLM 개념

PLM 특성

LLM 생성과정 및 특성

LLM 생성과정

LLM 특성

PLM과 LLM 비교

머신러닝 성능지표 개념

머신러닝 성능지표 상세

지도학습 성능지표

비지도학습 성능지표

강화학습 성능지표

SOM 개념

SOM 구성도, 구성요소, ANN과의 차이점

SOM 구성도

SOM 구성요소

SOM과 ANN의 차이점

이미지 데이터 어노테이션 개념

이미지 데이터 어노테이션의 유형과 기법

이미지 데이터 어노테이션의 유형

이미지 데이터 어노테이션의 기법

감정 인식 기술 개념

감정 인식 기술 유형, 활용 분야

감정 임베딩 기술 유형

대화형 봇 감정 인식 기술 유형

감정 인식 기술 활용분야

감정 인식 기술 고려사항

가상화폐 스캠 개념

가상화폐 스캠 탐지 개념도, 분석 유형, 탐지 절차

가상화폐 스캠탐지 개념도

가상화폐 스캠탐지 분석 유형

가상화폐 스캠탐지 절차

가상화폐 스캠탐지시 고려사항

앙상블 모델의 개념

배깅, 부스팅의 구성도, 구성요소

배깅의 구성도, 구성요소, 비교

부스팅의 구성도, 구성요소

배깅, 부스팅 비교