Skip to main content

41 posts tagged with "pe/algorithm"

기술사 알고리즘, 인공지능 토픽

View All Tags

생성형 AI 비지니스 모델

· 5 min read

생성형 AI 개념

  • 인간의 창의성을 모방하여 새로운 콘텐츠를 자동으로 생성하는 혁신적 기술
  • 파운데이션 모델로 전반적 AI 제공, 모델 사전 훈련 통한 학흡 능력 향상, 다양한 문제 해결 능력, 애플리케이션 개발 용이성, 속도 향상

생성형 AI 기술스택, 비지니스 모델, 한계점

생성형 AI 기술스택

  • 생성형 인공지능 모델을 활용하여 최종 사용자를 위한 기능과 서비스 구현

생성형 AI 비지니스 모델

구분내용비고
API 플랫폼 제공고성능 AI 챗봇 API를 개발자에게 제공하여 다양한 서비스 개발을 지원ChatGPT API
맞춤형 AI 솔루션 구축기업 요구에 맞는 맞춤형 생성형 AI 솔루션 개발TabNine
콘텐츠 제작 및 큐레이션텍스트, 이미지, 음악 등 콘텐츠를 생성하고 이를 큐레이션하여 제공DeepAI, Luminovo
데이터 레이블링 및 정제AI 학습용 데이터를 레이블링하고 정제하는 서비스 제공SageMaker
AI 기반 교육 및 컨설팅AI 기술을 효과적으로 적용하기 위한 교육 및 컨설팅 서비스 제공AI디지털교과서

생성형 AI 한계점

구분내용비고
기술적 한계할루시네이션 (잘못된 정보 제공)데이터 검증 강화, 품질 높은 학습 데이터 사용
방대한 컴퓨팅 자원과 높은 비용 요구효율적인 모델 설계, 비용 절감 기술 개발
심각한 에너지 소비와 온실가스 배출친환경 AI 기술 개발, 에너지 최적화 노력
윤리/사회적 한계가짜뉴스, 딥페이크, 저작권 침해윤리 가이드라인 수립, 법적 규제 강화
일자리 감소와 노동시장 변화 가속화재교육 프로그램 도입, 새로운 일자리 창출 정책 개발

생성형 AI 비지니스 고려사항

구분내용비고
정부윤리적 가이드라인 마련 및 법적 규제 강화가짜뉴스 및 저작권 문제 예방
기술 연구개발 지원 및 인재 양성 프로그램 추진친환경 AI 기술 개발 지원
국제 협력을 통한 AI 정책 조율글로벌 표준화 노력
기업혁신적인 비즈니스 모델 구축기존 서비스 개선, 신규 사업 기회 창출
AI 기술 활용을 위한 조직 혁신변화하는 시장에 적응
지속 가능성을 위한 기술 투자에너지 효율 및 비용 절감 기술 개발
개인AI 기술 활용 능력과 창의적 문제 해결 역량 강화재교육 및 학습 기회 활용
윤리적 AI 사용에 대한 인식 제고정보 검증 능력 배양
사회 변화에 능동적 대응변화에 적응할 준비

참조

설비 예지정비, LangChain

· 4 min read

설비 예지정비 개념

  • 설비의 상태 데이터를 분석하여 고장 가능성을 사전에 예측하고, 필요한 유지보수를 미리 수행함으로써 비계획적인 가동 중단을 방지하고 설비 수명을 연장하는 기술
  • 장비 신뢰성 향상, 운영 효율성 극대화, 유지보수 비용 절감, 안전성 강화, 생산성 증대, 데이터 활용 극대화

LangChain 프레임워크, LLM

LangChain 프레임워크 개념

  • 대규모 언어모델을 활용한 서비스 개발 시 여러 언어모델과의 통합을 간소화하도록 설계된 애플리케이션 개발 프레임워크

LLM 개념

  • 대량의 텍스트 데이터를 학습하여 인간과 유사한 언어 이해 및 생성 능력을 갖춘 초거대 언어 AI 모델

LangChain을 이용한 설비 예지정비

LangChain을 이용한 설비 예지정비 매커니즘

LangChai을 이용한 설비 예지정비 기능

구분기능상세 설명
데이터 수집IoT 및 센서 통합실시간 제조설비 데이터 수집 및 저장
데이터 분석LLM 기반 패턴 분석이상 징후 탐지, 고장 원인 규명, 상관분석 수행
프로세스 마이닝핵심 프로세스 분석빅데이터 기반으로 설비 운영 프로세스 최적화
진단/관리/정비이상 진단 및 사전 경고고장 예측 및 사전 경고 시스템 구축
사용자 인터페이스직관적 시각화대시보드 형태로 실시간 상태 모니터링 제공

TF-IDF

· 3 min read

TF-IDF 개념

  • 정보검색과 텍스트마이닝에서 여러 문서 내 어떤 단어가 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 가중치

TF-IDF 구성, 산출방법, 활용분야

TF-IDF 구성

구분내용비고
TF특정 단어가 문서 내에서 얼마나 자주 등장하는지 나타내는 값Boolean 빈도, 로그 스케일빈도, 증가 빈도
DF특정 단어가 문서 집합 전체에서 나타나는 빈도높을시 흔한 단어
IDF전체 문서 수를 해당 단어를 포함한 문서 수로 나눈 후 로그 처리높을시 중요 단어
TF-IDF특정 문서 내에서 단어 빈도가, 전체 문서 중 그 단어를 포함한 문서가 적을 수록 높아짐TFIDFTF*IDF

TF-IDF 산출 방법

단어문서1문서2TFDFIDF
엔진15102520
모터30310.301
타이어23520
  • 통상적으로 분모에 1을 더하여 로그를 취함
  • 엔진: 0, 모터: 0.903, 타이어: 0
  • 식별결과 '모터'가 가장 중요한 단어로 판단

TF-IDF 활용분야

구분설명예시
검색 엔진사용자가 입력한 키워드와 가장 관련성 높은 문서 검색검색 순위 결정
문서 분류 및 클러스터링문서를 주제별로 분류하거나 유사한 문서를 그룹화뉴스 기사 자동 분류
텍스트 요약 및 키워드 추출중요한 키워드를 추출하여 텍스트를 요약논문 초록 생성

선형 자료구조, 스택, 큐, 리스트

· 3 min read

선형 자료구조 개념

스택 입출력 원리, 활용 예시

스택 입출력 원리

  • 개념도
구분내용
입출력 원리LIFO 원칙으로 가장 마지막에 삽입된 데이터가 가장 먼저 나오는 자료구조
구성PUSH스택의 맨 위에 데이터 추가
POP스택의 맨 위에 잇는 데이터 제거하고 반환
TOP스택에서 삽입, 삭제가 일어나는 리스트의 끝

스택 활용 예시

  • 괄호의 짝 검사
  • 함수 호출, 복귀 순서 관리
  • 웹 브라우저 히스토리
  • 실행취소

큐 입출력 원리, 활용 예시

큐 입출력 원리

  • 개념도
구분내용
입출력 원리선형리스트 한 쪽에서는 삽입이 일어나고, 다른 한 쪽에서는 삭제만 이뤄지도록하여 먼저 들어온 데이터가 먼저 나가는 자료구조
구성Front리스트 맨 앞 출력부
Rear리스트 맨 뒤 입력부
EnqueueRear에 데이터를 삽입하는 작업
DequeueFront에서 데이터를 삭제하는 작업

큐 활용 예시

  • 대기열에 사용: 서로 다른 쓰레드 사이, 프로세스 사이, 네트워크 데이터 전송
  • 웹 서버 요청
  • 너비 우선 탐색

리스트 입출력 원리, 활용 예시

리스트 입출력 원리

  • 개념도
구분내용
입출력 원리순서를 가진 데이터의 집합으로, 배열 기반 또는 링크드 리스트 기반으로 데이터 저장하는 자료구조
구성Insert리스트의 특정 위치에 데이터 삽입
Delete리스트 특정 위치의 데이터 제거

리스트 활용 예시

  • 트리, 그래프 등 계층 구조 구현
  • 커널 모드 프로그래밍

중심극한정리, t검정, z검정

· 3 min read

추론통계 개념

  • 샘플데이터를 기반으로 모집단의 특성을 추론하거나 가설을 검증하는 통계방법
  • 표본추출
    • 랜덤추출
    • 계통추출
    • 집락추출
    • 층화추출
  • 기술통계
    • 평균
    • 분산
    • 표준편차
  • 추론
    • 점추정
    • 구간추정
  • 가설검정
    • 모수검정
    • 비모수검정

중심극한정리 개념 및 특징

중심극한정리 개념도

CLT

  • 모집단으로부터 추출된 표본의 크기가 충분히 커지면 모집단 표본 분포와 상관없이 표본들의 평균분포가 표준정규분포를 따른다는 법칙
  • 이미지출처

중심극한정리 특징

구분특징내용
통계적 추론정규분포 근사화표본 평균을 정규분포에 근사화하여 통계적 추론을 간편하게 만들어줌
-추론 강화적은 표본에도 모집단 추론 가능
표본과 모집단표본 크기 영향표본 크기 중에서 중심극한정리 적용 용이
-모집단 분포 독립적모집단 데이터 분포에 상관없이 평균분포 근사값 제공
  • 모집단의 분포가 정규분포가 아니여도 중심극한정리에 의해 정규분포로 가정 후 통계분석 가능

T검정, Z검정 비교

T검정, Z검정 관계도

T검정, Z검정 상세비교

구분T검정Z검정
모집단 정보표준편차 모를 때 사용표준편차 알 때 사용
표본 크기소규모대규모
유연성표본 크기가 작아도 정확한 추론표본 크기 작으면 부정확
분포 사용T분포Z분포
예시학생성적 비교, 소규모 실험 전/후 비교공장 생산품질 비교, 대규모 설문조사 분석

다중공선성

· 2 min read

다중공선성 개념

  • 다중회귀분석에서 일부 독립변수들 간 높은 상관관계가 존재해 데이터 분석시 부정적인 영향을 미치는 현상
  • 독립 변수 간 상관관계, 예측 신뢰도 저하, 모델 해석의 어려움

다중공선성 개념도, 상세설명

다중공선성 개념도

Multicolinearity

  • 독립변수 간 상관관계가 강하여 결정계수 값이 높아 과적합 발생

다중공선성 상세설명

구분항목내용
판단기준상관계수독립변수 간 상관계수가 0.7 이상인 경우 의심
-분산팽창요인VIF 값이 10을 넘는 경우 다중공선성 존재 판단
-결정계수R2R^2는 높지만 p-value도 높은 경우 의심
해결방법변수제거상관 관계를 가진 변수를 제거하여 공선성 완화
-변수변환로그변환, 정규화 통한 변수 관계 조정
-PCA고차 데이터를 선형독립적인 주성분으로 변환하여 공선성 제거

점추정, 구간추정

· 2 min read

점추정, 구간추정 개념 비교

구분점추정구간추정
개념모집단의 모수를 단일 값으로 추정하는 방법모집단의 모수가 포함도리 것으로 예상되는 구간을 추정하는 방법
특징추정 간편, 간단한 계산추정값의 신뢰도를 포함한 정보 제공

점추정, 구간추정 개념도, 상세 비교

점추정, 구간추정 개념도 비교

  • 점추정은 하나의 값, 구간추정은 신뢰 구간을 추정하는 방법

점추정, 구간추정 상세 비교

구분점추정구간추정
추정값단일수치값하한값과 상한값 범위
불확실성표현직접표현안함신뢰구간을 통해 표현
성질불편성, 효율성, 일치성, 충분성신뢰성
방법MSE, 적률법, 최대가능도표준정규분포, t분포
사용용이성계산 간단, 해석 용이계산 복잡, 높은 신뢰도
정보량단일 추정치, 제한된 정보범위, 신뢰수준 등 추가 정보 제공

베이지안 최적화

· 3 min read

베이지안 최적화 개념

  • 가우시안 프로세스 등 확률적 모델을 통해 함수 분포를 추정하고, 획득함수를 통해 탐색 지점을 결정하는 블랙박스 함수의 최적화 기법
  • 기존 Grid Search, Random Search 기법 비효율 개선, 목적함수 평가 비용 최소화, 사전 지식을 통합한 확률적 모델 필요성

베이지안 최적화 개념도, 구성요소, 절차

베이지안 최적화 개념도

베이지안 최적화

베이지안 최적화 구성요소

구분내용비고
확률적 모델데이터와 사전지식을 결합하여 함수 분포와 불확실성 모델링가우시안 프로세스 등
목적함수실제 최적값을 목표로 예측의 기준이 되는 함수블랙박스 함수
획득함수기존 입력값과 다음 최적값을 확률로 찾는 함수탐색지점 결정

베이지안 최적화 절차

절차세부절차내용
모델링초기 데이터 수집변수 공간에서 초기 표본 데이터 수집
-가우시안 프로세스 모델링함수 사전 분포 정의
예측획득 함수 계산현재 사후 분포 기반 계산
-다음 탐색 지점 선정획득 함수 최대화하여 우선순위 선정
평가목적 함수 평가선정지점에서 목적함수 평가 수행
-확률적 모델 업데이트모델 업데이트 및 반복

인공신경망

· 5 min read

인공신경망의 개념, 구성요소

인공신경망 개념

  • 인간의 뇌 신경 구조를 모방한 기계학습 모델로 뉴런 간 연결과 가중치를 통해 데이터를 학습하고 패턴을 인식

인공신경망 구성요소

구분설명비고
입력층학습을 위한 데이터 입력 계층입력 데이터, 특징
은닉층입출력층 사이에서 데이터 특징 추출특징 추축, 학습, 가중치
출력층최종 결과를 제공하는 층결과 예측, 분류
가중치뉴런 간 연결 강도를 나타내는 값연결 강도, 학습 조정
활성화함수뉴런의 출력값을 결정하는 함수비선형성, 출력 결정

피드포워드 뉴럴네트워크 개념, 절차

FNN 개념

  • 입력값이 출력까지 순방향으로 전달되는 구조를 가진 인공신경망

FNN 절차

절차세부절차설명
초기화모델 설계인공신경망 구조 설계
-가중치 초기화가중치 및 편향 초기화
순방향 전파데이터 전달입력층에서 출력층까지 데이터 순방향 전달
-예측값 계산입력X가중치+편향 값에 활성화함수 적용
출력출력값 계산분류 및 회귀 출력 값 계산
-검증모델 성능 평가

역전파 개념, 절차

역전파 개념

Backpropagation

  • 역방향으로 오차를 전파시켜 각 층의 가중치를 업데이트하고 최적의 학습 결과를 찾아가는 방법

역전파 절차

단계설명세부 내용
순전파입력 데이터를 통해 출력값 계산입력층 → 은닉층 → 출력층으로 데이터 전달
오차 계산출력값과 실제값 비교손실 함수를 사용해 오차 계산
가중치 업데이트역전파를 통해 가중치 조정경사하강법 등 최적화 알고리즘 사용

활성화함수 종류 및 역할

활성화함수 종류

구분그래프설명
SigmoidSigmoid이진 분류 문제에 적합
경사 기울기 소실 문제
ReLUReLU음수는 0, 양수는 그대로 출력
DNN 가능, 계산 효율성 높음
TanhTanhSigmoid보다 수렴속도 빠름
경사 기울기 소실 문제
Leaky ReLULeaky ReLUReLU 음수 기울기 문제 해결
x에 0.01 등 작은 값을 곱해줌
SwishSwishReLU보다 부드러운 활성화 함수
딥러닝 모델에서 성능 개선
음수에서 미세한 값 유지, 양수에서 x와 유사한 출력

활성화함수 역할

역할설명예시
비선형성 부여xor 등 복잡한 패턴을 학습할 수 있게 도움ReLU, Sigmoid
출력값 제한출력 값을 틍정 범위로 제한, 안정적 학습Sigmoid, Tanh
계산 효율성 향상불필요 계산을 줄이고 학습속도 개선ReLU 음수값 제거

PLM, LLM

· 3 min read

자연어 모델 개요

LLM History

  • 트랜스포머 구조 등장으로 자연어 처리능력이 비약적으로 상승, 생성형 AI시대 진입

PLM 개념 및 특성

PLM 개념

  • 대규모 텍스트 코퍼르소부터 언어 패턴을 사전 학습한 자연어 처리 모델
  • BERT, GPT 등이 주요한 Pre-trained Language Model로 활용

PLM 특성

특성설명비고
사전학습대규모 텍스트 데이터로 비지도학습 수행
언어의 통계적 특성 학습
BERT, GPT
범용성다양한 NLP 작업에 적용 가능
전이학습으로 성능 개선 가능
텍스트생성, 감정분석
언어이해능력중요 단어에 더 큰 가중치 부여하여 학습
문맥적 의미 반영한 표현 생성
어텐션 매커니즘

LLM 생성과정 및 특성

LLM 생성과정

  • PLM에서 파라미터를 비약적으로 늘려 범용 성능을 가진 LLM 생성

LLM 특성

특성설명기대효과
초대형 파라미터수십억-수천억개 이상 파라미터 확장
다양한 문맥정보를 정교하게 표현
Few-shot, Zero-shot 응답
범용성 확대파인튜닝, RLHF 등을 통해 응답 품질개선
다중언어, 다분야 처리능력향상
범용 AI
인간수준 자연어생성최적화를 통한 완결성있는 문장 생성
대화의 맥락 추론 가능
태스크 자동화, 효율화

PLM과 LLM 비교

구분PLMLLM
데이터규모수억-수십억 토큰수십억-수조 토큰
모델파라미터수천만-수억 개수십억-수천억 개
학습방식사전학습, 파인튜닝사전학습, 파인튜닝, 인스트럭션 튜닝
응용범위특정 작업시 전이학습 필요다양한 작업에 높은 성능
컴퓨팅 파워상대적 낮음고성능 GPU 필요