본문으로 건너뛰기

"pe/computer-architecture" 태그로 연결된 27개 게시물개의 게시물이 있습니다.

기술사 컴퓨터 아키텍처 토픽

모든 태그 보기

Thrashing, 스레싱

· 약 3분

스레싱의 개념

  • 멀티프로세싱 환경에서 빈번한 페이지 교체로 실제 프로세스 실행보다 페이지 교체에 더 많은 시간을 소요하여 프로세스 성능이 낮아지는 이상현상

프로세스 스레싱의 개념도, 원인, 해결방안

프로세스 스레싱의 개념도

  • 다중 프로그래밍의 정도가 높아짐에 따라 프로세서 이용률이 향상되지맂 임계치 도달 후 프로세서 이용률이 낮아짐

프로세스 스레싱의 원인

구분원인내용
리소스 부족저사양 CPUCPU 코어부족, 속도 부족
-메모리 용량 부족용량 부족으로 인한 가상메모리 사용 증가
부적절한 페이지 교체 정책지역성 미고려페이지 교체 정책 효율성 저하
-페이지 빈도 미고려부적절한 페이지 교체 알고리즘 사용
과도한 멀티프로그래밍다중 프로세스 수용 초과과도한 멀티프로그래밍으로 페이지 폴트
-페이지 교체 수용 추가페이지 수 초과로 인한 페이지 폴트
  • Working Set Model, Page Fault Frequency 기버을 통해 발생을 최소화하는 것이 최선의 방법

프로세스 스레싱 해결방안

  • Working Set: 프로세스가 자주 참조하는 페이지 집합을 메모리에 상주시켜 교체 감소
  • Page Fault Frequency: 페이지 부재율상한, 하한을 정하여 직접 페이지 부재율을 예측하여 프레임 할당, 프레임 회수하여 페이지 교체 감소

스레싱 발생시 고려사항

  • 자주 사용하는 프로세스에 높은 우선순위를 부여하여 중요 작업이 원활히 수행 가능하도록 처리

PNM, Processing Near Memory

· 약 3분

PNM의 개념

  • 메모리와 프로세서를 다이 차원에서 가깝게 연결하여 별도의 논리연산을 수행하는 메모리
  • 메모리 접근을 위한 병목 최소화, 대역폭 최대화 가능

PNM의 구성도, 구성요소, 적용방안

PNM의 구성도

PNM의 구성요소

구분내용비고
프로세서연산처리 담당 중앙처리장치데이터 처리
고속 인터페이스메모리와 프로세서 간 통신 속도 향상CXL 등
DRAM Cell대용량 휘발성 기억 장치데이터 저장
다이회로가 제작된 공간직접회로 연결
  • 다이 접합과 인터페이스 통합으로 제작이 가능하기에 기존 프로세서 사용 용이

PNM 활용방안

구분내용비고
데이터 집중형 앱데이터 접근 빈도가 높은 어플리케이션 적용빅데이터 분석, LLM 등
실시간 처리 앱실시간 데이터 처리가 필요한 슈퍼컴퓨팅에 활용금융모델, 기상 예보 등
저전력 앱높은 전성비를 유지해야하는 환경모바일, 임베디드시스템 등

PNM 고려사항

  • CPU와 PNM간 메모리 데이터 저장시 경합을 고려한 SW개발 필요

페이징, 세그먼테이션

· 약 3분

메모리 관리 기법의 개념

  • 제한된 메모리 리소스를 효율적으로 사용하기 위해 메모리 관리 기법 필요

페이징 기법, 세그먼테이션 기법 개념도, 핵심요소

페이징 기법, 세그먼테이션 기법 개념도

  • 페이징 기법은 동일한 크기로, 세그먼테이션 기법은 가변크기로 분할

페이징 기법, 세그먼테이션 기법 핵심요소

구분페이징세그먼테이션
단위크기고정, 페이지가변, 세그먼트
외부단편화없음있음
내부단편화있음없음
주소사상페이지테이블세그먼트테이블
복잡성단순주소, 사이즈 관리 복잡
프로세스 간 공유어려움용이
교체시간짧은느림
  • 페이징 기법의 메모리 관리 효율성, 세그먼테이션 기법의 논리적 메모리 관리 이점을 결합한 페이지드 세그먼테이션 기법 사용

페이지드 세그먼테이션 기법

  • 파일 관리는 세그먼트 단위로, 프로그램 조각은 페이지 단위로 관리

메모리 관리 기법 선택시 고려사항

  • 외부단편화와 내부단편화를 줄이기 위해 버디메모리, 슬랩할당자 기법 사용 고려.
  • 스레싱이 발생하지 않게 적절한 테이블 크기 설정

뉴로모픽 칩

· 약 3분

뉴로모픽 칩의 개요

  • 인간의 뇌를 모방하여 정보를 연산, 저장하는 비 폰노이만 구조의 저전력, 고성능 칩
  • 기존 폰노이만 구조의 프로세서로 연산하기 어려운 인공지능, 시뮬레이션 등 병렬 작업을 처리하기 위해 필요

뉴로모픽 칩의 구성도, 구성요소, NPU와 비교

뉴로모픽 칩의 구성도

뉴로모픽 칩의 구성요소

구분내용비고
뉴로모픽 칩시냅스와 뉴런으로 구성, 스파이크 자극에 의해 유기적으로 자율 조절인간 뇌와 같이 저전력으로 학습
스파이킹 신경망, SNN생물학적 신경 네트워크 구조를 모방대규모 병렬 연산, 가중치 전달
뉴로모픽 소자뉴런과 시냅스를 구성하는 핵심 소자로 메모리와 레지스터의 결합멤리스터
PIM뉴런을 배열하여 스파이크 입력 변환, 뉴런 배열에서의 스파이크 발화 동작 및 학습, 학습 결과 특성 분류 수행SRAM 기반

NPU와 뉴로모픽 침의 차이점

구분NPU뉴로모픽 칩
구조폰노이만생물의 뉴런 시스템
목적GPU를 CPU로 만들어 연산 활용메모리를 CPU로 만들어 연산 활용
중점인공신경망 연산의 효율적 수행인공신경망 외 다양한 프로그램 연산
관련 업체엔비디아 등IBM, 인텔 등
장점LLM 등 인공지능 모델 확산 기여전력, 면적, 성능 등에서 압도적 결과
단점대규모 데이터센터 공간/전력 소모뉴로모픽 칩 개발의 어려움

뉴로모픽 칩 고려사항

  • 뉴로모픽 하드웨어를 최대한 활용할 수 있는 알고리즘 및 SW개발, 연구 병행 필요

세마포어

· 약 3분

세마포어의 개념

  • 멀티 프로그래밍 환경에서 두 개의 원자적 함수로 공유 자원에 대한 접근을 제한하는 방법
  • 임계구역에 상호접근할 수 있는 기능을 수행하여 교착상태 방지

세마포어 개념도, P연산, V연산

세마포어 개념도

세마포어 연산

구분P 연산, WaitV 연산, Signal
개념리소스에 접근하기 위해 다른 태스크가 끝나기까지 대기임계영역을 나오면서 다른 태스크가 접근하도록 변경
로직세마포어 S의 Count를 1 감소세마포어 S의 Count를 1 증가
슈도코드P(S) { while S <= 0; S--; }V(S) { S++; }
  • 세마포어에 접근시킬 스레드의 갯수에 따라 이진 세마포어, 계수형 세마포어 선택

세마포어의 유형

구분내용비고
이진 세마포어상호배제나 프로세스 동기화 목적으로 사용0 or 1
계수형 세마포어초기에 동시에 진입 가능한 프로세스 개수 정의 가능0,1,2,3...

세마포어 고려사항

  • 세마포어의 직접 제어로 인한 오류 가능성, 난해성을 보완하기 위해 프로그래밍 언어 수준에서 모니터 기법 사용

Pollack's Rule, 폴락의 법칙

· 약 2분

폴락의 법칙 개념

  • 마이크로프로세서의 성능은 면적(트랜지스터 수)의 제곱근과 비례한다는 법칙
    • 성능은 면적의 제곱근에 비례 <-> 면적은 성능의 제곱에 비례

폴락의 법칙 관계도, 특징

폴락의 법칙 관계도

폴락의 법칙 특징

구분내용지표
복잡성 증가트랜지스터 수 증가, 설계 복잡도 증가LOC 측정
생산성 감소개발 기간 증가, 생산 비용 증가프로젝트 생산성 평가 지표
품질과 생산성오류 발생 가능성 증가, 생산 수율 감소프로세스 관리

폴락의 법칙으로 인한 프로세서 발전 동향

구분내용비고
멀티코어 프로세서분할, 병렬처리 프로세서 개발라이젠, 인텔, 애플M
저전력 프로세서에너지효율적인 프로세서 개발퀄컴, 애플A
연산 가능한 메모리메모리에서 연산 처리PIM

TCAM, Ternary Content Addressable Memory

· 약 3분

TCAM 개념

  • 0, 1, X(Don't care) 세 가지 상태를 저장하는 메모리 셀로 구성되어, 데이터 검색과 비교를 내용 기반으로 병렬로 수행하는 메모리.
  • RAM은 주소기반으로 데이터 읽기/쓰기, TCAM은 내용 기반으로 데이터 검색
  • CAM은 0,1 exact matching, TCAM은 0,1,X wildcard matching

TCAM의 구성도, 구성요소 활용사례

TCAM의 구성도

TCAM의 구성요소

구분내용비고
Search Line검색어를 입력하는 라인각 비트는 0, 1, X 값
메모리 셀3진 데이터(0, 1, X) 상태 저장낮은 공간 효율
Match Line검색 결과를 출력하는 라인각 메모리 워드마다 하나씩 존재
Priority Encoder여러 Match Line 중 가장 높은 우선순위의 일치 결과를 선택사용자 설정 가능
  • TCAM의 구성요소는 3상태 저장, 고속 비교 및 우선순위 결정 기능을 통해 빠른 데이터 검색을 가능하게함.

TCAM 활용사례

구분내용비고
네트워크 라우터IP 주소 기반 패킷 분류 및 포워딩빠른 패킷 처리 속도
네트워크 방화벽패킷 필터링 규칙과 패킷 헤더 비교높은 보안성
데이터베이스데이터 검색 및 필터링복잡한 질의 처리 가능

TCAM 발전방향

  • 저전력 설계: TCAM은 높은 전력 소모 단점
  • 고집적화: 단위 면적 당 더 많은 메모리 셀 집적하여 용량 증대, 비용 절감