봉황대 in CS

[Chapter 2. 명령어: 컴퓨터 언어] 명령어의 컴퓨터 내부 표현, MIPS 명령어 형식 : R-format, I-format 본문

Computer Science & Engineering/Computer Architecture

[Chapter 2. 명령어: 컴퓨터 언어] 명령어의 컴퓨터 내부 표현, MIPS 명령어 형식 : R-format, I-format

등 긁는 봉황대 2022. 8. 18. 17:03

* 본 글은 '컴퓨터 구조 및 설계: 하드웨어/소프트웨어 인터페이스(Computer Organization and Design: The Hardware/Software Interface) 5th edition'의 내용과 2021학년도 1학기에 수강한 '컴퓨터 구조' 과목 강의 내용을 함께 정리하여 작성하였습니다.

 

컴퓨터의 2가지 중요한 원칙과 내장 프로그램


1. 명령어는 숫자로 표현된다.

 

명령어는 컴퓨터 내부에서 높고 낮은 전기 신호의 연속(이진수)으로 저장되므로 숫자로 표현할 수 있다.

실제로 명령어의 각 부분을 숫자로 볼 수 있고, 이 숫자들을 나란히 늘어놓으면 명령어가 된다.

 

2. 프로그램은 메모리에 기억되어 있어서 숫자처럼 읽고 쓸 수 있다.

 

이 두 원칙은 내장 프로그램의 개념이 된다.

 

 

내장 프로그램 개념은 회계 처리를 하던 컴퓨터가 눈 깜짝할 사이에 작가의 원고 집필을 도와주는 컴퓨터로 변할 수 있게 한다.

 

프로그램과 데이터를 메모리에 적재하고 컴퓨터한테 어떤 위치에서 실행을 시작할지만 알려주면 이런 전환이 일어난다.

명령어를 데이터와 똑같이 취급함으로써 컴퓨터 시스템의 메모리 하드웨어와 소프트웨어가 모두 간단해진다.

 

특히 데이터 저장을 위해 개발된 메모리 기술이 프로그램 저장에도 그대로 사용되며,

컴파일러 같은 프로그램이 인간에게 편리한 형태로 작성된 코드를 컴퓨터가 이해할 수 있는 코드로 바꿀 수 있는 것도 이 특성 덕분이다.

 

 

즉, 명령어를 숫자처럼 취급하게 된 결과 프로그램이 이진수 파일 형태로 판매되게 되었고

이것이 만약 기존 명령어 집합과 호환성이 있다면, 다른 컴퓨터의 소프트웨어를 물려받을 수 있다는 것이다.

 

이를 이진 호환성(binary compatibility)이라고 한다.

 

MIPS-32 ISA


* ISA : Instruction Set Architecture

 

MIPS 명령어의 길이는 데이터 워드와 마찬가지로 32비트의 길이를 가진다.

"간단하게 하기 위해서는 규칙적인 것이 좋다"라는 설계 원칙에 따라 모든 MIPS 명령어는 예외 없이 32비트이다.

 

명령어의 종류마다 이 32비트가 가지고 있는 형식들이 정해져 있다.

 

 

 

Mips opcodes

MIPS Instruction Types Type R I J -31format (bits) -0opcode (6) rs (5) rt (5) rd (5) shamt (5) funct (6) opcode (6) rs (5) rt (5) immediate (16) opcode (6) add…

www.slideshare.net

 

MIPS R-format Instruction

R : Register

 

피연산자가 두 개 있고 목적지가 하나인 명령어에 쓰인다. (add, sub, and 등의 산술 연산)

 

 

  • op : 명령어가 실행할 연산의 종류로서 연산자(opcode)라고 부른다.
  • rs : 첫 번째 근원지(source) 피연산자 레지스터
  • rt : 두 번째 근원지(source) 피연산자 레지스터
  • rd : 목적지(destination) 레지스터. 연산의 결과가 기억된다.
  • shamt : 자리이동(shift) 연산 시 shift 양을 나타낸다. (shift 연산이 아닐 시 0으로 채워 둠)
  • funct : 기능 코드(function code). op 필드에서 연산의 종류를 표시하고 funct 필드에서 그중의 한 연산을 구체적으로 저장한다.

 

(예시)

아래의 명령어를 기계어로 표현한다면,

add $t0, $s1, $s2

 

이렇게 표현될 것이다.

 

 

* 레지스터가 명령어에서 참조되기 때문에 레지스터 이름을 숫자로 매핑하는 규칙이 필요하다.

MIPS에서는 레지스터 $s0 ~ $s7까지는 레지스터 번호 16 ~ 23번,

레지스터 $t0 ~ $t7까지는 번호 8 ~ 15번에 매핑한다.

 

컴퓨터는 이진수를 사용하므로, 최종적으로 아래와 같이 이진수로 변환하여 기계 코드를 만들어낼 수 있다.

 

 

* 명령어를 숫자로 표현한 것을 기계어(machine language)라고 하고,

   이런 명령어들의 시퀀스를 기계 코드(machine code)라고 한다.

 


그렇다면 레지스터들은 어디에 존재하기에

우리가 번호를 통해 어떤 레지스터에 저장된 값을 사용하고, 값을 저장할 수 있는 것일까?

 

모든 레지스터는 Register File에서 관리된다.

 

 

32개의 32비트 레지스터들을 모두 관리하는데,

2개의 읽기 포트(read port)와 1개의 쓰기 포트(write port)가 존재한다.

 

두 개의 read port로 피연산자 레지스터 번호를 보내면 해당 레지스터의 값을 받아올 수 있고,

하나의 write port로 목적지 레지스터 번호를 보내면 해당 레지스터에 값을 저장하게 되는 것이다.

 


다양한 논리 연산 명령어들도 R-format을 사용한다.

 

* 논리 연산 명령어

   : 비트들을 워드로 묶는(packing) 작업과 워드를 비트 단위로 나누는(unpacking) 작업을 간단하게 하는 명령어들

 

 

자리이동(shift) 연산

모든 비트를 왼쪽 또는 오른쪽으로 이동시키고, 이동 후 빈자리는 0으로 채운다.

 

MIPS의 자리이동 명령어의 이름은 아래와 같다.

 

1. sll (shift left logical)

sll $t2, $s0, 4		# $t2 = $s0 << 4 bits (shift left logical)

2. srl (shift right logical)

srl $t2, $s0, 4		# $t2 = $s0 >> 4 bits (shift right logical)

 

R-format의 shamt 필드는 자리 이동량(shift amount)을 나타내는 것으로,

sll $t2, $s0, 4 명령어의 기계어 형식은 다음과 같다.

 

 

rs 필드는 사용하지 않으므로 0이 된다.

 

 

shift 연산들은 또 다른 용도로 사용될 수 있다.

왼쪽으로 i비트 자리 이동하면 2^i를 곱한 것과 같은 결과가 된다.

 

따라서 부호 없는 수에서

shift left n은 2의 n제곱을 곱하는 것과 같은 역할을 하며,

반대로 shift right n은 2의 n제곱으로 나눈 것과 같은 역할을 한다.

 

 

Bitwise 논리 연산

1. AND

and $t0, $t1, $t2	# $t0 = $t1 & $t2

2. OR

or $t0, $t1, $t2	# $t0 = $t1 | $t2

 

3. NOR

nor $t0, $t1, $t2	# $t0 = not ($t1 | $t2)

 

NOR를 통해서 NOT 명령어를 만들 수 있다. (명령어의 재사용)

* a NOR b == NOT (a OR b)

nor $t0, $t1, $zero	# not $t1

 

MIPS I-format Instruction

I : Immediate

 

우리는 앞에서 상수 연산 명령어 addi와 데이터 전송 명령어 lw, sw를 알아보았다.

 

이때 위의 R format을 사용하게 되면 어떻게 될까?

상수는 5비트 자리에 들어가서 0~32의 값들만 나타낼 수 있게 되기 때문에 불충분하다.

 

 

따라서 하드웨어 설계의 3대 원칙 중 네 번째 원칙에 따라

모든 명령어의 길이를 같게 하되, 명령어 종류에 따라 형식은 다르게 하는 방법을 취하게 되었다.

 

설계 원칙 4 : 좋은 설계에는 적당한 절충이 필요하다.

 

수치 연산과 데이터 전송 명령어에서는 I-format이 쓰인다.

 

 

  • op : 명령어가 실행할 연산의 종류로서 연산자(opcode)라고 부른다.
  • rs : 근원지(source) 피연산자 레지스터
  • rt : 아래의 역할 중 한 가지를 한다.
    1. 두 번째 근원지(source) 피연산자 레지스터
    2. 목적지(destination) 레지스터
  • constant / address : 상수가 들어가거나, lw 또는 sw에서 offset(변위, 상대 주소) 값이 들어간다.

constant 필드에 들어가는 상수의 범위는 -2^15 ~ +2^15-1이다. (signed number)

 

 

데이터 전송 명령어

1. lw, sw

lw $t0, 24($s3)	  # load word from memory
sw $t0, 24($s3)	  # store word from memory

 

lw $t0, 24($s3) 명령어의 기계어 형식은 다음과 같다.

 

lw 명령어에서는 rt 필드의 의미가 적재 결과가 들어갈 목적지(destination) 레지스터 번호를 표시하는 것으로 바뀌었다.

 

주소 필드에는 상대 주소(offset) 24가 들어간다.

$s3에는 배열의 시작 주소가 담겨 있기 때문에, 그것에 offset을 더한 값이 목표 주소가 되는 것이다.

 

 

2. lb, sb

lw와 sw 명령어는 워드(word)를 가져오므로 32비트의 값을 가져온다.

만약 1 byte(8비트)만 적재하거나 가져오고 싶다면 lb(load byte), sb(store byte) 명령어를 사용하면 된다.

lb $t0, 1($s3)	  # load byte from memory
sb $t0, 6($s3)	  # store byte to memory

 

 

상수 연산 명령어

addi $sp, $sp, 4	# $sp = $sp + 4
slti $t0, $s2, 15	# $t0 = 1 if $s2 < 15

 


I-format에서 상수 필드는 16비트로 크기가 한정되어 있다.

만약 16비트로는 표현이 되지 않는 큰 상수가 필요하다면 어떻게 해야할까?

 

이럴 때 우리는 32비트 크기의 상수를 레지스터에 저장할 필요가 있으며,

명령어 lui(load upper immediate)ori(or immediate) 2개를 사용하여야 한다.

 

 

예시로, 1010 1010 1010 1010 1010 1010 1010 1010의 수를 저장해야 한다고 하자.

lui $t0, 1010101010101010		# load upper immediate
ori $t0, $t0, 1010101010101010		# or immediate

 

lui 명령어를 통해 $t0의 상위 16비트에는 1010101010101010이 저장되고,

→ $t0 : 1010 1010 1010 1010 0000 0000 0000 0000

 

ori 명령어를 통해

$t0에 저장되어 있는 1010 1010 1010 1010 0000 0000 0000 0000와

명령어에 명시되어 있는 값, 0000 0000 0000 0000 1010 1010 1010 1010에 대하여

or 연산이 진행된다.

 

결과적으로 $t0에는 1010 1010 1010 1010 1010 1010 1010 1010가 저장된다.

 

 

정리하자면,

1. 원하는 상위 16비트를 lui

2. 원하는 하위 16비트의 상수와 ori

이렇게 해주면 32비트 크기의 상수를 레지스터에 저장할 수 있게 된다.

 


요약

1.

컴퓨터는 이진수만 알기 때문에 어셈블리 언어를 기계어 표현식으로 바꾸어야 한다.

MIPS에서는 하나의 명령어를 32비트의 기계어로 변환한다.

 

이렇게 명령어를 이진수로 표현하는 혁명 덕분에

내장 프로그램의 개념과 이진 호환성 개념이 생겨났다.

 

 

2.

MIPS(RISC) Design Principles

 

  1. 간단하게 하기 위해서는 규칙적인 것이 좋다.

    • 명령어는 32비트로 고정된 크기를 갖는다.
    • 명령어의 형식은 3가지로 적다. (R-format, I-format, J-format)
    • 최상위 6비트는 항상 opcode를 뜻한다.
      따라서 상위 6비트만 봐도 어떠한 명령어 타입인지 직관적으로 바로 알 수 있다.

  2. 작은 것이 더 빠르다.

    • 명령어 집합은 제한된다.
    • Register File에서 관리하는 레지스터의 개수는 32개로 제한된다.

  3. 자주 생기는 일을 빠르게 하라.

    • 산술 연산은 레지스터를 통해 이루어진다.
    • 상수가 명령어에 포함되어 있다.

  4. 좋은 설계에는 적당한 절충이 필요하다.

    • 형식을 1가지로 제한하지 않고 3가지로 타협하였다.
      나머지는 부수적인 기능을 이용하여 구현하는 것으로 성능을 향상시킬 수 있다.

 

 

반응형
Comments