본문 바로가기

카테고리 없음

JVM

 

Java Virtual Machine의 줄임말.

직역하면 '자바를 실행하기 위한 가상 기계(컴퓨터)'라고 할 수 있다.

Java 는 OS에 종속적이지 않다는 특징을 가지고 있다. OS에 종속받지 않고 실행되기 위해선 OS 위에서 Java 를 실행시킬 무언가가 필요하다. 그게 바로 JVM이다.

 

📜 JVM
가상 머신이면서, java byte 코드(.class 파일)를 어떻게 실행할 지에 대한 표준 스펙이다.
구현체는 다양하다. (JVM 벤더: 오라클, 아마존, Azul, ...)
특정 플랫폼에 종속적이다.
최소 배포 단위는 JRE, JVM 홀로 배포하진 않는다.

 

Java 소스코드, 즉 원시코드(*.java)는 CPU가 인식을 하지 못하므로 기계어로 컴파일을 해줘야한다.

하지만 Java는 이 JVM 이라는 가상머신을 거쳐서 OS에 도달하기 때문에 OS가 인식할 수 있는 기계어로 바로 컴파일 되는게 아니라 JVM이 인식할 수 있는 Java bytecode(*.class)로 변환된다.

 

Java compiler  .java 파일을 .class 라는 Java bytecode로 변환한다.

 

💡 여기서 Java compiler는 JDK를 설치하면 bin 에 존재하는 javac.exe를 말한다.
(즉, JDK에 Java compiler가 포함되어 있다는 소리임)
javac 명령어를 통해 .java를 .class로 컴파일 할 수 있다.

💡 comfile 명령어
ex) javac HelloJava.java -> HelloJava.class 파일 생성

💡 comfile된 파일(HelloJava.class)을 확인하는 명령어
ex) javap -c HelloJava

변환된 bytecode는 기계어가 아니기 때문에 OS에서 바로 실행되지 않는다.

이 때, JVM이 OS가 bytecode를 이해할 수 있도록 해석해준다.

따라서 Byte Code는 JVM 위에서 OS 상관없이 실행될 수 있는 것이다.

OS에 종속적이지 않고, Java 파일 하나만 만들면 어느 디바이스든 JVM 위에서 실행할 수 있다.

 

 

바이트 코드

가상 컴퓨터(VM)에서 돌아가는 실행 프로그램을 위한 이진 표현법.

 

자바 바이트 코드(Java bytecode)는 JVM이 이해할 수 있는 언어로 변환된 자바 소스코드를 의미한다.

자바 컴파일러에 의해 변환된 코드의 명령어 크기가 1바이트라서 자바 바이트 코드라고 불리고 있다.

 

바이트 코드는 다시 인터프리터 또는 JIT 컴파일러에 의해 바이너리 코드로 변환된다.

💡 바이너리 코드란?
바이너리 코드 또는 이진 코드라고 함
컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드
💡 기계어란?

0과 1로 이루어진 바이너리 코드이다.
기계어가 이진코드로 이루어졌을 뿐 모든 이진코드가 기계어인 것은 아니다.
기계어는 특정한 언어가 아니라 CPU가 이해하는 명령어 집합이며, CPU 제조사마다 기계어가 다를 수 있다.

 

즉, CPU가 이해하는 언어는 바이너리 코드, 가상 머신이 이해하는 코드는 바이트 코드이다.

 

JVM은 특정 플랫폼에 종속적이다.

 

JVM 구성요소

 

JVM 구성 요소

JVM은 크게 아래와 같이 이루어져 있다.

  • 클래스 로더(Class Loader)
    • 로딩 (loading)
    • 링크 (linking)
    • 초기화 (initialization)
  • 실행 엔진(Execution Engine)
    • 인터프리터(Interpreter)
    • JIT 컴파일러(Just-in-Time)
    • 가비지 콜렉터(Garbage collector)
  • 런타임 데이터 영역 (Runtime Data Area)

 

클래스 로더

코드를 읽어내고, 적절하게 배치하는 작업을 진행

.class에서 바이트코드를 읽고 메모리에 저장.
JVM 내로 클래스 파일(*.class)을 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이다.
런 타임시 동적으로 클래스를 로드하고 jar 파일 내 저장된 클래스들을 JVM 위에 탑재한다.
즉, 클래스를 처음으로 참조할 때, 해당 클래스를 로드하고 링크하는 역할을 한다.

 

로딩: 클래스를 읽어오는 과정

링크: 레퍼런스를 연결하는 과정

초기화: static 값들 초기화 및 변수에 할당

 

✍️ 초기화
클래스에 static 이라는 변수를 할당할 수 있고,
static block을 이용하여 값을 할당할 수 있는데
이렇게 하면 다른 클래스에서도 "클래스 이름.값"을 통해서 불러올 수 있다.

 

 

실행 엔진

클래스를 실행시키는 역할이다.

클래스 로더가 JVM내의 런타임 데이터 영역에 바이트 코드를 배치시키고, 이것은 실행 엔진에 의해 실행된다.

자바 바이트 코드(*.class)는 기계가 바로 수행할 수 있는 언어보다는 비교적 인간이 보기 편한 형태로 기술된 것이다. 그래서 실행 엔진은 이와 같은 바이트 코드를 실제로 JVM 내부에서 기계가 실행할 수 있는 형태로 변경한다.

 

💡 인터프리터
실행 엔진은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다.
하지만 한 줄씩 수행하기 때문에 느리다는 단점이 있다.

 

💡 JIT(Just-In-Time)
인터프리터 방식으로 실행하다가 적절한 시점에 바이트 코드 전체를 컴파일하여 기계어로 변경하고, 이후에는 해당 더 이상 인터프리팅 하지 않고 기계어로 직접 실행하는 방식이다.
인터프리터 효율을 높이기 위해, 인터프리터가 반복되는 코드를 발견하면 JIT 컴파일러로 반복되는 코드를 모두 네이티브 코드로 바꿔둔다. 그 다음부터 인터프리터는 네이티브 코드로 컴파일된 코드를 바로 사용한다.

 

가비지 콜렉터

더이상 사용되지 않는 인스턴스를 찾아 메모리에서 삭제함.

 

Runtime Data Area (메모리)

Runtime Area

프로그램을 수행하기 위해 OS에서 할당받은 메모리 공간

 

 ↳ PC (Program counter) Register

Thread가 시작될 때 생성되며 생성될 때마다 생성되는 공간으로, 스레드마다 하나씩 존재한다.

Thread가 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분으로 현재 수행 중인 JVM 명령의 주소를 갖는다.

 

💡 프로세스(process)란?
단순히 실행 중인 프로그램(program)

즉, 사용자가 작성한 프로그램이 운영체제에 의해 메모리 공간을 할당받아 실행 중인 것을 말한다.

이러한 프로세스는 프로그램에 사용되는 데이터와 메모리 등의 자원 그리고 스레드로 구성된다.
💡 스레드(thread)란?

스레드(thread)란 프로세스(process) 내에서 실제로 작업을 수행하는 주체를 의미

모든 프로세스에는 한 개 이상의 스레드가 존재하여 작업을 수행한다.

또한, 두 개 이상의 스레드를 가지는 프로세스를 멀티스레드 프로세스(multi-threaded process)라고 한다.

 

 ↳ JVM 스택 영역

스택 영역에는 쓰레드마다 런타임 스택을 만들고, 그 안에 메서드 호출을 스택 프레임이 (메서드 콜)라 부르는 블럭으로 쌓는다.

쓰레드를 종료하면 런타임 스택도 사라진다.

에러 메세지를 볼 때 메서드가 쌓여있는 것을 볼 수 있는데, 스택안에 쌓여있는 것을 보여주는 것이다.

 

프로그램 실행과정에서 임시로 할당되었다가 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다.

각종 형태의 변수나 임시 데이터, 스레드나 메소드의 정보를 저장한다.

메소드 호출 시마다 각각의 스택 프레임(그 메서드만을 위한 공간)이 생성된다. 메서드 수행이 끝나면 프레임 별로 삭제를 한다.

메소드 안에서 사용되는 값들을 저장한다. 또 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장한다.

 

 ↳ Native method stack

자바 프로그램이 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역.

JAVA가 아닌 다른 언어로 작성된 코드를 위한 공간.

Java Native Interface를 통해 바이트 코드로 전환하여 저장하게 된다.

일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역

 

JNI 쓰는 곳이랑 연결 되어있다.

메서드에 native라는 키워드를 붙여 놓은 인터페이스를 JNI라고 하고 

실제 그 구현된 자체를 네이티브 메서드 라이브러리라고 한다.

라이브러리는 항상 JNI을 통해서 써야한다.

 

네이티브 메서드를 사용하는 코드가 있다면

네이티브 메서드 스택이 생길 것이고 그 안에 네이티브 메서드 인터페이스를 호출하는 스택 프레임이 하나 쌓일 것이다. 

 

네이티브 메서드의 예
Thread.currentThread();

 

 

 ↳ Method Area (= Class Area = Static area)

클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간

(클래스 이름, 클래스 패키지 경로, 상속 받은 경우 부모 클래스 이름 [Object 같은..], 메서드 명, 변수 명)

메서드 영역에 저장되는 것은 공유 영역이다. 다른 메서드에서도 사용 가능

 

 ↳  ↳ Runtime Constant Pool

스태틱 영역에 존재하는 별도의 관리영역.

상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행한다.

 

💡 스태틱 영역에 저장되는 데이터

Field Information (멤버 변수!)
멤버변수의 이름, 데이터 타입, 접근 제어자에 대한 정보

Method Information (메소드!)
메소드의 이름, 리턴타입, 매개변수, 접근 제어자에 대한 정보

Type Information (타입!)
class인지 interface인지의 여부 저장. Type의 속성, 전체 이름, super 클래스의 전체 이름. (interface이거나 object인 경우 제외된다. 이건 Heap에서 관리함)

 

 ↳ Heap 영역

 

Heap 영역

메서드 영역에는 클래스 단위를 저장하였다면 heap영역에는 객체를 저장한다. (instance)

객체를 저장하는 가상메모리 공간. new 연산자로 생성되는 객체와 배열을 저장한다.

Class Area(Static Area)에 올라온 클래스들만 객체로 생성할 수 있다.(당연함)

힙은 세 부분으로 나뉘어 진다.

 

 ↳  ↳ Permanent Generation

직역하면 영구적인 세대이다.

생성된 객체들의 정보의 주소값이 저장된 공간이다. 클래스 로더에 의해 load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용된다.
Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다.

 

💡 Reflection이란?
객체를 통해 클래스의 정보를 분석해 내는 프로그래밍 기법
구체적인 클래스 타입을 알지 못해도, 컴파일된 바이트 코드를 통해
역으로 클래스의 정보를 알아내어 사용할 수 있다는 뜻이다.

 

 

 ↳  ↳ New/Young 영역

이곳의 인스턴스들은 추후 가비지 콜렉터에 의해 사라진다.
생명 주기가 짧은 “젊은 객체”를 GC 대상으로 하는 영역이다.
여기서 일어나는 가비지 콜렉트를 Minor GC 라고 한다.

 ↳  ↳  ↳ Eden: 객체들이 최초로 생성되는 공간

 ↳  ↳  ↳ Survivor 0, 1: Eden에서 참조되는 객체들이 저장되는 공간

💡 Eden 영역에 객체가 가득차게되면 첫번째 가비지 콜렉트가 발생한다.
Eden영역에 있는 값등릉 Survivor 1 영역에 복사하고 이 영역을 제외한 나머지 객체를 삭제한다.

 ↳  ↳ Old 영역

이곳의 인스턴스들은 추후 가비지 콜렉터에 의해 사라진다.
생명 주기가 긴 “오래된 객체”를 GC 대상으로 하는 영역이다.
여기서 일어나는 가비지 콜렉트를 Major GC 라고 한다. Minor GC에 비해 속도가 느리다.

New/Young Area에서 일정시간 참조되고 있는, 살아남은 객체들이 저장되는 공간이다.

 

JDK와 JRE의 차이

JDK

Java Development Kit (자바 개발 키트)

Java 를 사용하기 위해 필요한 모든 기능을 갖춘 Java용 SDK (Software Development Kit)이다.

JDK 는 JRE를 포함하고 있다.
JRE에 있는 모든 것 뿐만 아니라 컴파일러(javac)와 jdb, javadoc 과 같은 도구도 있다.

 

즉, JDK는 프로그램을 생성, 실행, 컴파일할 수 있다.

Oracle JDK 11 버전을 상용으로 사용할 때 유료이다.

Oracle open JDK를 사용하면 무료이다. 

amazon에서 만든 jdk인 corretto를 사용해도 무료이다.

 

JRE

Java Runtime Environment (자바 런타임 환경)

JVM + 자바 클래스 라이브러리(Java Class Library) 등으로 구성되어 있다.
컴파일 된 Java 프로그램을 실행하는데 필요한 패키지이다.

 

최소한의 배포 단위이다.

자바 애플리케이션을 실행할 수 있도록 구성된 배포판

JVM + library

rt.jar 파일 

characterset.jar 리소스 파일

properties settings 파일 등과 같이 자바를 실행하는데 필요한 파일들이다.

컴파일 할때 필요한 javac는 존재하지 않는다.

java를 실행할 수는 있으나 컴파일 할 수는 없다.

java 11부터는 JRE를 따로 제공하지 않고 있다.

java9 부터는 module system이 생겼는데 jre를 만들 수도 있다 jlink라고 하는데 이런 tool을 이용하여 subset을 만들 수 있다.

대부분의 경우에 JRE만 다운로드 받아서 사용하는 경우는 흔하지 않다.

 

 

 

요약
JDK는 자바 프로그램을 실행, 컴파일, 개발용 도구.
JRE, JVM를 모두 포함하는 포괄적이 키트이다.
JRE는 자바 프로그램을 실행할 수 있게 하는 도구이다. JVM을 포함하고 있다.

💡 SDK란?
Software Development Kit (소프트웨어 개발 키트)

하드웨어 플랫폼, 운영체제 또는 프로그래밍 언어 제작사가 제공하는 툴이다. 키트의 요소는 제작사마다 다르다.
SDK의 대표적인 예로, JDK 등이 있다.
SDK를 활용하여 애플리케이션을 개발할 수 있다.

 

 

 

GC

더이상 쓰이지 않는 객체를 찾아서 정리하는 것

 

 

크게 나누면 2가지의 gc가 있다.

Throughput 위주의 gc
stop the world 줄이는 gc
 - response 타임을 줄이기 위함
 - GC를 할때 발생하는 pause 현상을 최소화 하는 방법

 

 

 

https://doozi0316.tistory.com/entry/1%EC%A3%BC%EC%B0%A8-JVM%EC%9D%80-%EB%AC%B4%EC%97%87%EC%9D%B4%EB%A9%B0-%EC%9E%90%EB%B0%94-%EC%BD%94%EB%93%9C%EB%8A%94-%EC%96%B4%EB%96%BB%EA%B2%8C-%EC%8B%A4%ED%96%89%ED%95%98%EB%8A%94-%EA%B2%83%EC%9D%B8%EA%B0%80

 

[JAVA] JVM이란? 개념 및 구조 (JDK, JRE, JIT, 가비지 콜렉터...)

JVM이란 무엇인가 Java Virtual Machine의 줄임말. 직역하면 '자바를 실행하기 위한 가상 기계(컴퓨터)'라고 할 수 있다. Java 는 OS에 종속적이지 않다는 특징을 가지고 있다. OS에 종속받지 않고 실행되

doozi0316.tistory.com

 

https://asfirstalways.tistory.com/158

 

#자바가상머신, JVM(Java Virtual Machine)이란 무엇인가?

#JVM이란? JVM이란 JAVA Virtual Machine, 자바 가상 머신의 약자를 따서 줄여 부르는 용어이다 (가상머신이란 프로그램의 실행하기 위해 물리적 머신과 유사한 머신을 소프트웨어로 구현한 것이다.) JV

asfirstalways.tistory.com

 

https://hoonmaro.tistory.com/19

 

마로의 Java(자바) 정리 - 8. 자바 메모리 구조

JVM 구조 실행될 클래스 파일을 메모리에 로드 후 초기화 작업 수행 메소드와 클래스변수들을 해당 메모리 영역애 배치 클래스로드가 끝난 후 JVM은 main 메소드를 찾아 지역변수, 객체변수, 참조

hoonmaro.tistory.com

 

https://d2.naver.com/helloworld/1329