난이도 : 초급
Peter HaggarIBM
2002 년 5 월 01 일
2003 년 1 월 07 일 수정
모든 프로그래밍 언어에는 고유의 이디엄이 있다. 이중 대부분이 유용하다. 문제는 몇몇 이디엄의 경우 원래 표명했던 것이 아니라는 것이 나중에 입증되거나 설명한대로 작동하지 않다는 점이다. 자바에는 많은 유용한 이디엄이 있다. 하지만 결코 사용되어서는 안되는 이디엄도 있다. Double-checked locking이 바로 그것이다. 이글에서는 double-checked locking 이디엄의 근원부터 살펴본다.
Singleton creation pattern은 일반적인 프로그래밍 이디엄이다. 다중 쓰레드와 함께 사용할 때 동기화 유형을 사용해야 한다. 좀더 효율적인 코드를 만들기위한 노력으로 자바 프로그래머들은 코드가 동기화 되는 것을 제한하기위해 Singleton creation pattern과 함께 쓰일 double-checked locking 이디엄을 만들었다. 하지만 자바 메모리 모델에 대한 이해의 부족으로 double-checked locking 이디엄은 작동을 보장할 수 없다. 게다가 작동 실패의 이유는 명확하지 않고 자바 메모리 모델과 밀접하게 연관되어 있다. 때문에, double-checked locking으로 인한 코드 작동 실패의 원인을 검사하기 힘들다. 이 글을 통해 단지 그것이 어디서 고장이 났는지를 이해할 수 있도록 double-checked locking 이디엄을 연구해본다.
double-checked locking 이디엄이 어디서 기원했는지를 이해하려면 일반적인 singleton creation 이디엄을 알아야 한다. (Listing 1):
Listing 1. Singleton creation 이디엄
|
이 클래스의 디자인은 단지 하나의 Singleton
객체가 만들어졌다는 것을 확인시켜주고 있다. 생성자는 private
으로 선언되고 getInstance()
메소드는 단지 하나의 객체를 만든다. 이것은 단일 쓰레드 프로그램에 적합하다. 하지만 다중 쓰레드가 개입되면 동기화를 통해서 getInstance()
메소드를 방어해야 한다. getInstance()
메소드가 방어되지 않으면 Singleton
객체의 두 개의 다른 인스턴트를 리턴할 수 있다. getInstance()
메소드를 동시에 호출하고 다음 이벤트를 따라가는 두 개의 쓰레드를 생각해보자:
- Thread 1은
getInstance()
메소드를 호출하고 //1에서 그instance
가null
이라는 것을 결정한다. - Thread 1은
if
블록으로 들어가지만, //2의 라인을 실행하기 전에 thread 2에 선점된다. - Thread 2는
getInstance()
메소드를 호출하고 그instance
가 //1에서null
이라는 것을 결정한다. - Thread 2는
if
블록으로 들어가서 새로운Singleton
객체를 만들고instance
변수를 이 새로운 //2에 있는 새로운 객체에 할당한다. - Thread 2는 //3에 있는
Singleton
객체 레퍼런스를 리턴한다. - Thread 2는 thread 1에 선점된다.
- Thread 1는 남겨진 곳에서 부터 시작하고 다른
Singleton
객체가 만들어지는 결과가 된 //2 라인을 실행한다. - Thread 1은 //3에서 이 객체를 리턴한다.
결과는 getInstance()
메소드가 단지 하나의 객체를 만들어야 하는데 두개의 Singleton
객체를 만들었다. 이 문제는 단지 하나의 쓰레드가 한 번에 코드를 실행하도록 getInstance()
메소드를 동기화시켜 수정할 수 있다 (Listing 2):
Listing 2. 쓰레드 방지 getInstance() 메소드
|
Listing 2의 코드는 getInstance()
메소드로 멀티쓰레드 액세스에 잘 작동한다. 하지만 이것을 분석해보면 동기화는 메소드의 첫 번째 호출에만 필요하다는 것을 깨닫게 된다. 지속적인 호출은 동기화를 필요로하지 않는다. 첫 번째 호출이 //2에서 코드를 실행하는 유일한 호출이기 때문이다. 이 라인은 동기화가 필요한 유일한 라인이다. 모든 다른 호출들은 instance
가 null
이 아니라는 것을 결정하고 이것을 리턴한다. 다중 쓰레드는 첫 번째 것을 제외하고는 모든 호출에 대해 일관성 있게 실행할 수 있다. 하지만, 메소드가 synchronized
될 때, 메소드의 모든 호출에 대해 동기화의 대가를 지불해야한다.
이 메소드를 좀더 효율적으로 만들기 위해서 double-checked locking이라는 이디엄이 만들어졌다. 첫 번째 것을 제외한 모든 메소드 호출에 대해 동기화를 피하려는 생각이다. 동기화의 비용은 JVM 과는 다르다. 초기에 이 비용은 매우 높았다. 향상된 JVM이 등장함에 따라, 동기화의 비용은 감소했지만 여전히 synchronized
메소드 또는 블록에 들어가고 나오는 것에 대한 퍼포먼스 패널티는 존재한다. JVM 기술의 발전과 관계없이 프로그래머들은 불필요하게 프로세스 시간을 낭비하기를 결코 원하지 않는다.
Listing 2의 //2 행만이 동기화가 필요하기 때문에, 이것을 동기화 블록으로 래핑한다 (Listing 3):
|
Listing 3의 코드는 다중 쓰레드에 나타났던 문제와 같다. 두 개의 쓰레드는 instance
가 null
이면 동시적으로 if
문 내부에서 얻어질 수 있다. 그리고나서 하나의 쓰레드가 instance
를 초기화하기 위해서 synchronized
블록으로 들어간다. 그러는 동안 다른 것들은 블록화된다. 첫 번째 쓰레드가 synchronized
블록을 종료할 때 기다리고 있는 쓰레드가 들어가서 다른 Singleton
객체를 만든다. 두 번째 쓰레드가 synchronized
블록에 들어갈 때, instance
이 non-null
인지를 검사하지 않는다.
|
Listing 3의 문제를 해결하려면 instance
를 검사해야한다. double-checked locking 이디엄을 Listing 3에 적용하면 Listing 4의 결과가 나온다.
Listing 4. Double-checked locking 예제
|
double-checked locking 이론은 //2에서의 두번째 체크가 두 개의 다른 Singleton
객체들이 Listing 3에 나타난 것처럼 만들어질 수 없도록 한다는 것이다:
- Thread 1은
getInstance()
메소드로 들어간다. - Thread 1은
instance
가null
이기 때문에 //1에 있는synchronized
블록으로 들어간다. - Thread 1은 thread 2에 선점된다.
- Thread 2는
getInstance()
메소드로 들어간다. - Thread 2는
instance
가 여전히null
이기 때문에 //1에서 lock 얻기를 시도한다. 하지만 thread 1이 lock을 보유하고 있기 때문에 thread 2는 //1에서 블록한다. - Thread 2는 thread 1에 선점된다.
- Thread 1은 실행하고 인스턴스가 //2에서 여전히
null
이기 때문에,Singleton
객체를 만들고 이것의 레퍼런스를instance
에 할당한다. - Thread 1은
synchronized
블록을 종료하고getInstance()
메소드에서 인스턴스를 리턴한다. - Thread 1은 thread 2에 선점된다.
- Thread 2는 //1에서 lock을 얻어서
instance
가null
인지를 점검한다. instance
가 non-null
이기 때문에, 두 번째Singleton
객체는 만들어지지 않고 thread 1에 만들어진것이 리턴된다.
double-checked locking 이론은 완벽하다. 안타깝게도 현실은 그와 반대라는 것이다. double-checked locking과 관련한 문제는 이것이 단일 또는 다중 프로세서 머신에서 작동하는 것을 보장할 수 없다는 점이다.
double-checked locking 실패는 JVM의 버그 때문이 아니고 현재의 자바 플랫폼 메모리 모델 때문이다. 메모리 모델은 "난잡한 작성"을 허용하고 이것이 이디엄이 실패하는 주요 이유이다.
|
이 문제를 설명하기 위해서, Listing 4의 //3행을 다시한번 살펴보아라. 이 코드는 Singleton
객체를 만들고 객체를 참조하기 위해서 instance
변수를 초기화한다. 이 코드의 문제는 instance
변수가Singleton
생성자의 바디가 실행하기 전에 non-null
이 될 수 있다는 점이다.
이것은 여러분이 가능하다고 생각했던 모든것과 배치가 될 수 있다. 하지만 가능한 현실이다.이것이 어떻게 발생했는지를 설명하기전에 어떻게 이것이 double-checked locking 이디엄을 고장냈는지를 살펴보면서 이러한 현실을 받아들이자:
- Thread 1은
getInstance()
메소드로 들어간다. - Thread 1은 //1의
synchronized
블록으로 들어간다.instance
가null
이기 때문이다. - Thread 1은 //3 으로 가서 non-
null
인스턴스를 만든다. 생성자가 실행하기 전이다. - Thread 1은 thread 2에 선점된다.
- Thread 2는 인스턴스가
null
인지를 점검한다. null이 아니기 때문에, thread 2는instance
레퍼런스를 완전히 만들어졌지만 부분적으로 초기화된Singleton
객체로 리턴한다. - Thread 2는 thread 1에 선점된다.
- Thread 1은 생성자를 실행함으로서
Singleton
객체의 초기화를 완료하고 레퍼런스를 리턴한다.
thread 2는 한 객체를 리턴하는데, 그 객체의 생성자는 실행되지 않았다.
이를 설명해줄 다음의 가상 코드를 살펴보자: instance =new Singleton();
|
Listing 5의 코드를 보자. getInstance()
메소드를 간략하게 나타냈다. "double-checkedness"를 제거했다. instance=new Singleton();
라인을 JIT 컴파일러가 어떻게 컴파일하는지에만 관심이 있다. 어셈블리 코드에서 생성자가 실행된다는 것을 확인하기 위해 간단한 생성자도 제공했다.
Listing 5. out-of-order write를 표현한 Singleton 클래스
|
Listing 6에는 getInstance()
메소드의 바디를 위한 Sun JDK 1.2.1 JIT 컴파일러에서 만들어진 어셈블리 코드가 포함되어 있다.
Listing 6. Listing 5 코드에서 만들어진 어셈블리 코드
|
이 어셈블리 코드는 getInstance()
메소드를 호출하는 테스트 프로그램을 실행하여 만들어졌다. 프로그램이 실행되는 동안 Microsoft Visual C++ 디버거를 실행하고 이것을 자바 프로세스에 붙였다.
어셈블리 코드의 처음 두 개의 행은 049388C8
메모리 로케이션에서 instance
레퍼런스를 eax
로 로딩하고 null
을 테스트 한다. 이것은 Listing 5의 첫 행의 getInstance()
메소드와 상응한다. 이 메소드가 처음 호출되고 instance
는 null
이면 코드는 B9
으로 진행된다. BE
에 있는 코드는 Singleton
객체용 힙에서 메모리를 할당하여 eax
의 메모리에 포인터를 저장한다. C3
는 eax
에서 포인터를 가져다가 049388C8
메모리 로케이션에 인스턴스 레퍼런스에 저장한다. 결과적으로 인스턴스는 현재 non-null
이고 유효한 Singleton
객체를 참조한다. 하지만 이 객체용 생성자는 아직 실행되지 않았고 그것은 double-checked locking이 문제가 있다는 것이다. C8
라인에서,instance
포인터는 역참조되고 ecx
에 저장된다. CA
와 D0
행은 true
와 5
값을 Singleton
객체에 저장하는 인라인 생성자를 나타낸다. C3
행을 실행하고 나서 다른 쓰레드에 의해 이 코드가 인터럽트된다면 생성자를 완료하기 전에 double-checked locking은 실패한다.
모든 JIT 컴파일러가 위와 같은 코드를 생성하는 것은 아니다. 어떤것은 생성자가 실행된 후 바로 인스턴스가 non-null
이 되는 코드를 만든다. IBM SDK for Java technology, version 1.3과 Sun JDK 1.3 모두 이와 같은 코드를 만든다. 하지만 이러한 인스턴스에 double-checked locking을 사용해야 된다는 것을 말하는 것은 아니다. 이것이 실패할 수 있는 다른 이유들이 있다. 게다가 어떤 JVM에서 여러분의 코드가 실행될지를 항상 알고있는것은 아니지 않는가? 그리고 JIT 컴파일러는 이 이디엄을 중단시키는 코드를 만들기위해 언제나 변화할 수 있다.
|
Double-checked locking: Take two
현재 double-checked locking 코드가 실행되지 않는다면 다른 코드 버전을 제안하겠다 (Listing 7). out-of-order write 문제를 방지하기 위함이다.
Listing 7. out-of-order write 문제 해결
|
Listing 7의 코드를 보게되면 상황이 우습게 되고있다는 것을 알게된다. 기억해야할 것은 double-checked locking은 간단한 세 라인의 getInstance()
메소드의 동기화를 막을 수단으로 만들어졌다는 것이다. Listing 7의 코드는 손에서 떠났다. 이 코드는 문제를 해결하지 않는다. 천천히 그 이유를 살펴보자.
out-of-order write 문제를 방지하기 위해 시도되었다. 이를 inst
로컬 변수와 두 번째 synchronized
블록을 이용하여 수행한다:
- Thread 1
getInstance()
메소드로 들어간다. instance
가null
이기때문에, thread 1은 //1에서 첫 번째synchronized
블록으로 들어간다.- 로컬 변수
inst
는instance
값을 가지고 이것은 //2 에서null
이다. inst
가null
이기 때문에, thread 1은 //3의 두 번째synchronized
블록으로 들어간다.- Thread 1은 //4에서 코드 실행을 시작하면서
Singleton
생성자가 실행되기 전에inst
를 non-null
로 만든다. (이것이 out-of-order write 문제이다.) - Thread 1은 Thread 2에 선점된다.
- Thread 2는
getInstance()
메소드로 들어간다. instance
가null
이기 때문에, thread 2는 //1에 있는 첫 번째synchronized
블록으로 들어가는 것을 시도한다. thread 1이 현재 이 lock을 보유하고 있기 때문에, thread 2는 블록된다.- Thread 1은 //4의 실행을 완료한다.
- Thread 1은 완전히 생성된
Singleton
객체를 //5의instance
변수에 할당하고synchronized
블록 모두를 종료한다. - Thread 1은
instance
를 리턴한다. - Thread 2는 실행해서
instance
를 //2의inst
에 할당한다. - Thread 2는
instance
가 non-null
이라는 것을 확인하고 이를 리턴한다.
핵심 라인은 //5 이다. 이 라인은 instance
가 null
이거나 완전히 생성된 Singleton
객체를 참조한다는 것을 확인하도록 되어있다. 문제는 이론과 진실이 직교하며 실행되는 곳에서 발생한다.
Listing 7의 코드는 메모리 모델의 현재 정의 때문에 작동하지 않는다. Java Language Specification (JLS)은 synchronized
블록 안에서 작성된 코드가 synchronized
블록 밖으로 이동하지 못하도록 되어있다. 하지만, synchronized
블록에 없는 코드가 코드가 synchronized
블록 안으로 이동할 수 없다는 것을 뜻하는 것은 아니다.
JIT 컴파일러는 여기에서 최적화 기회를 본다. 최적화는 //4에 있는 코드와 //5 에 있는 코드를 제거하여 이를 조합하여 Listing 8과 같은 코드를 만든다:
|
최적화가 되면 이전과 같은 out-of-order write 문제가 생긴다.
|
inst
변수와 instance
변수에 volatile
키워드를 사용하는 경우도 있다. JLS (참고자료)에서 volatile
이 선언된 변수는 영속성이 있어 재정리 되지 않아야 한다. double-checked locking 과 관련한 문제를 해결하기 위해 volatile
을 사용할 때 두 가지 문제가 발생한다:
- 여기서의 문제는 순차적 영속성에 있지 않다. 코드는 이동되고 재정리 되지 않는다.
- 많은 JVM이 순차적 영속성을 정확히 고려한
volatile
을 구현하지 않는다.
|
JLS에 의하면, stop
과 num
이 volatile
로 선언되기 때문에, 그들은 순차적으로 영속적이여야 한다. 이는, stop
이 언제나 true
이면, num
은 100
으로 설정되어야 한다는 것을 의미한다. 하지만, 많은 JVM이 volatile
의 순차적 영속성 기능을 구현하지 않기 때문에 이러한 것에 의존할 수 없다. 따라서 thread 1이 foo
를 호출하고 thread 2가 bar
를 동시에 호출하면, thread 1은 num
이 100
으로 설정되기 전에 stop
을 true
로 설정해야한다. 이렇게 되면 thread 2에서 stop
이 true
로 설정되고 num
은 여전히 0
으로 설정된다.
|
모든 JVM 구현에서 작동한다는 것을 보장할 수 없기 때문에 어떤 형태로든 double-checked locking은 사용되어서는 안된다. JSR-133은 메모리 모델 관련한 문제를 언급하고 있지만 double-checked locking은 새로운 메모리 모델에서 지원되지 않는다. 따라서 다음 두 가지 옵션이 있다:
getInstance()
메소드의 동기화를 수락한다. (Listing 2).- 동기화를 그만두고
static
필드를 사용한다.
Option 2는 Listing 10에 나와있다:
Listing 10. static 필드를 이용한 Singleton 구현
|
Listing 10의 코드는 동기화를 사용하지 않고 static getInstance()
메소드에 호출이 있을때까지 Singleton
객체가 만들어지지 않는다는 것을 확실히 하고있다.
|
out-of-order writes 문제가 있는 String
클래스와 생성자 실행에 앞서 non-null
이 되는 레퍼런스가 이상할 것이다. 다음 코드를 보자:
|
String
클래스는 변하지 않는다. 하지만 out-of-order write 문제가 발생할 수 있는가? 문제는 그럴 수 있다는 것이다. String str
로 액세스 하는 두 개의 쓰레드를 생각해보자. 한 쓰레드는 str
레퍼런스가 생성자가 실행하지 않는 곳에서 String
객체를 참조한다는 것을 본다. 사실 Listing 11에는 이러한 것이 발생하는 것을 보여준다. 이 코드는 내가 테스트 한 JVM 로만 고장을 일으킨다는 것을 명심해라. IBM 1.3과 Sun 1.3 JVM은 변하지 않는 String
을 만든다
|
이 코드는 //3의 두 개의 쓰레드에 의해 공유된 String
레퍼런스를 포함하는 //4의 MutableString
클래스를 만든다. //5와 //6라인에 두 개의 개별 쓰레드에 StringCreator
와 StringReader
라는 두 개의 객체가 만들어지면서 MutableString
객체에 레퍼런스를 전달한다. StringCreator
클래스는 무한 루프로 들어가고 //1에서 "hello" 값을 가진 String
객체를 만든다. StringReader
는 무한 루프로 들어가고 현재 String
객체가 //2에서 "hello" 값을 갖고 있는지를 확인한다. 그렇지 않다면, StringReader
쓰레드는 메시지를 프린팅하고 정지한다. String
클래스는 변하지 않고 이 프로그램에서 어떤 아웃풋도 볼 수 없다.
Sun JDK 1.2.1같은 오래된 JVM 에서 이 코드를 실행하면 out-of-order write 프로그램이 되고 non-immutable String
이 된다.
|
singleton의 비싼 동기화를 피하기위해 특별히 천재적인 프로그래머들은 double-checked locking 이디엄을 개발했다. 약한 메모리 모델의 분야를 재정의하는 작업이 진행중이다. 하지만 아무리 새로운 메모리 모델이어도 double-checked locking은 작동하지 않을 것이다. 이 문제에 대한 최상의 솔루션은 동기화를 수락하거나 static field
를 사용하는 것이다.
|
- developerWorks worldwide 사이트에서 이 기사에 관한 영어원문.
- Practical Java Programming Language Guide (Addison-Wesley, 2000), Peter Haggar.
- The Java Language Specification, Second Edition : Bill Joy, et. al. (Addison-Wesley, 2000).
- The Java Virtual Machine Specification, Second Edition :Tim Lindholm and Frank Yellin (Addison-Wesley, 1999).
- Bill Pugh의 Java Memory Model 웹 사이트 방문.
- Dr. Dobb's Journal .
- JSR-133.
- "Threading lightly: Synchronization is not the enemy" (developerWorks, 2001년 7월).
- "Threading lightly: Sometimes it's best not to share" (developerWorks, 2001년 10월), Brian Goetz.
- "Writing multithreaded Java applications" (developerWorks, 2001년 2월), Alex Roetter.
- "If I were king: A proposal for fixing the Java programming language's threading problems" (developerWorks, 2000년 10월).
- developerWorks Java technology zone.
|
Peter Haggar는 IBM의 소프트웨어 엔지니어이다. Practical Java Programming Language Guide (Addison-Wesley)의 저자이며 자바 프로그래밍 관련하여 많은 글을 집필했다. 개발 툴, 클래스 라이브러리, OS 등 광범위한 분야에 많은 경험을 갖고 있다. |
|
출처: http://www.ibm.com/developerworks/kr/library/j-dcl.html