Researchers: SSDs struggle in virtual machines thanks to garbage collection

업체홍보 more

쓰기

Researchers: SSDs struggle in virtual machines thanks to garbage collection

간장게장

2019-01

2019-01-23 00:55:16

조회 2519 추천 2

위 글에서 사용된 SSD가 850 pro라고 하셨는데요.

850 pro는 consumer SSD 중에서 좋다고 소문난 SSD입니다. 사실 enterprise용 SSD인 SM863과 같은 콘트롤러를 사용합니다.

차이라면 SM863은 기업용이니만큼 수퍼캐퍼시터를 달아서 power loss protection 기능이 있다는 점, overprovisioning을 충분히 한다는 점, firmware가 기업용 특성에 맞게 조정되어 있다는 점(sustained 성능을 높이는 데 중점을 둠) 정도입니다. 두번째 세번째는 모두 garbage collection에 관계된 것입니다.

그런데 이미 850 pro에 충분한 overprovisioning을 했는데도 시간이 지남에 따라 성능이 저하된다고 하셨어요. 솩 정리하고 다시 붙이면 성능이 좋아진다는 것으로 보아 다른 문제도 아닌 것 같습니다.

과연 이 문제가 trim을 하면 해결될 문제인가? 기업용 SSD를 사용하면 해결될 문제인가?

듣보잡 SSD도 아니고, SM863과 같은 콘트롤러를 쓰는 850 pro에 overproviaioning을 충분히 했는데도 저렇게까지나 성능이 degrade될까나? 의문이 생기더군요.

좀 찾아보니 오래된 것이기는 하지만 이런 글이 있었습니다.

Researchers: SSDs struggle in virtual machines thanks to garbage collection

https://www.extremetech.com/computing/206638-researchers-ssds-struggle-in-virtual-machines-thanks-to-garbage-collection

garbage collection 알고리즘으로 인해 하나의 SSD에 많은 수의 가상머신을 돌리게 되면 시간이 지남에 따라 성능이 저하한다는 것입니다. 이 글에서는 consumer SSD라고 했지만 기업용이라고 해서 뾰족한 다른 수는 없을 것 같습니다. 일반용이나 기업용이나 근본적인 차이가 있는 것은 아니니까요.

이 글의 근원은 아래 논문입니다.

Towards SLO Complying SSDs Through OPS Isolation

https://www.usenix.org/system/files/conference/fast15/fast15-paper-kim-jaeho.pdf

한국 사람들이 쓴 논문이네요.

이 글에서 말하는 해결책은 콘트롤러를 새롭게 설계를 해서 가상머신마다 따로 따로 다른 블럭에 쓰기를 하도록 하면 된다는 것인데요. 그런 SSD는 당분간 기대하기 힘들 것 같습니다.

trim을 한다고 해결될 문제도 아니고 기업용을 쓴다고 해결될 문제도 아니고 NVMe SSD를 쓴다고 해결될 문제도 아닌 것 같아요.

해결책은

1. 지금처럼 가끔 한번씩 SSD를 꺼내 초기화 해 주고 다시 집어넣는다.

2. 작은 SSD를 여러개 사서 가상머신을 각각에 집어넣는다. 가상머신 하나마다 SSD 하나가 불가능하다면 SSD 하나마다 들어가는 가상머신 숫자를 최소로 줄임

3. optane SSD를 사서 이것으로 일반 SSD 혹은 하드디스크를 caching한다.

optane SSD가 굉장히 비싼데요. 기업용인 P4800X 뿐만 아니라 일반용인 900P 혹은 905P도 역시 성능은 비슷합니다.

optane SSD는 flash로 만드는 SSD와는 매체가 근본적으로 다릅니다. trim은 지원하지 않는데요. 필요하지 않아서 지원하지 않는 것입니다. garbage collection의 필요성도 굉장히 적습니다.

모든 문제들이 flash chip의 특성에서 비롯되는 것입니다.

읽기는 아주 빠르게 효율적으로 할 수 있는데, 쓰기를 하려면 한 블럭을 일단 지우고 나서 그 블럭을 써야 된다는 문제. 한 블럭에서 약간만 바꾸려면 일단 그 블럭 전체를 다 읽어들인 후 블럭 전체를 지우고 나서 변경된 데이터와 함께 전체 블럭을 써줘야 한다는 것. 이런 것 때문에 garbage collection이 필요하고 trim도 필요한 것입니다.

optane은 그런 문제가 없습니다. 그냥 필요한 그곳만 쓰기해 주면 됩니다. 마치 ram처럼.

위 3번에서 caching용이라면 900P 제일 작은 것이 375GB인데요. 그것으로 SSD를 캐싱한다면 좋을 것 같습니다. cold data는 결국 SSD에 씌여지지만 캐싱을 거친 뒤 나중에 serial화 하여 기록되므로 앞서와 같은 문제는 별로 없을 것 같습니다.

p.s. P4800X 제일 작은 것이 375GB이고, 900P는 280GB가 제일 작은 것이네요. 905P는 480GB가 제일 작은 것. 성능은 900P나 905P도 4800X에 못지 않습니다. 무엇보다 flash가 아니라는 점. trim도 필요 없고 SSD와 같은 garbage collection도 필요 없음. 이것도 수명이 있으니 wear leveling은 필요하겠지만 그냥 mapping table 관리 정도면 충분할 겁니다. clean cell을 만들기 위한 erase 작업이 필요 없음.

좋은 SSD라는 것은 NAND flash의 저러한 단점을 controller나 firmware로 얼마나 잘 극복하느냐에 달려 있는데요. 결국 garbage collection을 얼마나 효율적으로 하느냐입니다. 수백명 수천명이 동시 접속하는 데이터베이스 처리 같은 것도 좋은 기업용 SSD는 잘 처리합니다. 그런데 많은 수의 가상머신이 동시에 입출력하면 특히 가상머신들의 IO 행태가 다른 종류이면 garbage collection을 현재의 콘트롤러들로는 잘 해 내기 어렵다는 것입니다.

-------

저 위 논문에서 말하는 해결책은 가상머신마다 독자적인 블럭에서 입출력을 하도록 하여 한 블럭 안에서 서로 다른 가상머신들이 입출력하지 않도록 만든다는 것인데요.

또 다른 해결책은 현재의 trim을 확장하여 파일 안에서 쓰지 않는 블럭을 trim하여 GC를 효율적으로 해 내는 것입니다.

두가지 중의 한가지만 되면 해결된다기 보다 두가지 모두 이루어지면 훨씬 나아지겠지요. 물론 flash가 아닌 optane에서는 그러지 않아도 됨

https://beowulf.github.io/publications/ftrim-resolve12.pdf

가상머신(게스트)에서 파일을 지워 trim을 하더라도 호스트로 전달되어 trim이 이루어지지 않는다는 것이죠. 그래서 그걸 host로 전달하여 host에서 trim이 되도록 trim을 확장해야 한다는 논문. ftrim : file level trim

짧은글 일수록 신중하게.



박문형 2019-01 수고 많으십니다.. 하이브리드 레이드 시스템도 해결책이 될까요?? 수고 많으십니다.. 하이브리드 레이드 시스템도 해결책이 될까요??



간장게장 2019-01 optane SSD가 있다면 당장 실험해 보고 싶군요. 며칠 전에 eBay에 optane SSD 경매 나온 것을 주시하고 있었는데, 마지막 순간에 어느 놈이 꽤 비싼 값에 채가버렸어요. 정품도 아니고 엔지니어링 샘플이라서 설마하고 안심하고 있었는데, 어쩌면 그 놈이 엔지니어링 샘플인 것을 보지 못하고 비싼 값에 채간 것일지도 모르겠습니다. optane SSD가 있다면 당장 실험해 보고 싶군요. 며칠 전에 eBay에 optane SSD 경매 나온 것을 주시하고 있었는데, 마지막 순간에 어느 놈이 꽤 비싼 값에 채가버렸어요. 정품도 아니고 엔지니어링 샘플이라서 설마하고 안심하고 있었는데, 어쩌면 그 놈이 엔지니어링 샘플인 것을 보지 못하고 비싼 값에 채간 것일지도 모르겠습니다.

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

1371/5680

번호	제목Page 1371/5680	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (228)	백메가	2015-12	1481867	25
(광고) 단통법 시대의 인터넷가입 가이드(… (228) 2015-12 1481867 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (726)	정은준1	2014-05	4945163	0
[필독] 처음 오시는 분을 위한 안내 (726) 2014-05 4945163 1 정은준1
86187	아수스 서버보드들은 ikvm모듈있어야 ipmi가되죠?? (9)	행복하세	2019-02	3287	0
아수스 서버보드들은 ikvm모듈있어야 ipmi… (9) 2019-02 3287 1 행복하세
86186	rx570 트리플 모니터 (10)	김효수	2019-02	8989	0
rx570 트리플 모니터 (10) 2019-02 8989 1 김효수
86185	CATIA V5 R25 사용하는데 다중코어 지원하나요? (4)	song05	2019-02	7109	0
CATIA V5 R25 사용하는데 다중코어 지원… (4) 2019-02 7109 1 song05
86184	CATIA V5 R25 사용하는데 다중코어 지원하나요? (6)	song05	2019-02	3812	0
CATIA V5 R25 사용하는데 다중코어 지원… (6) 2019-02 3812 1 song05
86183	VMware 게스트os 포트오픈 (3)	이창준	2019-02	2218	0
VMware 게스트os 포트오픈 (3) 2019-02 2218 1 이창준
86182	스마트폰 짐벌 사용하신분 사용기좀 부탁드립니다. (7)	정은준1	2019-02	2615	0
스마트폰 짐벌 사용하신분 사용기좀 부탁… (7) 2019-02 2615 1 정은준1
86181	usb c 케이블 cc단자 10k 저항과 56k 저항 문제 질문입니다. (5)	양철괭이	2019-02	6688	0
usb c 케이블 cc단자 10k 저항과 56k 저항… (5) 2019-02 6688 1 양철괭이
86180	RHEL 사용시 Subscription을 등록하지 않으면 어떠한 불이익이 있나요? (5)	송주환	2019-02	3732	0
RHEL 사용시 Subscription을 등록하지 않… (5) 2019-02 3732 1 송주환
86179	이어폰 추천 부탁합니다 (9)	CPU4	2019-02	2763	0
이어폰 추천 부탁합니다 (9) 2019-02 2763 1 CPU4
86178	8 - 10 테라 HDD중에 제일 조용한것은 무엇인가요? (2)	미수맨	2019-02	2708	0
8 - 10 테라 HDD중에 제일 조용한것은 무… (2) 2019-02 2708 1 미수맨
86177	멜라녹스 10기 랜카드 질문드립니다. (16)	DaVinci	2019-02	3405	0
멜라녹스 10기 랜카드 질문드립니다. (16) 2019-02 3405 1 DaVinci
86176	픽셀값에 대해서 질문입니다 (4)	의롭게살리라	2019-02	2432	0
픽셀값에 대해서 질문입니다 (4) 2019-02 2432 1 의롭게살리라
86175	해결완료. AC Plug 규격 문의. EU, RU, KR. (5)	박명근TN	2019-02	4930	0
해결완료. AC Plug 규격 문의. EU, RU, K… (5) 2019-02 4930 1 박명근TN
86174	접지] 그냥 아무데나 연결하는 것인가요? (11)	이천풍	2019-02	5241	0
접지] 그냥 아무데나 연결하는 것인가요? (11) 2019-02 5241 1 이천풍
86173	HP RGS 기능 문의입니다. (1)	바다늑대	2019-02	2981	0
HP RGS 기능 문의입니다. (1) 2019-02 2981 1 바다늑대
86172	레이져프린터 사이드가 지저분하게 출력이 되네요... (9)	머리감자	2019-02	6293	0
레이져프린터 사이드가 지저분하게 출력이… (9) 2019-02 6293 1 머리감자
86171	802.11ad 60ghz 와이파이 쓰시는 분들 계신가요	김은호	2019-02	2502	0
802.11ad 60ghz 와이파이 쓰시는 분들 계… 2019-02 2502 1 김은호
86170	plex 실행용으로 쓸만한 기기 없을까요? (7)	나비z	2019-02	3602	0
plex 실행용으로 쓸만한 기기 없을까요? (7) 2019-02 3602 1 나비z
86169	pc 인디케이터 (9)	서버하거파	2019-02	2788	0
pc 인디케이터 (9) 2019-02 2788 1 서버하거파
86168	u1파워 쓰면 ipmi에 모니터링 되야되는거죠?? (5)	행복하세	2019-02	2833	0
u1파워 쓰면 ipmi에 모니터링 되야되는거… (5) 2019-02 2833 1 행복하세