LSI 9265, 9211, ICHÀÇ ·¹À̵å0 °á·Ð1

Aniny   
   Á¶È¸ 37550   Ãßõ 3    

좀 길어질거같은데 몇개로 나뉠수도....
관심있으신분껜 도움이 될수도 있겠고,, 혹시나 제가 틀린부분이나 다른의견 있으시면 뭐든지 언제든지 댓글달아주시면 감사하겠습니다.
저도 많이 배울수 있을거같습니다.

 


우선 첫번째 문제는, 나름 검증되고 많이 사용되고있는 하드웨어 레이드카드에서 싱글ssd의 성능이 제대로 나오지않는다 였습니다.
많은 분들이 겪고계신 문제고 외국 커뮤니티에도 같은문제로 고민하는 사람들이 엄청 많았습니다.

예를들면 9265-8i에 840pro를 싱글로 연결했는데 벤치결과는 메인보드에 직접붙인것보다 속도가 훨씬 떨어진다,

이 문제는 레이드카드의 캐시관련부분을 off하는것으로 어느정도 해결되는듯 보였습니다만 그래도 ICH와 비교해서 여전히 떨어지는 성능...
사실 몇백불~천불넘게 주고 레이드카드를 따로사서 달았는데 비슷한 성능이다- 라고만해도 손해인듯한 기분이 드는건 어쩔수 없는거죠.
그리고 캐시가 없는 레이드카드들의 경우는 끄고뭐고 할것도 없구요. 뭔가를 해볼만한 여지조차 없습니다.


제 생각에 이건 아마도 어쩔수없는 문제인거같습니다.
현재로써 ssd 싱글드라이브의 성능을 가장 최대로 뽑아내는건 바로 ICH였던겁니다. cpu로드는 잠시 논외로 하구요
하드웨어 레이드카드를 구입하는 이유가 레이드0이나 싱글드라이브를 쓰기위함은 아니라고 하지만
그래도 싱글에서도 느릴이유는 없지않나요...ㅠ

이문제로 LSI나 다른 컨트롤러 제작사에서도 아마 많은 태클을 당했던거같습니다.
제작사에서 운영하는 서포트커뮤니티같은데를 둘러보면 이문제에 대한 글들이 항상 있고 많은 사람들이 포스트를 이어가고 있었습니다. 뭐 어느제작사를 통틀어 변변한 답변하나 못봤습니다.

암튼
제가 그동안 인텔530과 840pro등의 ssd들을 9265와 9211, 그리고 x79에 직접 붙여가며 수없이많은 삽질을 통해 대략 느낀바가 있습니다.
우선 슬픈 팩트하나 : 애드온 레이드카드들의 싱글ssd의 속도는 무슨짓을 해도 ICH를 능가하진 못한다,  



그리고 LSI의 Fastpath라는 펑션에 대한겁니다.
이 Fastpath라는 펑션은 아시다시피 원래 250$정도로 따로 판매되고있는 애드-온 소프트웨어입니다.
레이드카드에 직접 끼우는 하드웨어키로 판매되기도하고 소프트웨어로 판매되기도 하구요.
설명에 따르면 ssd들의 IOPS를 거의뭐 두배가까이 엄청 올려준다고 합니다.

이 말도안되게 비싼 소프트웨어키가 스리슬쩍 어느샌가 기본펑션이 되었죠.
LSI홈피에 가보면 Fastpath소개화면 아래에 작은글씨로 '펌웨어 5.7이상부터 xx,xx,xx,xx시리즈 레이드카드들은 Fastpath가 기본펑션이 됩니다' 라고 나와있습니다.
최신으로 펌업후 LSI MSM에서 확인해보면 Enabled라고 나오구요.

LSI에서 애드온 컨트롤러들에 붙인 ssd퍼포먼스가 떨어지는 문제를 인식하고 그런건지 아니면 경쟁자들에 대한 견제인진 모르겠지만 암튼,,
지금에서야 비로소 ICH에 거의 근접하는 성능을 내게된게 아닌가 합니다.


가정 : 이 Fastpath는 ssd의 성능을 ICH에 '거의'근접하도록 해줍니다.
문서나 공식적인 자료로써 확인한건 아니지만 거의 사실일거라고 봅니다.

다시말하자면,, 아직도 ICH에 직접 붙이는게 최고의 성능을 보여주긴 하지만 Fastpath가 enable된 LSI레이드카드에 붙이면 거의 제성능에(ICH에 붙였을때) 근접한 성능을 보여준다고 보면 될거같습니다.
*싱글 ssd의 경우입니다. 레이드0도 딱히 계산하는게 없으니 싱글의 경우와 마찬가지라고 보면 될거같구요.

 


참고로 이하의 모든 스샷은 특별히 언급이 없는한 cpu절전은 c-state과 speed step모두 on입니다. 
이게 ssd의 성능에 영향을 꽤 주기때문에 일반적으로 벤치를 하는 퍼포먼스세팅의 경우보다 다소 수치가 떨어진다는거 감안하시고 봐주시면 될거같습니다. 



아래 스샷은 840 pro 256GB를 x79(메인보드)에 직접붙였을 경우입니다.


 거의 스펙대로의 성능이죠.
(cpu절전모드가 가장 영향을 많이주는 항목이 4k QD32입니다. 순차성능에도 꽤 차이가 있구요)



아래는 9265에 840 pro 256GB를 싱글로 붙이고 Fastpath enable, 나머지는 Fastpath권장세팅대로 맞췄습니다.
(참고로 9265는 JBOD모드가 없어서 싱글시 레이드0으로 잡습니다)
스트라이프64k / write through / no read ahead / Direct IO


x79와 비교하면 다소 떨어지긴 하지만,, cpu절전항목을 대충 만져주면 거의 ICH와 차이없을정도까지 올라갑니다.





다음은 9265에 840 pro 256GB를 싱글로 잡고 Fastpath를 쓰지 않았을경우입니다.
제가 예전에 했던게 있는데 스샷은 없고 결과만 텍스트로 export한게 있습니다.
예전에 게시글에 올렸었죠...

Sequential Read :   534.102 MB/s 
Sequential Write :   319.590 MB/s
Random Read 512KB :   468.861 MB/s
Random Write 512KB :   311.285 MB/s
Random Read 4KB (QD=1) :    31.602 MB/s [  7715.3 IOPS]
Random Write 4KB (QD=1) :    46.733 MB/s [ 11409.5 IOPS]
Random Read 4KB (QD=32) :   285.299 MB/s [ 69653.1 IOPS]
Random Write 4KB (QD=32) :   255.950 MB/s [ 62487.7 IOPS]
Test : 1000 MB [C: 23.5% (51.3/218.4 GB)] (x2)
Date : 2013/11/23 18:17:07
OS : Windows 7 Professional SP1 [6.1 Build 7601] (x64)
 
Read Policy : always read ahead
write policy : write throught
IO policy : direct IO
access policy : read write
disk cache policy : unchanged(x)
BG int : disable


이당시는 Fastpath가 enable榮첫번째 펌웨어였고(펌웨어에 문제있을 가능성있음) 스트라이프 사이즈는 128k입니다.
Fastpath권장세팅과 다른것 또하나는 no read ahead가 아니라 always read ahead로 했다는건데 만약 이걸 no read ahead로 하게되면 순차읽기가 반토막이 났기때문에 저렇게 했던거로 기억합니다.


제가 따로 스샷은 안찍었습니다만 인텔530도 x79와 9265에 싱글로 붙여서 같은 방법으로 테스트해봤는데 거의 동일한 결과가 나왔습니다.
인텔530에 대해선 제가 할얘기가 좀 많아서;;;;;;  다음에 또 적도록 하겠습니다.




그리고 제가 9211을 지인에게 빌려와 잠시 물려서 테스트를 해봤는데요
하루만에 돌려줘야만해서(돌아가는 서버에서 떼옴;;;) 몇가지 테스트만 급하게 했습니다.

9211은 fastpath관련된 펑션이 없는데다가 LSI MSM에서 보니 트림(SSD Guard)또한 지원하지 않더군요.
싱글로 물려보니 예상대로.. 예전의 그 기대에 못미치는 결과가 나왔습니다. ICH와 비교해서 말이죠.
아마도 IT펌을 올리면 나아질런지 모르겠지만 글쎄요, 어차피 컨트롤러를 통하는거라 큰차이가 있을지는 모르겠습니다.
그리고 9211은 9265와는 달리 컨트롤러에 연결만 해도 바이오스와 OS에서 그대로 인식하더군요. 따로 아무것도 해줄게 없었습니다.

참고로 제가 테스트한 펌웨어는 P20(IR)최신입니다.


9211과 9265의 레이드0 테스트도 해봤습니다.
9265는 Fastpath가 Enable되있기때문에 이게 공정한 비교가 될런지 모르겠지만,,,
레이드0에서도 9265와 9211은 먼저 제글에 답변 달아주신분의 벤치결과와 같이 성능차이가 있었습니다. 


우선그전에,,, 인텔530 120GB의 싱글스펙은 순차읽기 500MB / 순차쓰기 130MB 정도입니다.
인텔 홈피에 보면 530의 스펙이 다음과같이 나와있습니다.


그러나,, 저는 아무리해도 무슨짓을 해도 저 숫자와는 어림도없는 결과만 나왔습니다.
특히 쓰기는 메인보드에 붙이건 아무리 셋팅을 바꾸고 컨트롤러를 바꾸고 Fastpath 지지고볶고해도 130M이상을 볼수가 없었습니다.
그래서 여기저기 기웃거리던참에 인텔530의 스펙이 구라라는걸 알게





스샷을 잘못잘라서 앞부분이 다 잘려나갔는데;;;;
위에 두번째의 순차쓰기만 보시면 되겠습니다. '131MB' 
저의 결과와 다르지 않았고 구글링으로 나온 다른 사람들의 벤치결과를 봐도 분명히 인텔530 120GB의 순차쓰기 성능은 130MB/s였습니다.
대체 왜 인텔은 저런 구라를 치는걸까요?
아마존같은 판매사이트의 상품정보에도 버젓이 순차쓰기 480MB/s라고 나와있습니다.
이거덕분에 저의 엄청난 삽질이 시작되게 된거죠.
..뭐 결과적으로 많이 배우고 해결하게 嗤;;;


어쨋든간에 인텔530 120GB의 순차쓰기는 130MB/s다- 라고 하면 모든게 무리없이 다 잘맞습니다.






아래 스샷은 9211에 인텔530을 4개 레이드0으로 묶은것입니다.
따로 설정하는게 없어서 스트라이프사이즈만 64k입니다.(기본값)


참고로 9211의 제성능을 보고싶었기때문에 cpu절전항목은 모두 껐습니다.




그리고 아래는 9265의 마찬가지 인텔530 4개 레이드0입니다.
Fastpath권장설정 : 스트라이프64k / write through / no read ahead / Direct IO


9265의 벤치결과를 보시면 9211과 비교해서 어떤것은 높고 어떤것은 낮습니다만,
실제로는 모든 부분에서 앞섭니다. 9265의 경우는 제가 실제 사용하는 환경을 측정하고싶어서 cpu절전항목을 모두 켜고 테스트했기때문입니다.

둘의 cpu절전세팅을 같게 맞추고 테스트하면 9265가 순차 읽기/ 쓰기, 랜덤512, 4k, 4k QD32 모든 부분에서 앞서고 특히 4k QD32부분에서의 차이는 더심해집니다.
이부분이 아마도 Fastpath가 가장 많이 관여하는 부분이 아닐까 합니다.
 



첫번째 결론은...
인텔530 120GB의 순차쓰기 속도는 구라다....


두번째 결론은...
Fastpath는 레이드컨트롤러에서 ssd의 성능을 ICH에 버금갈정도로 올려준다...


세번째 결론은...
ssd를 싱글로 제성능을 충분히 내며 쓰고싶다면 ICH에 직접붙이거나, 값비싼 레이드카드를 구입해서 Fastpath를 enable한다...
 


제가 계속 cpu로드에 대한것을 언급하지 않았는데... 애드온카드의 경우 cpu로드에 대한것도 볼필요가 있을거같습니다.
저같은 경우는 cpu부하가 많이걸리는 작업을 주로하기때문에 가능한한 cpu로드를 줄이기위해 애드온컨트롤러를 달게된 이유도 있거든요.
예전에 스카시장비를 쓸때 느꼈던 스토리지와 cpu가 완전 따로노는듯한 쾌적함이 그리워서요.


530과 840pro의 여러가지 다른 테스트들과 원래는 같이 올리려했는데 글이 너무 길어질거같아서 이만 여기서 줄입니다.
주말에 840 pro 256GB를 4개로 묶어서 테스트해보려 합니다.
퍼포먼스는 안봐도 뭐... 잘나오겠죠.
문제는 안정성과 실제 체감성능부분인데 이부분은 실제 사용하면서 느껴봐야해서 테스트가 쉽진 않을거같습니다만
다음 테스트들은 기회되는대로 또 올려보도록 하겠습니다.


게시판에 와서 질문하면 늘 답변해주시고 도와주시는 회원님들께 다시한번 감사드립니다.

그럼 이만..






°æÇèÀÌ ³ì¾Æµç ÁÁÀº ±Û Àß Àоú½À´Ï´Ù.

Âü°í·Î SSD Guard ±â´ÉÀº Æ®¸²°ú´Â ÀüÇô °ü·ÃÀÌ ¾ø½À´Ï´Ù.
ÀÏÀü¿¡ ÀÚ°Ô¿¡ ¿Ã¸° ±ÛÀÔ´Ï´Ù.

http://www.2cpu.co.kr/bbs/board.php?bo_table=freeboard_2011&wr_id=261595&sca=&sfl=mb_id%2C1&stx=khnoh&sop=and&page=2
     
Aniki 2014-11
¿À...  ÁÁÀºÁ¤º¸ °¨»çÇÕ´Ï´Ù!
ÇѼºÈ£ 2014-11
Àúµµ 530 4°³·Î ·¹À̵å0À» ¹­¾ú´Âµ¥ ¹º°¡ ÀÌ»óÇÏ´õ¶ó±¸¿ä...
Âü ¾î·Á¿î°Å °°½À´Ï´Ù.
     
Aniki 2014-11
¹º°¡ ÀÌÀ¯°¡ ÀÖÁö¾ÊÀ»±î ÇÕ´Ï´Ù. ÀÎÅÚÀÌ Àú·±°Å°¡Áö°í °ø°ø¿¬ÇÏ°Ô ±¸¶óÄ£´Ù´Â°Íµµ Á» ÀÌ»óÇÏ°í..
½ºÆå½ÃÆ®¿¡ º¥Ä¡¼ýÀÚµé ¿·¿¡ ºÐ¸íÈ÷ 'up to' ¶ó°í µÇÀÖ±ä ÇÏÁö¸¸,, ..  -_-
º»¹®¿¡µµ ¾ð±ÞÇϼÌÁö¸¸...¸ÞÀκ¸µå ICH ¿¡ SSD ¸¦ raid 0 ·Î ¼³Á¤Çؼ­ ºÎÇϸ¦ Á» ½ÉÇÏ°Ô °É¾îÁÖ¸é cpu »ç¿ë·üÀÌ ¸¶±¸ ¿Ã¶ó°©´Ï´Ù. ƯÈ÷ 4K QD32 Å×½ºÆ®¸¦ Çغ¸¸é È®¿¬ÇÏ°Ô º¸ÀÔ´Ï´Ù

¸»¾¸ÇϽŠ°Íó·³...ºÎÇÏ »óÅ¿¡¼­µµ ÄèÀû(?)ÇÏ°Ô »ç¿ëÇÏ·Á¸é º°µµÀÇ ÄÁÆ®·Ñ·¯¸¦ ´Þ¾ÆÁÖ´Â°Ô ÈξÀ ÁÁ½À´Ï´Ù.
¹Ú¹®Çü 2014-11
ÀÌÁ¦ ¾Æ´äÅØ 7¾¾¸®Áî ³ª 8¾¾¸®Áî ¸¸ ´Þ¾Æ¼­ äũÇÒ Àϸ¸ ³²¾Ò³×¿ä..
     
+1
Adaptec Á¦Ç°À» ¾²°í´Â Àִµ¥ ·¹À̵带 ±ý ¼ö°¡ ¾ø´Â »óȲÀ̶ó...
ÇѼºÈ£ 2014-11
LSI¿Í ¾Æ´äÅØÀÇ Â÷ÀÌ°¡ ÀÖ´ÂÁö Á¤¸» ±Ã±ÝÇÕ´Ï´Ù.
Adaptec 7k + 400g x 4 raid 0 À¸·Î ¾î·¡ÀÌ Çϳª Àâ¾Æ ¾²°í ÀÖ½À´Ï´Ù.
Á¶¸¸°£ Á¤¸®ÇØ ¿Ã·Á º¸°Ú½À´Ï´Ù.
     
Aniki 2014-11
¿ÏÀü ±â´ëµË´Ï´Ù....