안녕하세요.
대학원생으로 생명공학쪽 연구를 하고 있는 학생입니다.
제 실험실에서 연구하는 주제들의 요즘 트랜드는 NGS 데이터 (특히 RNA sequencing)를 일반 assay처럼 다루고 있기때문에 직접 이에 대한 세팅을 시작하게 되었습니다.
혹시라도 이쪽 계열에 계신 분들의 도움을 얻을 수 있을까 싶어 글을 남깁니다.
이번에 제가 단독으로 하는 연구에서는 sequencing data를 업체에서도 분석을 해주었지만 sample당 10만원이라는 비싼 가격과 분석 data의 부족함을 느꼈기에 직접 raw data를 분석하기 시작하였습니다.
제 개인 노트북 (i7 9750H, 32GB램)에 우분투를 설치하여 BBduk, Trim galore, STAR aligner, salmon 과 같은 프로그램을 이용하였습니다. 21sample 분석하는데 만 2일 걸렸고 이들보다 더 오래걸린다고 알려진 Bowtie, HISAT2와 같은 프로그램은 엄두를 못내게 되었습니다.
교수님께서 이를 보시고 워크스테이션을 하나 구입하여 추후 분석(public data와의 비교, 새로운 실험)에 사용하는 것을 생각하시게 되었습니다.
당장 제 실험에서 사용될 data들은 제 개인 노트북으로 해결이 가능할것 같지만 미래를 보고 구입을 하시려하는 것같습니다.
이에 견적아닌 견적, 구입시기에 대한 고민이 있습니다.
딥러닝과는 달라 CPU의 파워가 결정적이고 램에 데이터를 상주시킨 후 새로 읽은 data를 비교하는 계산이 주 이기에 램의 크기 또한 중요합니다.
먼저 CPU는 2월 말에 3990X를 기다리는 것이 좋을까요? 당장 필요한것이 아니기때문에 기다리는데는 전혀 지장이 없습니다.
또한 GPU의 성능이 크게 중요하지 않다하더라도 이에 준하는 스펙을 갖추어놓고 추후 딥러닝 등의 분석을 조금이나마 할 수 있게 준비해두는 것이 좋을까요?
마지막으로 유지 보수 관점에서 제 후배들은 관리에 관심이 없을 수 있기에 조립보다는 DELL이나 HP 같은 대기업의 워크 스테이션을 구입하는 것이 나을까요?
참고로 de novo assembly 연구는 진행하지 않습니다.
긴글 읽어 주셔서 감사합니다^^ 새해 복 많이 받으세요
SalmonÀº Á¦°¡ ¾²´Â kallisto¶û ºñ½ÁÇÑ pseudoalignment ¾²´Â °É·Î ±â¾ïÇϴµ¥ ÀÌ°Ç ·¥ÀÌ ´ú µé¾î¼
Àú´Â 8ÄÚ¾î 3700xÀ¸·Îµµ º°·Î ºÒÆíÇÔ ¸ø ´À²¼½À´Ï´Ù. ´Ù¸¸ Àú´Â. Human transcriptome¸¸ ºÐ¼®ÇÏ°í ÀÖ¾î¼ dna ºÐ¼® µî¿¡¼´Â
¾ó¸¶³ª ´õ ¸¹Àº ÀÚ¿øÀÌ ÇÊ¿äÇÒÁö ¸ð¸£°Ú³×¿ä
µö·¯´×±îÁö »ý°¢ÇϽŴٸé rtx ÀÌ»ó ±¸¸ÅÇϽô °Íµµ ÇÑ ¹æ¹ýÀ̰ڳ׿ä... 3700x+kallisto ¾²´Ï ´ë·« ÇÏ·ç¿¡ 500°³ Á¤µµÀÇ transcriptomeÀ»
AlignmentÇÒ ¼ö ÀÖ´Ù´Â °è»êÀÌ ³ª¿Ô½À´Ï´Ù... ¾Æ¹«Æ° Àúµµ À̺о߰¡ ÁÖ·ÂÀº ¾Æ´Ï°í »çÀ̵åÇÁ·ÎÁ§Æ®·Î ÁøÇàÁßÀε¥ ³²µéÀº ¹¹¾²´ÂÁö
±Ã±ÝÇϱä Çϳ׿ä. ¿·ÀÇ À̹ÌÁö µö·¯´× ȸ»ç´Â rtx 4Àå ¾¿ ³¢¿ö°¡¸ç ÀÏÇÏ´øµ¥~
¸»¾¸ÇØÁֽŴë·Î STAR´Â 32GB ÀÌ»ó ÇÊ¿ä·Î ÇÏÁö¸¸ ¼Óµµµµ ¿ö³« ÁÁ°í Æ÷±âÇϱ⠾î·Á¿î ºÎºÐµéÀÌ ¸¹Àº °Í °°½À´Ï´Ù.
salmon°ú kalisto ¶ÇÇÑ Àß »ç¿ëÇÏ°íÀÖ½À´Ï´Ù!
´Ù¸¸ public data ¼ö½Ê°ÇÀ» °°ÀÌ ºÐ¼®ÇÏ·Á´Ùº¸´Ï ÄÄÇ»Æà ÆÄ¿ö°¡ Á¶±Ý ºÎÁ·ÇÔÀ» ´À³¢°í ÀÖ½À´Ï´Ù.
¸»¾¸ÇϽŴë·Î 3700xÁ¤µµ·Îµµ Â÷ÈÄ¿¡ ±¦ÂúÀ»±î¿ä..
¼¼±ÝÀÌ µé¾î°¡´Â ¿¬±¸ºñ¸¦ »ç¿ëÇÏ´Â ÀÔÀåÀÌ´Ùº¸´Ï Á¶±Ý ´õ ½ÅÁßÇÏ°Ô µÇ³×¿ä.
(Ãß°¡) ´äº¯ ¾²´Â µµÁß ±ÛÀÌ Á¶±Ý ´õ ´Ã¾î ÀÖ¾ú³×¿ä. trimmingÀÇ ½Ã°£¶ÇÇÑ ¹«½ÃÇÒ ¼ö ¾ø°í salmon°ú kalisto°¡ ¸Å¿ì ÁÁÀº pseudo align ¹ýÀÓÀ» ¾ËÁö¸¸ ¿©·¯ ¹æ¹ýÀ» ¸ðµÎ Çغ¸´Â°Ô ±âº»ÀûÀÎ ½ÇÇè¹ýÀ̶ó »ý°¢ÀÌ µé¾î¼¿ä~
ÇÏ´Â ÀÏÀº ÀüºÎ ºñ½Áºñ½ÁÇѵ¥¿ä
¸ÞÀÎÀÌ ±×ÂÊÀ̶ó¸é ¼Óµµ°¡ »ý¸íÀÌ´Ï ÀÌ ÀÌ»óµµ ¿À¹ö½ºÆåÀº ¾Æ´Ò °Í °°½À´Ï´Ù. Cpu³²À¸¸é ÀÏ ÇѲ¨¹ø¿¡ ´ÙÁßÈÇؼ ¸¹ÀÌ ½ÃÅ°¸é ±×¸¸ÀÎÁö¶ó...
±×¸®°í Àú´Â Æ®¸®¹Ö ¾ÈÇÏ´Â °æ¿ì°¡ ¸¹¾Æ¼ ±×ÂÊÀº Àß ¸ð¸£°Ú³×¿ä. ¾î´ÀÂÊÀÌ´ø°£¿¡ cpu ÀÚ¿øÀÌ ¸¹¾Æ¼ ¼ÕÇغ¸´Â ÀÛ¾÷Àº Àý´ë¾Æ´Ï°ÚÁÒ...
°Ô´Ù°¡ Àú´Â ½Ç·ÂÀÌ ¹ÌõÇؼ STARÀº ÀÛµ¿µµ ¸ø ½Ãŵ´Ï´Ù. ¿Ö ¾È µÇ´ÂÁö ¸ð¸£°Ú¾î¿ä À½ÇÖÇÖÇÖ
±ÍÂú¾Æ¼ ÆÄÀ̽㵵 ¾È ¾²°í ÁË´Ù r package·Î µ¥ÀÌÅÍ Ã³¸®ÇÏ´Â »ç¶÷À̶ó~
´çÀå Á¦°¡ »ç¿ëÇϰųª ±Ù ¸î³â ³»·ÎÀÇ human transcriptome ºÐ¼®¿¡¼´Â ¸»¾¸ÇØÁֽŠ3950x¸é ÃæºÐÇÒ °Í °°½À´Ï´Ù.
Ȥ½Ã À¯Áö º¸¼ö Ãø¸é¿¡¼ ·¦¿¡¼ Á¶¸³ ÄÄÇ»Å͸¦ »ç¿ëÇصµ ±¦ÂúÀ»Áö ¾Æ½Ã´Â ¹Ù°¡ ÀÖÀ¸½Ç±î¿ä...
¸ð¸£°Ú³×¿ä... Á¶¸³ÄÄÇ»ÅÍ ¿¬±¸ºñ·Î ±¸¸ÅÇÑ °æ¿ìµµ ¾Ë±ä Çϴµ¥ ÀüºÎ À¯Áöº¸¼ö°¡ ÇÊ¿äÇÒ¸¸Å ºý¼¼°Ô µ¹¸®Áö ¾ÊÀº °Í °°¾Æ¼
µµ¿òÀº ¸ø µÉ °Í °°¾Æ¿ä.
¿¬±¸ Àß µÇ½Ã±æ ±â¿øÇÏ°Ú½À´Ï´Ù!
Àåºñ¿ë ½Ã½ºÅÛ ³³Ç° Çϴµ¥ amd·Î ³ª°£ Àåºñ¸¸ ÇÁ·Î±×·¥ ȣȯ¼ºÀÌ ¸Å¿ì ¾ÈÁÁ¾Æ¼ ÇÏ·ç°É·¯¼.... ¼ö½Ê´ë¾¿ cs °¡ µé¾î¿É´Ï´Ù ¤Ð¤Ð
¹¹ ÇÏ´Â°Ô ´Ã´Ùº¸¸é À©µµ¿ì°¡ ÇÊ¿äÇÒ ¼öµµ ÀÖ°ÚÁö¸¸ ´ÙÇàÈ÷µµ ¸ÞÀε¥Å¾Àº ¾ÆÁ÷Àº ¾µ¸¸ÇÑ 4770k¶ó¼ ±×·± °úÁ¤Àº ÀÌ°É·Î ÇØ°áÇÏ¸é µÇ°ÚÁÒ ¤¾¤¾
¹ÙÀ̳ʸ® ±×³É ¹Þ¾Æ¼ ¾²°Å³ª ¼Ò½ºÄÚµå ÄÄÆÄÀÏÇؼ ¾²´Âµ¥, AMD FX ½Ã¸®Áî ½ÃÇÇÀ¯ ³ª¿ÀÀÚ¸¶ÀÚ ¿ìºÐÅõ ±ò¾Æ¼ Âß ¾²°í ÀÖÁö¸¸
AMD ½ÃÇÇÀ¯¶ó°í ¹®Á¦ »ý±â´Â °æ¿ì ¾ø½À´Ï´Ù. À©µµ¿Í ´Þ¸® ¸®´ª½º¿¡¼´Â AMD FX ½ÃÇÇÀ¯°¡ ¼º´ÉÀÌ Àß ³ª¿ÍÁÖ´Â ÆíÀÌÁÒ.
ÀÏ´Ü ½Ã°£ Á¦ÀÏ ¸¹ÀÌ Àâ¾Æ¸Ô´Â ºÎºÐºÎÅÍ °³¼±ÇØ º¸¼¼¿ä. Æ®¸®¹ÖÀ» ¿¹·Î µé¸é Á¦ °æ¿ì¿£ fastp¸¦ ÀÌ¿ëÇؼ ½Ã°£ ¾öû ÁÙ¿´½À´Ï´Ù. ÀÌ°Ô ¾öû ºü¸£±ä Çѵ¥ anaconda·Î ¹öÀü ¾÷µ¥ÀÌÆ® µÉ¶§¸¶´Ù °¡²û ÀÖÁöµµ ¾ÊÀº ¾î´ðÅ͸¦ ³¯¸°´Ù°í ½ÃÄö½º°¡ ª¾ÆÁö´Â ¹®Á¦ µîÀÌ ÀÖ¾î¼ °æ¿ì¿¡ µû¶ó fastx_toolikt À» ¾µ ¶§µµ ÀÖÁö¿ä. ¿¹Àü¿¡ ¸Ú¸ð¸£°í ´À·ÁÅÍÁø NGS QC Toolkit ¾µ¶§¿Í´Â õÁö Â÷ÀÌ´õ¶ó±¸¿ä. ±×¸®°í ¾Æ½Ã´Â´ë·Î Kallitso°¡ Bowtie + eXpress ´ëºñ ÈÎ ºü¸£°í ¸®¼Ò½ºµµ Àû°Ô ¿ä±¸ÇÕ´Ï´Ù. °á±¹Àº ÃֽŠÇÁ·Î±×·¥µéÀ» ²ÙÁØÈ÷ ã¾Æ¼ Å×½ºÆ® ÇØ ºÁ¾ß µÇ´õ±º¿ä.
·¥ÀÌ 256GB ±îÁö ÇÊ¿äÇϸé, ÇöÀç °¡¼ººñ´Â µà¾ó Á¦¿Â E5 ½ÃÇÇÀ¯ ¾²´Â ±¸Çü ¿÷½º°¡ ÁÁ½À´Ï´Ù. 16GB DDR3 ¼¹ö·¥ÀÌ 3¸¸¿ø Á¤µµ°Åµç¿ä. ´Ù¸¸ ¿À·¡Àü ¸ðµ¨µéÀÌ¶ó¼ »óÅ°¡ ÁÁÀº ¹°°ÇÀ» ãÀ¸¼Å¾ß Çϴµ¥, Àß Çϸé 100¸¸¿ø´ë·Îµµ µà¾ó ¿ÁŸÄÚ¾î ½ÃÇÇÀ¯, 256GB ·¥ Á¤µµ·Î ½Ã½ºÅÛ ±¸ÇÒ ¼ö ÀÖ¾î¿ä. ±×¸®°í ·¥ÀÌ 128GB ÀÌÇϷεµ ÃæºÐÇÒ °æ¿ì¶ó¸é AMD 3900X Á¤µµ¸é °¡¼ººñ ÁÁ´Ù°í »ý°¢ÇÕ´Ï´Ù. Á¦°¡ ÁÖ·Î ÇÏ´Â ÀÛ¾÷µé ±âÁØÀ¸·Î´Â CPUbenchmark.net ÀÇ CPU Á¡¼ö°¡ Àß ¸Â´Â ÆíÀÌ´Ï±î º¥Ä¡¸¶Å© Á¡¼ö Âü°íÇϼż ½ÃÇÇÀ¯ ¼±Á¤Çϼ¼¿ä (»ý°¢º¸´Ù 3900X¿Í 3950X Á¡¼ö Â÷ÀÌ º°·Î ¾È³³´Ï´Ù). ¾ÆÁÖ ºü¸§ ÄÄ ÇÑ´ë º¸´Ù´Â Àû´çÈ÷ ºü¸¥ ÄÄ µÎ´ë°¡ À¯¸®ÇÑ°Í °°±¸¿ä, ±¸ÀÔ ½Ã±â´Â ¹¹ ±â´Ù¸®¸é ³¡ÀÌ ¾øÀ¸´Ï±î ·¥ °¡°Ý ´õ ¿À¸£±â Àü¿¡ ¾ó¸¥ ±¸ÀÔÇÏ½Ã´Â°Ô ³ªÀ»°Í °°½À´Ï´Ù. ±â¼ºÇ° ±øÅë ¿÷½º ±¸ÀÔÇؼ ·¥, ÇÏµå ¾÷±×·¹À̵å Çصµ µÇ±¸¿ä. óÀ½ºÎÅÍ »ç¾ç °®Ãç¼ ¿÷½º ÁÖ¹®ÇÏ¸é °¡°ÝÀÌ ³Ê¹« ¿Ã¶ó°¡´õ±º¿ä.
Àú´Â ¿ÏÁ¦Ç° ¿÷½º¿Í Á¶¸³ ¿÷½º µÑ ´Ù ¾²°í Àִµ¥, À¯Áö º¸¼ö¶ó°í ÇÒ°Ç µÑ ´Ù ¾ø½À´Ï´Ù. ¹¹ µ¥ÀÌŸ ¹é¾÷ÀÌ °ÅÀÇ ÀüºÎ ¾Æ´Ñ°¡ ½Í¾î¿ä. µö·¯´× ¾ÈÇϽǰÅÁÒ? ±×·¡ÇÈÄ«µå´Â Á¦ÀÏ Àú·ÅÇÑ ¶óµ¥¿ÂÀ¸·Î Çϼ¼¿ä. ¾îÂ÷ÇÇ Å͹̳ο¡¼ ÀÛ¾÷ÇÏ°í, µû·Î ¼³Ä¡ÇÏ´Â ÁöÆ÷½º µå¶óÀ̹ö°¡ ¹ö±×°¡ ´õ·¯ ÀÖ¾î¼ Àú´Â ¶óµ¥¿Â Ä¿³Îµå¶óÀ̹ö°¡ Á¦ÀÏ ¼ÓÆíÇÏ´õ¶ó±¸¿ä.
Àú´Â T7600 ¿÷½º, Á¶¸³ ÀÎÅÚ X79, X99, ±×¸®°í AMD 3900X »ç¿ëÁßÀÔ´Ï´Ù. ·¥Àº 64~256GB Á¤µµ°í, 3~4TB HDD, ±×·¡ÇÈÀº ¶óµ¥¿Â 5450, 6450 ¾¹´Ï´Ù.
4³â Àü±îÁö¸¸Çصµ X58 Á¶¸³ÄÄ¿¡ ·¥ 48GB ³¢¿ö¼ ½è¾úÁÒ. 30Gbp ¾î¼Àºí¸® Çϴµ¥ ÀÏÁÖÀÏ Á¤µµ °É·È¾ú¾î¿ä. ¤Ð¤Ð
trimming °úÁ¤¿¡¼ trim galore¿¡¼ BBdukÀ¸·Î ³Ñ¾î°¡°íÀִµ¥ ÀÌÄ£±¸ ¶ÇÇÑ ¼Óµµ°¡ ±¦ÂúÀº °Í °°½À´Ï´Ù.
¿öÅ©½ºÅ×À̼DZÞÀ¸·Î ÷ºÎÅÍ ´«À» ³ô¿©¼ °¡±âº¸´Ù´Â ¸»¾¸ÇØÁֽŴë·Î 3900X or 3950x 128GB Çϵå 4TB ¶óµ¥¿Â ½Ã½ºÅÛÀ¸·Î ±¸ÃàÇؾ߰ڽÀ´Ï´Ù^^
ÃßÈÄ¿¡ ´õ ³ôÀº »ç¾çÀÌ ÇÊ¿äÇÏ´Ù¸é ±× ¶§ ½Ã½ºÅÛÀ» ´õ ±¸ÃàÇÏ´Â°Ô ´õ µµÀ³ÀÌ µÉ °Í °°³×¿ä!