메뉴 바로가기 본문 바로가기 하단 바로가기

문의사항

분산 병렬 파이프라인 문의
  • 유형 이용문의
  • 상태답변완료
  • 작성자 q***********
  • 작성일2024-12-12 11:23:20
  • 조회수38

안녕하세요.

바이오익스프레스에서 가용한 병렬 분산 파이프라인(gatk spark, halvade, adam 등)이 있는지 문의드립니다.

더불어 바이오 익스프레스에서 제공하는 툴들이 어떤 것들이 있는지 목록으로 제공 받을 수 있는지 궁금합니다.

 

감사합니다.

  • #문의

첨부파일

답변이 완료된 게시글은 수정/삭제가 불가능합니다.

답변

안녕하세요, 바이오 익스프레스 개발팀입니다.

문의 주신 사항에 대해 아래와 같이 답변드립니다.

 


 

1. 바이오 익스프레스에서 가용한 병렬 분산 파이프라인 (GATK Spark, Halvade, ADAM 등) 관련

현재 바이오 익스프레스에서는 GATK-Spark를 활용할 수 있습니다.

CLOSHA 워크벤치의 스크립트 에디터 기능을 통해 Bash 스크립트를 작성하여 실행할 수 있습니다. 아래는 사용 예시 코드입니다.

사용 예시 코드:

 

/opt/apps/gatk/current HaplotypeCallerSpark \
  --java-options "-Xms10g -Xmx10g" \
  -I /bioex/input/input.bam \
  -O /bioex/output/output.vcf.gz \
  -R /bioex/ref/hg38 \
  -L /bioex/ref/hg38.interval_list \
  -OVI true --emit-ref-confidence GVCF \
  --tmp-dir /bioex/tmp \
  -- \
  --spark-runner LOCAL \
  --spark-master local[6] \
  1> /bioex/logs/haplo.log \
  2> /bioex/logs/haplo.err

리소스 제한 사항:

바이오 익스프레스에서는 분석 작업에 사용할 수 있는 최대 리소스가 6코어, 64GB 메모리로 제한됩니다. 
 
이를 초과하여 자원을 설정할 경우 작업이 강제 종료될 수 있으니 유의하시기 바랍니다.

추가 도구 요청:
 
Halvade, ADAM 등 다른 도구의 사용이 필요하신 경우, 연구지원 통해 요청해 주시면 검토 후 안내드리겠습니다.


 

2. 바이오 익스프레스에서 제공하는 도구 목록

현재 바이오 익스프레스에 설치된 분석 도구는 CLOSHA 워크벤치의 Tools 목록에서 확인 가능합니다. 

 

추가로 필요한 도구가 있으시면 요청해 주시면 검토 후 지원 여부를 안내드리겠습니다.

 

추가로 궁금한 사항이나 요청이 있으시면 언제든지 연락 주십시오.


감사합니다.

바이오 익스프레스 개발팀 드림-

 

 

TOP