세계 최대 규모 전장 유전체 연관분석 병렬화 달성
상태바
세계 최대 규모 전장 유전체 연관분석 병렬화 달성
  • 최경주 기자
  • 승인 2022.03.31 08:55
  • 댓글 0
이 기사를 공유합니다

KISTI, 병렬컴퓨팅 기술 통해 전장유전체 통계오류 보정계산 최적화 실현
A. MPI-GWAS 알고리즘 개요도: 무작위 순열조합(N-Permutation)의 빠른 계산을 위해MPI-Rank를 통한 동시/병렬분석을 진행함B-C. 성능평가결과: (B) 병렬처리노드 증가를 통해 전체계산시간 감소확인(C) 데이터와 병렬처리노드 동시증가에 따른 수행시간의 확장성 확인
A. MPI-GWAS 알고리즘 개요도: 무작위 순열조합(N-Permutation)의 빠른 계산을 위해MPI-Rank를 통한 동시/병렬분석을 진행함B-C. 성능평가결과: (B) 병렬처리노드 증가를 통해 전체계산시간 감소확인(C) 데이터와 병렬처리노드 동시증가에 따른 수행시간의 확장성 확인

한국과학기술정보연구원(원장 김재수, 이하 KISTI)은 전장유전체 연관분석(Genome Wide Association Study, 이하 GWAS)의 통계 오류를 보정하기 위한 거대규모 슈퍼컴퓨팅 소프트웨어(SW)를 개발했다고 밝혔다.

KISTI 국가 슈퍼컴퓨터 5호기 누리온에서 개발된 SW를 활용해 한국인 코호트 7523명과 영국인 코호트 4242명에서 보고된 8만4295개의 유전변이에 따른 당뇨, 고혈압과 연관된 유전변이를 GWAS 계산을 통해 도출하고, 최대 70억 회 이상의 무작위 조합(random permutation)을 수행해 통계 오류를 보정 할 수 있었다.

이번 슈퍼컴퓨팅 시뮬레이션 SW는 국가 슈퍼컴퓨터 5호기 누리온의 최대 2500 노드를 동시에 사용해 기존 통계 프로그램 대비 약 300% 이상의 계산 가속화가 가능하다. 

GWAS 분석 결과는 표현형(질병 또는 과일의 무게 등)과 연관된 유전변이의 선발을 목표로 하며, 유의미한 질병 연관 유전변이의 발견은 개인 맞춤형 건강 관리 및 농축산 분야의 신품종 개량을 가능하게 하는 중요한 지표로 여겨지고 있다. 따라서 GWAS 분석 결과의 통계 오류 보정은 필수적이다.

GWAS 분석의 통계 오류 보정은 방대한 계산으로 인해 해당 분야 연구 난제로 남아있었다. KISTI는 계산 병렬화 기술을 통해 대규모의 슈퍼컴퓨팅 기반 패타플롭스 규모의 계산으로 기존의 통계오류 보정이 가능함을 확인했다.

KISTI의 국가 슈퍼컴퓨터 5호기 누리온을 활용하여 세계최대 규모(7.5페타플롭스)로 GWAS에 대해서 수행했다.

권오경 박사와 백효정 박사는 “이번 GWAS 관련 병렬화 SW는 소스코드를 공개해 다양한 유전체 연구자들이 자유롭게 활용할 수 있도록 했다"며 "유전체 분야에 슈퍼컴퓨터를 활용한 연구 효율화가 기대된다”고 말했다.

이번 연구 결과는 국제 저널인 Genomics & Informatics에 3월 31일 게재됐다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
    이슈포토