Bio Big Data Analysis
최근 바이오 데이터는 NGS (Next Generation Sequencing) 기술과 Proteomics (단백체연구) 분야의 기술 발전에 힘입어, 대량의 데이터가 빠르게 생산되고 있다. 하나의 실험에서 얻어지는 raw data의 크기가 수십~수백 기가바이트에 이르고 있어, 이들의 처리를 위해서는 Hadoop과 같은 분산컴퓨팅 환경의 활용과 함께 효율적인 알고리즘을 구현할 수 있는 소프트웨어 설계 기술이 요구된다. 기본적인 데이터 분석을 통해 얻어지는 원천 데이터를 데이터베이스화하고 이를 대상으로 질병 상태과 정상 상태 사이의 차이를 설명할 수 있는 유전자 또는 단백질 마커를 (biomarker) 발굴하는 과정은 인공지능과 데이터마이닝의 다양한 기술을 요구한다.

 
 
     Copyright © 2012 Bioinformatics & Intelligent Systems Lab, Hanyang University, Korea. All rights reserved. & 개인정보처리방침