티스토리 뷰

728x90

인간 게놈 프로젝트는 인간이 가지고 있는 게놈의 모든 염기 서열을 해석하기 위한 프로젝트이다.

이는 1990년에 시작되어 2003년에 완료되었다.

이 프로젝트는 1990년에 미국 에너지부(DOE :Eepartment of Energy)와 국립조건원(NIH : the national Institutes of Health)에서 30억 달러 정도의 예산을 가지고 발족시켰다.

본래 15년 계획으로 잡혀 있었지만, 그동안 생물학과 정보학이 이론적ㆍ기술적으로 발전하면서 실제로는 예정보다 2년 정도 빠른 2000년에 게놈의 기본 드래프트가 완성되었으며, 같은 해 6월 26일에 빌 클린턴 전 미국 대통령과 토니 블레어 전 영국 총리에 의해 발표되었다.

이후 지속적인 작업이 수행되어 2003년 4월 14일에 완성된 드래프트가 공개되었으며, 여기에는 인간이 가진 모든 유전자 중 99%의 서열(sequence)이 99.99%의 정확도로 포함되어 있었다.

 

현재, 인간 게놈 프로젝트로 밝혀진 바에 따르면 인간 유전자는 모두 약 20000개에서 25000개 정도가 있다고 하며, 이 수는 과학자들이 예산한 것보다 상당히 적다는 수이다.

이 프로젝트의 또 하나의 목표는 빠르고 효율적인 DNA 서열화 방법을 개발하여 산업화하는 것이라 할 수 있으며, 이는 어느 정도 실현되었다.

그러나 이런 방식으로 프로젝트 목표가 달성되더라도, 단순히 DNA 서열만 가지고 만든 데이터베이스만으로는 이용 가치가 없기 때문에 이를 해석해서 이용할 수 있는 컴퓨터 프로그램, 즉 어노테이션(annotation)의 개발이 필요하며, 이는 생명정보학의 가장 일반적인 작업이다.

기본적으로 이러한 어노테이션은 생물학 연구자가 하나하나 찾아내어 가야 하지만, 게놈 프로젝트와 같이 대량의 정보 처리가 필요한 상황에서는 컴퓨터를 이용한 빠른 처리가 필요해지기 때문에 현재 이러한 생물정보학적 방법론(Big Data Science)은 게놈 프로젝트에서 매우 중요한 부분을 담당하고 있다.

 

DNA 서열화 알고리즘 중, 가장 대표적인 알고리즘은 1970년도에 솔 니들만(Saul B. Needleman)과 크리스티안 분쉬(Christian D.Wunsch)에 의해 개발된 니들만-분쉬 알고리즘이다.

이 알고리즘은 정보과학의 문제 해결 기법 중 하나인 동적 계획법을 생명정보학에 응용한 첫 번째 사례로, 공통 부모를 가진 두 자식의 염기 서열 간의 유사패턴을 분석하는 기능을 수행한다.

예를 들어, 공통 부모를 가진 자식 A의 염기 서열이 "ATGCCC"이고 자식 B의 염기서열이 "AGGTCG" 라고 할 때, 자식 A에 대한 자식 B의 공통 염기 서열은 "AGC"임을 밝혀내고, 다른 염기 서열에도 이 과정을 반복적으로 진행함으로써 모든 인간의 공통 염기 서열, 즉 게놈 프로젝트의 기초 연구를 완료한 것이다.

 

 

728x90
300x250
공지사항
최근에 올라온 글
최근에 달린 댓글
링크
«   2024/07   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
글 보관함