본문 바로가기
생명과학공부

유전체사업과 생물정보학은 무엇일까?(유전체 비교)

by jisoh71 2023. 7. 20.

저번 글에서는 DNA 생명공학 기술이 어떻게 활용되는지에 대해 알아보았습니다. 이번 글에서는 유전체의 진화에 대해 공부하겠습니다.

1. 사람 유전체사업

 전체 유전자의 성질, 상호작용 등을 연구하는 것유전체학(genomics)라고 합니다. 유전체학에 의해 많은 양의 정보가 쌓이고 있고, 이것을 분석하기 위해 생물정보학(bioinformatics) 분야도 생겨났습니다. 생물정보학은 컴퓨터를 이용하여 생물학적 데이터를 저장, 분석하는 것입니다. 유전체의 해독 작업은 1990년 사람 유전체사업(Human Genome Project)에 의해 시작되었습니다. 2003년에는 대강의 유전체 해독이 완료되었고, 2006년에는 마지막으로 1번 염색체가 해독되었습니다. 유전체 지도 작성의 목표는 각 염색체의 염기서열 전체를 읽는 것입니다. 바로 디데옥시 사슬 종결반응 방법을 이용한 염기서열 분석 장비에 의해 이루어졌습니다. 사람 염색체의 반수체인 30억 염기를 결정하는 과정은 큰 작업이었습니다. 기술의 발전에 의해 염기서열화 속도가 빨라져 2016년에는 자동화 기기로 1초에 2500만 염기서열을 분석할 수 있었다고 합니다. 그렇다면 완전한 염기서열을 어떻게 얻을까요? 두 방법이 서로 보완적으로 작용합니다. 전유전체 샷건 방식(whole-genome shotgun approach)연관 지도와 물리적인 지도 작성을 건너뛰고 무작위적으로 잘린 DNA 조각의 염기서열을 분석합니다. 현재는 약 300bp를 동시에 염기서열 분석하여 전체 서열을 빠르게 완성할 수 있습니다. 메타지노믹스(metagenomics)는 환경으로부터 한 생물 집단의 DNA(metagenome)를 서열 분석합니다. 컴퓨터가 단편적 염기서열을 분리하고 유전체 염기서열로 조합합니다.

2. 생물정보학

-단백질을 암호화하는 유전자 발견, 기능 이해

 유전자가 실제로 하는 일은 무엇일까요? 젠뱅크 등의 데이터베이스에서 정보 분석이 안 된 긴 DNA 서열이 있으면 과학자들은 서열상의 모든 단백질 암호화 유전자를 찾아 기능을 알아내려고 합니다. 유전자 주석달기(gene annotation)가 이러한 과정입니다. 먼저 컴퓨터로 유전자가 존재한다는 것을 보여주는 패턴을 찾습니다. 그리고 소프트웨어는 알려진 mRNA들을 지정하는 짧은 서열들을 검색합니다. 수천의 작은 염기서열 조각은 발현서열 꼬리표(expressed sequence tag;EST)라고 합니다. 이것은 cDNA 염기서열 분석을 통해 얻어졌고, 컴퓨터 데이터베이스에 저장되어 있습니다. 두 번째 단계에서는 다른 종의 기존 유전자 서열과 비교해 이 유전자의 특징과 기능을 유추합니다. 세 번째로는 RNA 염기서열 정보나 실제 RNA로 발현되는 것을 살펴봄으로써 유전자의 존재를 확인합니다.

-시스템 수준에서의 유전자, 유전자 발현 억제

시스템생물학

프로테오믹스(proteomics)단백질들의 종류와 양, 화학적 변화와 상호작용에 대해서도 시스템 수준 연구를 하는 것입니다. 유전체학과 프로테오믹스를 이용하면 포괄적 수준에서 생명현상을 연구할 수 있습니다. 시스템생물학(systems biology)목표는 전체 생명 시스템의 역동적 행동을 모델링하는 것입니다. 유전자 회로를 정의하고 단백질 상호작용 네트워크를 정의하기도 합니다. 예를 들어 효모에서는 단백질 상호작용 네트워크를 규명하기 위해 한 번에 한 쌍의 유전자를 녹아웃시켜 이중 돌연변이 세포를 만드는 기술이 사용되었습니다. 그다음 각 이중 돌연변이의 적응도를 두 개의 단일 돌연변이의 적응도와 비교하여 일치하면 두 유전자는 서로 상호작용하지 않는 것입니다. 컴퓨터는 이것을 기초로 유전자 지도를 그립니다.

시스템생물학의 의학적 응용

 종양 유전체 지도도 시스템생물학의 한 예시입니다. 많은 유전자와 단백질 간 상호작용이 동시에 분석되고 있습니다. 2010년에 끝난 프로젝트는 폐암, 자궁암, 뇌암에서 공통 돌연변이를 찾기 위해 정상 세포와 암세포 간 유전자 서열과 발현의 차이를 분석하는 것이었습니다. 이것은 치료에 효과적이었고, 다른 암에도 적용되었습니다. 유전체의 염기서열을 밝히는 것뿐만 아니라 실리콘이나 유리로 만든 칩이 사람 유전자 전체를 담도록 하는 마이크로어레이가 개발되었습니다. 이 칩은 유전자 발현 변화 조사에 사용됩니다. 암에서 어떤 유전자가 과량으로 발현되는지, 아님 정상보다 적은 양으로 발현되는지를 분석해서 의사가 개인에 따른 처방을 내릴 수 있습니다.

3. 유전체의 크기, 유전자 수, 유전자 밀도는 종에 따라 다르다

-유전체의 크기와 유전자의 수

세균, 고세균, 진핵생물 비교 시 원핵생물과 진핵생물 간에는 유전체 크기에서 차이가 있습니다. 세균류는 1~6Mb 정도의 서열이며, 고세균도 비슷합니다. 진핵생물의 유전체는 이보다 대체로 큽니다. 진핵생물 내에서만 비교했을 때 유전체의 크기, 표현형 간의 밀접한 상관관계를 도출하기는 어렵습니다. 원핵생물과 진핵생물은 유전자 수에서도 차이가 있습니다. 세균, 고세균은 진핵생물보다 유전자가 적으며, 약 1500~7500개 정도입니다. 진핵생물은 5000~40000개의 유전자를 가집니다. 진핵생물 내에서는 유전자 수가 유전체 크기에 비해 적은 경우가 있습니다. 사람은 3000Mb의 유전체를 가지지만 유전자 수는 21000개 미만입니다. 이것은 꼬마선충의 유전자 수와 크게 다르지 않습니다. 여기서 중요한 것은 척추동물의 유전자는 암호화 부위에서 RNA 전사체의 선택적 이어 맞추기로 인해 다양성이 증가합니다. 사람 유전자는 일반적으로 10개의 엑손을 가지고, 이 엑손의 90% 이상은 최소한 두 가지 이상의 이어 맞추기 방식이 있습니다. 또한 전구 단백질 절단, 당 추가 등 단백질 합성 이후의 변화가 더해지면 더 많은 다양성 확보가 가능합니다. 마이크로 RNA와 다른 작은 RNA도 다양성을 높입니다. 

-유전자 밀도와 비암호화 DNA

 유전자 밀도를 비교하는 것은 곧 주어진 DNA 길이에 몇 개의 유전자가 존재하는지 확인하는 것입니다. 진핵생물은 훨씬 큰 유전체를 가지지만 일정한 길이의 DNA당 유전자 수는 적습니다. 사람은 세균보다 유전체의 크기는 매우 크나 유전자 수는 5~15배 정도밖에 되지 않습니다. 즉, 사람은 유전자 밀도가 낮은 편입니다. 서열 완전 분석 종에서는 사람을 포함한 포유류가 유전자 밀도가 가장 낮습니다. 대부분의 DNA는 모든 세균의 유전체에서 단백질, tRNA, rRNA 등을 암호화하고 있고, 비암호화 DNA 부분은 아주 일부입니다. 원핵세포의 경우 유전자 염기서열은 비암호화 DNA인 인트론을 가지지 않습니다. 진핵생물 유전체의 대부분은 비암호화 DNA 부분이고, 조절 부위도 복잡합니다. 사람의 유전자 평균 길이 27000 염기쌍과 원핵 유전자 평균 길이 1000 염기쌍의 차이는 대부분 인트론 때문입니다. 그러나 인트론 이외에도 다세포 진핵생물은 단백질 비암호화 DNA 양이 많습니다. 이렇게 이번 글에서는 유전체사업, 생물정보학, 유전체 크기와 유전자 수 등의 종 간 비교를 해보았습니다. 다음 글에서는 이어서 유전체에 대해 알아보겠습니다.