loading
본문 바로가기
카테고리 없음

DNA, RNA, 그리고 단백질의 기본 개념

by 분생 2022. 8. 30.

DNA에 대해

지난 포스팅에서 예고한것과 같이 이번에는 분자생물학의 기본 개념을 습득하기 위해 필요한 기초 지식에 대한 내용을 다루도록 하겠습니다. 살펴볼 내용은 다음과 같습니다.

  • DNA에 대해
  • RNA에 대해
  • 단백질에 대해

 

DNA는 Deoxyribonucleic acid의 약자입니다. 디옥시리보핵산이라고 번역하여 부르기도 하지만 핵산을 제외한 디옥시리보 부분은 번역이 되지 않기 때문에 그냥 영문으로 읽는 것이 다른 사람들과의 소통에서 더 편리합니다. 지난 포스팅에서 분자생물학의 기본 원리를 생각할 때 어떻게 가시화 할 것인가에 대해 설명드렸던 내용이 있습니다. 이번에 말씀드리고자 하는 부수적인 이야기는 용어에 대한 것입니다. 분자생물학을 이해할 때에는 모든 용어가 영어로 되어 있습니다. 한국어로 번역도 가능하지만 굉장히 이질감이 느껴지거나 제대로 이해하기 어려운 형태로 번역되는 경우가 많습니다. 또한 DNA의 '디옥시리보'처럼 한국어로 번역 자체가 불가능한 용어들도 많이 존재합니다. 보통 고등학교 교과과정에서는 번역된 용어를 사용하는듯 하지만, 어차피 이 분야로 계속해서 연구나 공부를 하실 분들이라면 앞으로 접하게 될 많은 자료들이 영어를 기반으로 작성되어 있기 때문에, 생물학 용어에 대해서는 영어 단어 그대로 읽고, 쓰고, 이해하는 것이 좋습니다.

 

다시 원점으로 돌아와서 DNA에 대해 설명을 하겠습니다. DNA의 'Deoxyribo-' 에 해당하는 부분은 deoxyribose라는 5개의 탄소로 이루어진 5탄당입니다. DNA의 기본 구조가 당+염기+인산의 구조인데, 이 중에서 '당'에 해당하는 부분이 바로 deoxyribose입니다. 염기는 A(Adenine), G(Guanine), C(Cytosine), T(Thymine)으로 구성됩니다. A,G,C,T가 나열되면서 고유의 DNA 특성을 갖게 되는 것입니다. A와 T는 서로 이중 수소결합을 하고, G와 C는 삼중 수소결합을 합니다. 그래서 A는 T와, G는 C와 마주보게 되는데 이를 DNA에서 상보적 결합이라고 부릅니다. DNA는 이중가닥으로 구성되어 있기 때문에 한 가닥의 서열이 AGCT라면, 반대쪽에서 마주보고 있는 가닥은 이와 상보적인 TCGA 서열로 마주보고 있게 됩니다. 5탄당 deoxyribose의 다른 부분에는 인산기가 연결되어 있습니다. 

 

이러한 기본적인 DNA가 뭉쳐지고 꼬여지면서 압축되어 만들어 지는 것이 염색체(Chromosome)입니다. 간단하게 설명하자면 DNA가 히스톤이라고 부르는 단백질을 감싸면서 nucleosome이라고 부르는 것을 만들어냅니다. Nucleosome들이 뭉쳐서 30nm 폭의 섬유를 만들어내게 되고, 이 30nm 섬유는 또 루프 형태로 압축되고 꼬여지면서 최종적으로 chromosome이 되는 것입니다. 

 

 

RNA에 대해

RNA도 DNA와 마찬가지로 약자입니다. Ribonucleic acid의 약자로, 리보 핵산이라고 번역할 수 있습니다. 이 또한 역시나 5탄당의 이름인데, DNA와의 차이점은 'Deoxy-' 접두사의 차이입니다. Deoxy의 뜻은 ~이 없다는 뜻의 'De-'와 산소를 뜻하는 'Oxy'가 결합된 접두사로, 뜻을 해석하자면 산소가 없다는 의미입니다. 산소가 없는 위치는 ribose 5탄당의 2번 탄소 위치입니다. Deoxyribose가 2번 탄소 끝에 '-OH'가 붙어있다면, Ribose의 2번 탄소 끝은 '-H'입니다. 또 한가지 차이점은 DNA에서는 염기가 A,G,C,T가 사용되었던 반면, RNA에서는 A,G,C,U가 사용됩니다. T대신 U가 포함되는 것입니다. U는 Uracil이라는 염기로, thymine과 굉장히 유사한 구조를 갖고 있습니다. 그래서 RNA로 상보적인 sequence를 확인하고자 하실 경우에는 A와 T가 아닌, A와 U를 매칭시켜 주시면 됩니다. 이는 이후 설명할 단백질 파트에서 코돈을 해석할 때에도 해당되는 내용이니 RNA에서는 U를 T대신 사용한다는 개념을 꼭 기억하고 계시기 바랍니다. 

 

또 다른 중요한 차이점은 RNA는 '대부분' 단일가닥으로 존재한다는 것입니다. 여기서 대부분을 강조해서 사용한 이유는 생물학 분야는 예외적인 상황이 항상 존재하기 때문에 우리가 현재 알고 있는 개념들은 절대적인 개념들이 아니기 때문입니다. RNA도 처음에는 단일가닥이라고 생각하였으나 이후 수많은 연구들을 통해 다양한 형태의 RNA들이 발견되고, 연구되어 가고 있습니다. RNA 뿐만 아니라 또 다른 우리가 알고 있는 생물학적 지식은 100% 절대적인 지식이라고 생각하면 안됩니다. 지금은 그렇게 보일지 몰라도 이후 다른 연구들을 통해 그 개념이 꼭 맞는것은 아니라는 결과들이 나오는 경우가 다반사입니다. 

 

마지막으로 RNA는 여러종류가 발견되어 연구되고 있다고 말씀드렸던 것과 같이, 그 종류가 다양합니다. 우리가 앞으로 가장 많이 살펴 보게 될 개념인 mRNA부터 tRNA, rRNA 등이 대표적으로 알려져 있는 RNA들입니다. 이 외에도 많은 RNA의 형태와 종류들이 존재합니다. mRNA는 DNA로부터 만들어져 단백질이 되기 전 상태를 의미합니다. mRNA가 DNA의 전체 서열을 반영하지는 못하고, DNA중에서 Exon이라는 부분만을 전사(Transcription)해놓은 형태입니다. DNA의 intron 부분은 이전에는 쓸모없는 부분이라고 여겨왔으나, 이 역시 절대적인 개념이 아니었기 때문에 최근 연구들을 통해 intron의 기능적 측면들이 계속해서 발표되고 있습니다.

 

단백질에 대해

단백질은 DNA가 mRNA로 Transcription되고, 이 mRNA가 translation되어 나타난 최종 형태라고 보시면 됩니다. mRNA의 sequence를 3개씩 묶어서 여기에 상보적인 서열 3개로 이루어진 아미노산이 생성되게 되는데 이를 코돈(Codon)이라고 부릅니다. Codon은 3개의 nucleotide seq가 짝을 이루어 고유의 아미노산이 되므로, 만약 DNA나 RNA 합성 상태에서 point mutation이 생기거나 할 경우 codon이 하나씩 밀리거나 다르게 번역되는 현상이 나타납니다. 그러면 단백질은 고유의 형태와 전혀 다른 형태로 나타나기도 하고 심지어 translation이 되다가 중간에 끊겨버리는 현상이 나타나기도 합니다. 단백질의 Codon은 google에 codon표 라고 검색해보면 1번 염기, 2번 염기, 3번 염기를 각 표로 나타낸 것이 많이 검색됩니다. 이를 1번부터 순서대로 읽으면 되고, 대표적으로 ATG(RNA 기준으로는 AUG)가 Met을 합성하는데, 여기가 시작부분 Start codon이 됩니다. Met으로 부터 단백질 합성이 시작되어 TAA, TAG, TGA (UAA, UAG, UGA)의 stop codon까지 번역을 하는 과정으로 생성됩니다.

 

단백질은 1차구조부터 4차구조까지로 이루어집니다. 그래서 위에서 설명한 Codon이 아미노산 서열을 길게 만들어 내고 나면 이것이 단백질의 1차구조라고 할 수 있습니다. 이렇게 된 1차구조가 helix구조나 sheet 구조로 나타나는 것을 단백질의 2차구조라고 부릅니다. 이런 2차구조가 모이고 단백질 자체의 folding이 고유하게 일어난 구조를 단백질의 3차구조라고 부릅니다. 이러한 3차 구조들이 complex를 이루는 경우 단백질의 4차구조라고 부르게 됩니다. 

 

단백질을 구성하는 기본 아미노산 구조는 C 탄소를 중심으로 한 쪽에는 -NH2 아미노기가 붙어있고, 다른 한 쪽에는 -COOH 카복실기가 붙어있습니다. 그래서 우리가 연구를 수행하다보면 단백질의 N-terminal이나 C-terminal이라는 용어를 듣게 되는데, 이것이 NH2 부분의 말단인지 COOH부분의 말단인지를 표현하는 용어입니다. 

댓글