遺伝暗号
[Wikipedia|▼Menu]
mRNA分子に沿って一連のコドンを示している。各コドンは3ヌクレオチドからなり、一つのアミノ酸を指定している。

コドン(: codon)とは、核酸塩基配列が、タンパク質を構成するアミノ酸配列へと生体内で翻訳されるときの、各アミノ酸に対応する3つの塩基配列のことで、特に、mRNAの塩基配列を指す。DNAの配列において、ヌクレオチド3個の塩基の組み合わせであるトリプレットが、1個のアミノ酸を指定する対応関係が存在する。この関係は、遺伝暗号、遺伝コード(: genetic code)等と呼ばれる。

ほぼ全ての遺伝子は厳密に同じコードを用いるから(#RNAコドン表を参照)、このコードは、しばしば基準遺伝コード(: canonical genetic code)とか、標準遺伝コード(: standard genetic code)、あるいは単に遺伝コードと呼ばれる。ただし、実際は変形コードは多い。つまり、基準遺伝コードは普遍的なものではない。例えば、ヒトではミトコンドリア内のタンパク質合成は基準遺伝コードの変形したものを用いている。

遺伝情報の全てが遺伝コードとして保存されているわけではないということを知ることは重要である。全ての生物のDNAは調節性塩基配列、遺伝子間断片、染色体の構造領域を含んでおり、これらは表現型の発現に寄与するが、異なった規則のセットを用いて作用する。これらの規則は、すでに十分に解明された遺伝コードの根底にあるコドン対アミノ酸パラダイムのように明解なものかも知れないし、それほど明解なものではないかも知れない。
簡易解説・コドン
コドンはmRNA上にある

コドンは、厳密には実際のタンパク質の設計図として機能するmRNA中に存在している、アミノ酸1個に対応したヌクレオチドの塩基3個の配列のことを指す。RNAのヌクレオチドの塩基は、A(アデニン)、C(シトシン)、G(グアニン)、U(ウラシル)の4種類がある。そして、mRNA中の塩基の配列は、細胞で遺伝情報を保持しているDNAから転写されて作製されるので、コドンをDNA中の塩基の配列と考えることもできる。その場合、塩基のU(ウラシル)をT(チミン)に置き換えて読む。
遺伝コードにおける塩基とアミノ酸の対応

タンパク質を構成する主要なアミノ酸は20種類ある。一方、DNAの構成要素であるヌクレオチドの塩基は、上記のようにわずか4種類である。アミノ酸20種類を区別して指定するのに、塩基1つでは4種類しか区別できず、また、塩基2つの組み合わせでも4×4 = 16種類しか区別できないので足りない。実際の生体内では3個ずつの塩基が1セットになって、アミノ酸1個に対応する形でタンパク質をコードしている。塩基3個の場合、理論的には、4×4×4 = 64種類を区別してコードすることが可能である。実際には、20種類のアミノ酸に加え、どのアミノ酸にも対応しないコドンもあり、ペプチド鎖合成の終了を意味している。これは終止コドンと呼ばれる。また、1つのアミノ酸は複数のコドンと対応している場合が多い。
生物種による利用コドンの偏り

RNAコドン表は、mRNA上にあるコドンとそれが指定するアミノ酸との関係を示した表である。原核生物と真核生物など、生物の種類によって用いているコドンは下記のコドン表とは一部異なっている場合もある。

また、複数のコドンが対応しているアミノ酸では、生物種によって、また同種生物内でも遺伝子によって同義コドンを用いる頻度の傾向が大きく異なり、自己組織化写像などを用いることによってDNA断片から生物種を推定することが出来る。この頻度の違いをコドン出現頻度 (codon usage, codon frequency)の違いという。コドン出現頻度の違いは遺伝子の発現量やそのコドンに対応する tRNA の量と関係があることが知られている。発現量の多い遺伝子のコドン出現頻度の偏りは大きくなり、頻出するコドンに対応する tRNA は細胞内の存在量も多い。これは組換えタンパク質を本来の生物種とは異なる生物種で発現させる際などに問題になる。例えば、ある導入遺伝子に使われているコドンが、ホスト細胞では頻度の低いコドンである場合には、導入遺伝子産物の生産が少ないといったことが起こりうる。このような場合には導入遺伝子にサイレント突然変異を起こしコドンを最適化したり、導入細胞側にマイナー tRNA を過剰に発現させたりすると改善される場合もある。
遺伝コードの解読The genetic code

DNAの構造がジェームズ・ワトソンフランシス・クリックモーリス・ウィルキンスロザリンド・フランクリンらによって解明されたあと、タンパク質が生体内でどのようにコードされているかということの解明に向けて真剣な努力が払われた。ジョージ・ガモフは、生体の細胞内でタンパク質をコードするのに用いられている20ほどの異なるアミノ酸を指定するのに3文字の暗号が用いられていると仮定した(なぜなら4nが少なくとも20以上であるようなnは3が最小だから)。コドンがまさにDNAの3塩基に対応しているという事実を最初に示したのはクリックとシドニー・ブレナーらの実験である [1]。はじめて一つのコドンを明らかにしたのは1961年、アメリカ国立衛生研究所マーシャル・ニーレンバーグとハインリッヒ・マッタイであった [2]。彼らは無細胞系でポリウラシルRNA配列(これは生化学的記号でUUUUU....と表される)を翻訳した。合成できたポリペプチドはフェニルアラニンのみからなるものであることを発見した。このことから、コドンUUUがアミノ酸フェニルアラニンを指定すると推定した。ニーレンバーグと共同研究者らはこの研究を推し進めていって、個々のコドンのヌクレオチド組成を決定することができた。配列の順序を決定するのに3ヌクレオチドがリボソームに固定され、アミノアシルtRNAを放射線標識して、どのアミノ酸がコドンに対応するかを決定した。ニーレンバーググループは64コドン中54の配列を決定できた。続いてハー・ゴビンド・コラナが残りのコドンを決定することができた。その後程なくロバート・W・ホリー が翻訳の際のアダプター分子であるtRNAの構造を明らかにした。この研究は、1959年にRNA合成の酵素学に関する研究によってノーベル賞を受賞したセベロ・オチョアの初期の研究に基づいていた。1968年にコラナ、ホリー、ニーレンバーグらも生理学あるいは医学ノーベル賞を受賞した。
遺伝コードを介して情報を伝達する

生物のゲノムはDNA中に刻まれている。ウイルスの中にはゲノムがRNAに刻まれているものもある。ゲノム中で1つのタンパク質あるいは1つのRNAをコードしている部分を遺伝子という。タンパク質をコードしている遺伝子はコドンと呼ばれる3ヌクレオチドの単位から構成されており、各コドンは1つのアミノ酸をコードしている。コドンのサブユニットである各ヌクレオチドはさらにリン酸、デオキシリボース、窒素を含んだ4種類のヌクレオチド塩基のうちの1つ、という要素からなる。プリン塩基のアデニン(A)とグアニン(G)は大きな塩基で芳香環を2つもつ。ピリミジン塩基のシトシン(C)とチミン(T)は小さい塩基で芳香環を1つしかもたない。DNA鎖は2重らせん構造を取るとき、塩基対結合として知られる配置によって水素結合で互いに会合している。これらの結合はほとんど常に、一方の鎖のアデニンと他方の鎖のチミンの間、同じくシトシンとグアニンの間で行われる。これは2重らせん中のAとTの数、同様にGとCの数が同じであることを意味している。RNAの場合はチミン(T)の代わりにウラシル(U)が用いられ、デオキシリボースの代わりにリボースが用いられる。

タンパク質をコードする遺伝子はDNAに類縁のポリマーRNAである鋳型分子、メッセンジャーRNAあるいはmRNAに転写される。この分子は続いてリボソーム上でアミノ酸鎖つまりポリペプチドに翻訳される。翻訳プロセスは個々のアミノ酸に特異的なトランスファーRNAを必要とする。アミノ酸はtRNAに共有結合している。グアノシン3リン酸(GTP)がエネルギー源となり、一群の翻訳因子も必要である。tRNAはmRNAのコドンに相補的なアンチコドンをもっており、3'末端のCCAで共有結合によってアミノ酸を結合・保持する。各tRNAは特異的なアミノ酸をアミノアシルtRNA合成酵素によって結合・保持する。この酵素はアミノ酸と、対応するtRNAの双方に高い特異性をもっている。これらの酵素に高い特異性があることが、タンパク質の翻訳が厳密に行われることの主要な理由である。

3ヌクレオチドからなるトリプレットコドンによって可能なコドンの組合せは、43=64種類ある。実際、標準遺伝コードの64コドン全てがアミノ酸あるいは翻訳ストップシグナルに割り当てられている。例えばRNAの塩基配列がUUUAAACCCであったとしよう。読み枠は先頭のU(慣例により5'から3'とする)から始めてコドンを当てはめると3コドンが得られる。つまり、UUU、AAA、CCCである。各コドンは1つのアミノ酸に対応し、このRNAの塩基配列は3アミノ酸からなる配列に翻訳される。コンピュータ科学に比較対照されるものを求めると、コドンはワードに相当し、データ操作の標準的な単位であり(タンパク質のアミノ酸1つのように)、ヌクレオチド1つは1ビットに相当する。

標準遺伝コードが次の表に示されている。表1は64コドン各々がどのアミノ酸に対応するかを示す。表2は翻訳される標準的なアミノ酸20個の各々がどのコドンに対応するかを示す。これらは、それぞれ、コドン対照表およびコドン逆対照表と呼ばれる。例えばコドンAAUはアスパラギンに対応し、UGUとUGCはシステインに対応する(アミノ酸を標準的な3文字記号で表すとそれぞれAsnとCysである)。
RNAコドン表

表1.64コドンと各々に対応するアミノ酸を示したもの。mRNAの方向は5'から3'である。2つ目の塩基
UCAG
1つ目の塩基U

UUU→Phe/F、
UUC→Phe/F、
UUA→Leu/L、
UUG→Leu/L

UCU→Ser/S、
UCC→Ser/S、
UCA→Ser/S、
UCG→Ser/S

UAU→Tyr/Y、
UAC→Tyr/Y、
UAA Ochre→終止、
UAG Amber→終止

UGU→Cys/C、
UGC→Cys/C、
UGA Opal→終止、
UGG→Trp/W
C

CUU→Leu/L、
CUC→Leu/L、
CUA→Leu/L、
CUG→Leu/L

CCU→Pro/P、
CCC→Pro/P、
CCA→Pro/P、
CCG→Pro/P

CAU→His/H、
CAC→His/H、
CAA→Gln/Q、


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:52 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef