つくば生物ジャーナル Tsukuba Journal of Biology (2005) 4: TJB200501200100745

細胞性粘菌Dictyostelium discoideumのイントロン構造の解析

神谷 恭平 (筑波大学 生物学類 4年)  指導教員: 田仲 可昌 (筑波大学 生命環境科学研究科)

はじめに
 細胞性粘菌Dictyostelium discoideum(以下粘菌と略す)は、多細胞体形成や有性生殖のメカニズムを知るためのモデル生物として広く研究されている。中でも粘菌におけるcDNA解析は、当研究室を中心とするプロジェクトチームにより配列決定が進められ[Dicty_cDB: http://dictycdb.biol.tsukuba.ac.jp/cDNA/database.html]、ゲノム解析は、欧米を中心として配列決定をほぼ完了している[dictyBase: http://dictybase.org/index.html]。
 Dicty_cDBでは、様々な発生時期で作成された遺伝子のcDNAライブラリーのクローン配列をデータベース化している。個々の遺伝子配列を取得するためには、cDNAクローンの完全長配列を決定することが望ましいが、様々な制約からクローンの両端から配列決定を行うに留まっている。そこで不完全な配列情報から遺伝子の完全な配列を得る現実の方法として、当研究室では、配列断片の重なりからもとの配列を再構成するアセンブルプログラムPhrapを使用し、遺伝子配列(Phrap-Contig)のセットを得ている[Contig:contiguous(連続した) sequenceの意味]。また、別の試みとして、cDNA配列とゲノムとのアライメント結果を基に作成されたContig(Clone-Contig)のセットも得ている。Clone-Contigの作成には、GeneSeqerとSim4と呼ばれる2つのアライメントプログラムが活用された。
 一方で、イントロンは、転写後スプライシングにより除去されるが、正確なスプライシングを支える機構は詳しくは分かっていない。一般にイントロン配列中には、末端構造のgt-ag則や、ブランチ部位など、スプライシングに関与する特徴配列の存在が知られている。ゆえに粘菌遺伝子構造を解析するに当たり、イントロンの構造解析は重要であると考えられる。
 本研究では、粘菌遺伝子構造を理解し、さらには転写におけるイントロンの役割を明らかにするために、それらの配列データを活用し、バイオインフォマティクスの手法を用いて粘菌イントロンの網羅的な構造解析を行うこととした。
 さらには、正確な遺伝子構造の決定のためには、遺伝子配列の決定だけでなく、エキソンとイントロンを正確に切り出す事が必要となる。これを実現するために、得られたイントロン情報をもとにして、上述の二種類のContig及び、アライメントプログラムの信頼性の検討も行うこととした。


方法及び結果
 粘菌イントロンの網羅的な解析に向けて、まず粘菌イントロン構造の特徴を知るために、GenBankから取得した総計152個のイントロンを含む98個の粘菌既知遺伝子について、イントロンの構造を解析した。その結果、粘菌イントロンは平均長180nt(最大長:2298nt 最小長 60nt)、1遺伝子あたりのイントロン数1.5個(最大6)、AT含量88%、末端構造のgt-ag則の保存率は94.7%であった。単細胞の真核生物という点で共通している出芽酵母Saccharomyces cerevisiaeのイントロン構造は、長さ150-300nt程度(最大長:1002nt 最小長 25nt)、1遺伝子あたりのイントロン数1.1個、gt-ag則の保存率95.9%で、粘菌イントロンの構造とよく似ていた。
 次に、Contig配列とゲノム配列からイントロンを抽出する際に活用するアライメントプログラムGeneSeqer及びSim4の信頼性の検証を行った。検証にあたり、既知遺伝子の翻訳領域(CDS: cording sequence)を、各プログラムを用いてゲノム配列に貼り付けた。アライメントの結果が、遺伝子構造を正確に捉えるかどうかをもとに、各プログラムの信頼性を検証した。その結果、GeneSeqerは、検証した86本中の71%の既知遺伝子について、完全にその構造を再現した。また、15%程度の既知遺伝子については、短いエキソン、特に末端に位置する10nt以下のエキソンを正確に捉えることができず、視覚的な確認により、改善される可能性が高い。同様に、Sim4について検証を行ったところ、85本中82.5%の既知遺伝子について、完全にその構造を再現した。Sim4は、GeneSeqerに比べ、末端に存在する短いエキソンを正確に捉える性質を持ち、双方を比較することにより、86%以上の既知遺伝子で、正確な構造を再現する結果となった。
 この検証結果と既知遺伝子の解析により得られた知見をもとに、前出のClone_Contig配列と、Phrap_Contigとの2種類のContig配列を比較し獲得した、信頼性の高いContig配列群を用いて、予測イントロン配列を獲得し、配列的特徴(長さ、末端構造、繰り返し配列、コンセンサス配列)の統計的解析を行っている。


今後の予定
 以上の観点で研究を進め、Contig配列のゲノム上での位置関係から、選択的スプライシングの可能性があるContig配列同士について、そのイントロン構造の解析を行い、選択的スプライシングや通常のスプライシングにおけるイントロンの役割を考える上での手がかりを得たいと考えている。


©2005 筑波大学生物学類