Protein Data Bank
内容
説明.mw-parser-output .plainlist--only-child>ol,.mw-parser-output .plainlist--only-child>ul{line-height:inherit;list-style:none none;margin:0;padding-left:0}.mw-parser-output .plainlist--only-child>ol li,.mw-parser-output .plainlist--only-child>ul li{margin-bottom:0}
タンパク質構造
X線結晶構造解析 (en
蛋白質構造データバンク(たんぱくしつこうぞうデータバンク、PDB: Protein Data Bank)は、蛋白質(タンパク質)、核酸、糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベースである。PDBに蓄積されている構造データは、結晶解析法、核磁気共鳴法(NMR法)、クライオ電子顕微鏡法の3つの検証可能な手法によって実験的に決定されたデータである。なお、理論的な予測(蛋白質構造予測)で推定されたデータは蓄積していない。
世界中の構造生物学者が決定した構造情報は、論文発表前にPDBに登録することが義務付けられており、論文発表と同時にPDBへ登録済みの構造データが一般公開される仕組みになっている。PDBの運営は日米欧の各拠点機関が国際的に協力することで成り立っており、南北アメリカとオセアニア地区で解析されたデータは米国で、欧州とアフリカ地区からのデータは欧州で、アジア・中東地区で解析されたデータは日本でデータ登録処理が行われる。日本の拠点活動は、大阪大学蛋白質研究所のProtein Data Bank Japan(PDBj)が担当している。PDBに登録されたデータは、事前に日米欧の各拠点間でデータ交換され、パブリックドメインのもとで完全に同一なデータとして一般公開される。
PDBは、生命科学研究の中心的なデータベースのひとつである。構造生物学をはじめとする基礎研究のみならず、創薬や食品工学、細胞工学などの応用分野でも欠かせない情報源となっている。バイオインフォマティクスの研究でも、PDBに代表される3次元分子構造データベースは重要な研究対象である。PDBから派生したデータベースとプロジェクトは非常に多く、蛋白質の構造・機能・進化のそれぞれの側面から、PDBの構造データの統合や分類が行われている。 BNL PDBとして 1971年に、アメリカ合衆国のブルックヘブン国立研究所(BNL)と英国のThe Cambridge Crystallographic Data Centre (CCDC)が共同でPDBを設立し、PDBへのデータ登録はブルックヘブン国立研究所が単独で行っていた。設立以来PDBデータの磁気テープによる公開はブルックヘブン国立研究所とCCDCにより行われていたが、1976年に東京大学大型計算機センターもこれに加わった。1979年からは磁気テープによる日本国内へのデータ配布活動は、大阪大学蛋白質研究所が担うことになった。 RCSB PDBとして 1998年に、米国プロジェクトとしてのPDBはブルックヘブン国立研究所から ⇒構造バイオインフォマティクス研究共同体 (RCSB; Research Collaboratory for Structural Bioinformatics) に移管され、同研究共同体 (RCSB) がPDBの登録業務を担当し、PDBのマスターファイル管理をすることになった。並行して欧州ではEMBL-EBIにMacromolecular Structure Databaseが立ち上がり、BNLと共同で開発されたAutodepシステムを用いたデータ登録が開始された。2000年には大阪大学蛋白質研究所でもRCSB PDBの協力により、アジア地区からのデータ登録受付を開始した。 wwPDBとして 2003年、日米欧の各拠点で別々にデータ登録が行わていたPDBの運営をより公式なものとし、世界同一の基準でデータ登録を行うことを目的として、RCSBを含む次の3つの研究組織によりWorldwide Protein Data Bank (wwPDB) が結成された。2006年には生体分子磁気共鳴データバンク(BMRB)
歴史
日本:日本蛋白質構造データバンク (PDBj)
米国:構造バイオインフォマティクス研究共同体 (RCSB PDB)
英国:欧州蛋白質構造データバンク (PDBe)
米国:生体分子磁気共鳴データバンク(BMRB)
wwPDBの役割は、PDBの生体高分子の3次元構造を蓄積した単一のデータベースの保守と、PDBデータベースを世界中の研究者コミュニティに無償で公開し利用できるようにすることである。
PDBが設立された当初、データベースが含む蛋白質の3次元構造は7つであったが、その後、データベースに登録される構造データ数はほぼ指数関数的に急激に増え、この増加傾向が衰える兆しは無い。PDBのデータの ⇒増加ペースは、多くの人々により分析の対象となっている。 2008年1月22日現在の時点で、PDBのデータベースでは48555構造の分子の3次元構造のデータが公開されている。
構造データの内容