【麻布大学】北海道の野生エゾシカでゲノム配列を解読–高精度ゲノム情報により、シカ科の進化や生態、管理など様々な研究の高度化を後押し
ポイント
・野生エゾシカの国際基準ゲノム配列を新規構築
・ゲノムのつながりが良い高品質なゲノム情報
・公開データが進化や生態・管理研究の基盤に
概要
既報のニホンジカゲノムは亜種が不明な飼育個体のもので、日本産の野生ニホンジカの全ゲノム参照配列は未整備でした。本ゲノムアセンブリは推定ゲノムサイズ3.1Gb、つなぎ合わせたゲノム配列の数(スキャフォールド数(*4))は1,810、再構成したゲノム配列のつながりを示す指標であるN50(*5)が77Mbを達成しました。また、遺伝子完全性(*6)は12,562遺伝子(99.75%)で、既報のニホンジカのゲノム配列よりも多くの遺伝子の再構成に成功しました。ゲノム中の反復配列(*7)は21.6%と推定され、いずれも既存の配列データと同等かそれ以上の値でした。シカ科でみられるゲノムサイズや形質の多様性解明、系統・進化研究だけでなく、生態・管理の研究基盤として活用が期待されます。データは日本の国際DNAデータバンクであるDDBJと米国アメリカ国立生物工学情報センター(NCBI)で利用可能です。
本研究成果は、2025年12月27日にData in Brief誌でオンライン公開されました。
背景
シカ科(Cervidae)は陸上偶蹄類の中でも大きな分類群で、ニホンジカ(Cervus nippon)は東アジアに自然分布し、14亜種を含むことが知られています。北海道に分布する亜種であるエゾシカ(Cervus nippon yesoensis)は、生態・管理の観点から研究が進んでおり、遺伝学的研究からは過去の深刻なボトルネック後に分布が拡大した可能性も示されています。一方で、全ゲノム解析は集団動態・系統・形質の分子基盤解明に有用であるにもかかわらず、これまで報告されていたニホンジカのゲノムは中国の飼育個体(亜種不明)に由来しており、野生個体や日本産ニホンジカの全ゲノム参照配列は未整備でした。そこで本研究では、起源・亜種が明確な北海道産野生エゾシカについて、長鎖リード技術を用いたゲノムアセンブリを実施しました。
内容
研究グループは、北海道の狩猟管理区域で捕獲された雄のエゾシカから筋肉試料を得て、ゲノムDNAを抽出しました。その後、ゲノム配列解読装置PacBio Sequel II によってHiFi長鎖リードを取得し、高品質な塩基配列をベースにゲノム情報の再構築(ゲノムアセンブリ)を実施しました。ゲノム配列の品質を示す統計データは複数の解析ソフトウェアで推定しました。
その結果、総塩基数は約588億bp、平均リード長は約14.9kb、推定カバレッジ(*8)は約18.7×でした。構築したゲノム「CerNipYes1.0」は推定3.1Gbで、スキャフォールド数は1,810、N50は77Mbを達成しました。遺伝子完全性は12,562遺伝子(99.75%)が完成として評価され、反復配列の割合は21.63%でした。データは日本の国際DNAデータバンクであるDDBJと米国アメリカ国立生物工学情報センター(NCBI)で公開されています。
今後の展開
本研究で公開したニホンジカの北海道亜種であるエゾシカの野生個体ゲノム情報は、シカ科にみられるゲノムサイズや形質の多様性の解明に繋がり、進化研究の基盤データとして広く活用されることが期待されます。また、より精度の高い血縁関係の推定を可能とするため、今後、この基盤情報を使ったさらなる解析により、移動ルートや地域間の個体群の関係性など、ニホンジカの生態や管理に重要な情報の収集が可能になると考えられます。
論文
タイトル:A reference-grade genome assembly data of sika deer in Hokkaido, Japan, Cervus nippon yesoensis
著者:Yuki Matsumoto, Junco Nagata, Yukiko Matsuura, Hayato Iijima
掲載誌:Data in Brief
論文URL:https://doi.org/10.1016/j.dib.2025.112423
研究費:文部科学省科学研究費補助金(20H00652、25K09202)など
共同研究機関
アニコム先進医療研究所株式会社
麻布大学
用語解説
(*1)長鎖リード技術
DNAを短く切らずに、より長いまとまりのまま読み取る解析技術です。長い配列を読めるため、つなぎ合わせ(ゲノム組み立て)の精度が上がり、複雑な領域も解析しやすくなります。
(*2)ゲノム
生き物がもつ設計図にあたる情報で、体をつくり働かせるためのDNA配列の全体を指します。種ごと・個体ごとに違いがあり、その違いが体質や特徴にも関わります。
(*3)ゲノム情報の再構築(ゲノムアセンブリ)
細かく読み取ったDNA配列の断片をコンピュータ上でつなぎ合わせ、元のゲノム配列を復元する処理のことです。配列解読装置はDNA全体を一度に読み取るのは難しいため、DNAを細かい断片として読み取り、その情報をもとに”元の並び”を推定して組み立てます。
(*4)スキャフォールド数
読み取ったDNA断片をつなぎ合わせてできた「ゲノム配列の大きなブロック(連結配列)」の本数です。少ないほど、より長く連続したゲノムとして組み上がっている目安になります。
(*5)N50
ゲノムの「つながりの良さ」を示す代表的な指標で、長いブロックから順に足していったとき、全体の50%に到達する時点のブロック長を指します。一般にN50が大きいほど、長い連続配列が多い(断片化が少ない)ことを意味します。
(*6)遺伝子完全性
「その生き物にあるはずの、保存的(多くの生物で共通)な遺伝子」がどれだけ揃っているかを評価する指標です。値が高いほど、完全な遺伝子を再構成できており、高品質なゲノムである目安になります。
(*7)反復配列
同じ、あるいはよく似たDNA配列がゲノム中に多数繰り返し現れる部分(繰り返し配列)です。生物のゲノムに一定割合で含まれるため、その割合を推定することで、ゲノムの特徴を把握できます。
(*8)カバレッジ
ゲノムの同じ位置を平均して何回読み取ったか(例:30×=平均30回)を表す指標です。一般にカバレッジが高いほど、配列決定の確からしさが上がります。
本件に関するお問い合わせ先
事務局 入試広報・渉外課
檜垣
- 住所
- 神奈川県相模原市中央区淵野辺1-17-71
- FAX
- 042-754-7661
- koho@azabu-u.ac.jp