シングルセル遺伝子発現データから観測ノイズを削減して、 シングルセルの真の構造を捉えることができます。
シングルセル遺伝子発現解析(scRNA-seq)では、その解析手順における様々なエラーが原因で、実際の細胞の発現量とデータの発現量の間に大きな誤差(観測ノイズ)が発生します。また、データの次元を表す遺伝子数は数万~数十万となり、そのデータ解析の過程でノイズが蓄積することによって正しい計算結果が得られない“次元の呪い”と呼ばれる数学的問題が発生します。この次元の呪いは現在広く利用されているデータ解析手法の解析結果に悪影響を及ぼします。これまでこのような問題に着目されておらず、データが持つシングルセルレベルの情報を正しく活用できていませんでした。
発明者らは、統計理論を用いてシングルセル遺伝子発現データから観測ノイズ のみを削減する新しい手法を発明しました。
本手法により、従来のデータ解析手 法の解析結果が改善され、シングルセルの真の構造を獲得することができます (図1)。
データを直接修正するため、データ構造(遺伝子数、細胞数)が変わりませ ん。そのため、全てのデータ解析手法の前処理として利用できます。
パラメータが不用なので、パラメータ選択に依存せずに本手法を利用するこ とが可能です。
実験プラットフォームやバージョンには依存しない手法であるため、最新の データだけでなく、過去のデータにも利用可能です。
シングルセル遺伝子発現データに限らず、気象データや材料データなどの観 測ノイズを含むデータにも利用可能です。
図1. ノイズ削減法の概略図(a)と検証結果(b,c)
FACSの分布との比較(b)とtSNEによる低次元化(c)の検証により、
ノイズ削減で真の細胞の発現情報とノイズに埋もれていた構造が復元できていることを確認。
開発段階 | UMI count と Read count のシングルセル遺伝子発現データに適用し、希少細胞種や未知の分化構造が発見されることを確認済み。 |
---|---|
希望の連携 | • 実施許諾契約 • オプション契約 (技術検討のためのF/S) ※本発明は京都大学から特許出願中です。 |
関連リンク | PDFで見る |
〒606-8501
京都市左京区吉田本町
京都大学 国際科学イノベーション棟3階