- Variance of inflation factor (VIF)を用いた統計学的指標による最適クラスタ数の推定
- 新世代多変量解析手法Graphical Gaussian Modelingを用いたネットワークの推定
- 解析結果に応じた可視化を実現するインターフェース
- デスクトップマシンでも可能な高速かつ安定な計算
[Graphical Gaussian Modeling (GGM)について]
GGMは相関行列の背後に隠された相関構造を共分散選択において見つけ出し、その結果をグラフで表現することができる統計モデルです。(観測データに対し、いくつかの偏相関係数を0においた相関構造モデルを選択していく手順が共分散選択と呼ばれます。)相関係数は2つの変数間の関係を定量的に表す統計指標として用いられますが、ときに他変数を介して相関関係があるようにみえる場合があります。偏相関係数はそのような偽相関な関係を取り除き、実質的な相関関係を導き出すことが可能です。
[PCアルゴリズムについて]
Auto Net Finder version2.0から、Graphical Gaussian Modelに加えてPCアルゴリズムによる因果グラフを計算できるようになりました。例えば、遺伝子発現実験データから遺伝子間の転写レベルでの制御関係を推定することも可能です。
参考文献
[1] Horimoto, K. and Toh, H., Statistical estimation of cluster boundaries in gene expression profile data, Bioinformatics, 17:1143‐1151, 2001.
[2] Horimoto, K., Aburatani, S., Kuhara, S., and Toh, H., ASIAN - automatic system for inferring a network from gene expression profiles, Res. Commun. Biochem. Cell Mol. Biol., 5:192‐207, 2001.
[3] Toh, H. and Horimoto K., System for automatically inferring a genetic network from expression profiles, J. Biol. Phys., 28:449‐464, 2002.
[4] Toh, H. and Horimoto, K., Inference of a genetic network by a combined approach of cluster analysis and graphical gaussian modeling, Bioinformatics, 18:287‐297, 2002.
[5] Aburatani, S., Kuhara, S., Toh, H., and Horimoto, K., Deduction of a gene regulatory relationship framework from gene expression data by the application of graphical Gaussian modeling, Signal Processing, 83:777‐788, 2003.
[6] Sachiyo Aburatani, Fuyan Sun, Shigeru Saito, Masao Honda, Shu-ichi Kaneko, and Katsuhisa Horimoto,, Gene systems network inferred from expression profiles in hepatocellular carcinogenesis by graphical Gaussian model
EURASIP Journal on Bioinformatics and Systems Biology, 2007
|
|
VIF(variance of inflation factor)を用いた最適クラスタ数の推定
相関係数、偏相関係数を用いたクラスタ間の可視化
PCアルゴリズム解析結果
|