
sdcluster (Scaffold-Directed Clustering) は、共通部分構造によって化合物エントリをクラスタ化する凝集型クラスタリングツールです。 SMARTSツールキットの共通部分構造の抽出機能を内部で利用しています。
sdclusterでは、共通部分構造を持つエントリ同士をエントリ群として結合します。クラスタ化の判定には coverage 値が利用されます。 coverage は共通部分構造が構造全体に対して占める割合のことで、それぞれのエントリに対して「共通部分構造の重原子数 / 全重原子数」として計算されます。 エントリを結合するたび、エントリ群の共通部分構造は小さくなり、coverage も小さくなります。 エントリ群内の coverage の最小値が指定の閾値を下回らない範囲で結合できたエントリ群は、クラスタとして確定され、共通部分構造が母核として抽出されます。



