希薄化曲線

希薄化曲線(rarefaction curve)は生態学の分野で使われる種数を評価する方法です。

あるサンプルにおいて合計$N$個のアイテムが、$K$種類のグループにわかれ、グループ$i \ (i = 1, \cdots K)$には$N_i$個のアイテムが属するとします。このとき、$N$個のアイテムから$n$個をリサンプリングしたときに観測されるグループの数を$X_n$として、その期待値がリサンプリング数$n$に対する関数である希薄化曲線$f_n$として定義されます:

$$ f_n := E[X_n] \ . $$

観測されるグループ数の期待値$E[X_n]$は、グループ$i$のアイテムが観測される確率を$p_i$とすれば、

$$ E[X_n] = \sum_{i=1}^K p_i $$

となります。さらに$p_i$は、$N$個のアイテムの中から$n$個をとる組み合わせのうち、グループ$i$のアイテムが少なくともひとつ含まれる場合の確率なので

$$ p_i = 1 - \frac{\left(\begin{array}{c}N-N_i\\ n \end{array}\right)}{\left(\begin{array}{c}N \\ n \end{array}\right)} $$

と書けます。これらを用いれば$f_n$は以下のようになります:

$$ \begin{eqnarray} f_n =& \sum_{i=1}^K 1 - \frac{\left(\begin{array}{c}N-N_i\\ n \end{array}\right)}{\left(\begin{array}{c}N \\ n \end{array}\right)} \nonumber \\ = &K - \left(\begin{array}{c}N \\ n \end{array}\right)^{-1} \sum_{i=1}^K \left(\begin{array}{c}N-N_i\\ n \end{array}\right) \ . \nonumber \end{eqnarray} $$

参考文献