希薄化曲線(rarefaction curve)は生態学の分野で使われる種数を評価する方法です。
あるサンプルにおいて合計$N$
個のアイテムが、$K$
種類のグループにわかれ、グループ$i \ (i = 1, \cdots K)$
には$N_i$
個のアイテムが属するとします。このとき、$N$
個のアイテムから$n$
個をリサンプリングしたときに観測されるグループの数を$X_n$
として、その期待値がリサンプリング数$n$
に対する関数である希薄化曲線$f_n$
として定義されます:
$$
f_n := E[X_n] \ .
$$
観測されるグループ数の期待値$E[X_n]$
は、グループ$i$
のアイテムが観測される確率を$p_i$
とすれば、
$$
E[X_n] = \sum_{i=1}^K p_i
$$
となります。さらに$p_i$
は、$N$
個のアイテムの中から$n$
個をとる組み合わせのうち、グループ$i$
のアイテムが少なくともひとつ含まれる場合の確率なので
$$
p_i = 1 - \frac{\left(\begin{array}{c}N-N_i\\ n \end{array}\right)}{\left(\begin{array}{c}N \\ n \end{array}\right)}
$$
と書けます。これらを用いれば$f_n$
は以下のようになります:
$$
\begin{eqnarray}
f_n =& \sum_{i=1}^K 1 - \frac{\left(\begin{array}{c}N-N_i\\ n \end{array}\right)}{\left(\begin{array}{c}N \\ n \end{array}\right)} \nonumber \\
= &K - \left(\begin{array}{c}N \\ n \end{array}\right)^{-1} \sum_{i=1}^K \left(\begin{array}{c}N-N_i\\ n \end{array}\right) \ . \nonumber
\end{eqnarray}
$$
参考文献
- Rarefaction (ecology) (13:22, 27 July 2017 UTC) In Wikipedia: The Free Encyclopedia.