|
考慮來自多項分布 $M(n,p_1,p_2,....,p_k)$的一組樣本$X_1,X_2,..., X_n.$則參數$p_i$ 的最大概似估計量是$\hat p_i={n_i\over n}, i=1,2,...,k.$當n相對於k很小時,則有很多個$\hat p_i={n_i\over n}=0$,許多統計推論$($像區別分析$)$便無法進行,為改進此缺點,本文將 研究 Convex Smoothing 方法中$p_i$之估計式 $(1-\lambda){n_i\over n} + \lambda {1\over k}$與 $(1-\lambda_i){n_i\over n} + \lambda_i{1\over k}$ 兩個極端的情形.本文將利用五種方法$:$最小均 方差法,最小平方法,最大概似法,Method of Square Error Cross- Validation,Method of Modified Likelihood選取$\lambda$和$ \lambda_i$,以便適當的估計$p_i$.在這五種方法中,最小平方法和最大概 似法均無法得到 consistent 的結果,所以不好;最小均方差法,Method of Square Error Cross-Validation和 Method of Modified Likelihood 均 可得到 consistent 的結果,所以較好.最優化結果都產生在$\lambda_i$ 不相等的時候,但在$\lambda_i$不相等時,數值計算較複雜,而$\lambda$ 都相等時,數值計算較簡單.
|