贝叶斯法建树的新进展——用简约值作建议向导可大幅提高贝叶斯算法的收敛速度
副标题:
贝叶斯法建树绝大多数情况下通过马尔可夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)算法估计参数的后验分布。系统发生树作为重要参数之一,准确并高效地估计其分布一直是贝叶斯建树方法的焦点与挑战。
传统的建议方法往往是对当前的树进行微小的随机变化,而得到的新树往往后验概率很低使得该建议被拒绝,导致MCMC算法访问到全局高概率的那些树(收敛,convergence)速度很慢。这样的建议也容易卡在树空间的局部,导致MCMC算法不能准确估计树的后验分布(混合,mixing)。
张驰等提出一种新的建议方法,把候选树的简约值(经过一定变换)作为权重,越简约的树被建议的可能性就越大。通过分析六组较大的序列数据,我们发现简约值作向导的建议方法在收敛速度上比传统的建议快一个数量级,同时也改进了混合。新的算法主要由张驰编写加入软件MrBayes(版本3.2.7,http://mrbayes.net)。
本研究由张驰(中科院古脊椎动物与古人类研究所)、John Huelsenbeck教授(美国加州大学伯克利分校)和Fredrik Ronquist教授(瑞典自然历史博物馆)合作完成,得到瑞典研究理事会、中科院率先行动计划和中科院战略性先导科技专项(B类)的支持。
论文链接:https://doi.org/10.1093/sysbio/syaa00图: 子树修剪和嫁接(Subtree Pruning and Regrafting,SPR)建议机制的基本逻辑。传统的建议方法和简约值作向导的建议方法的区别在于如何选择嫁接分枝