从标本到机器学习:分类复杂类群物种鉴定新框架
植物界中杂交与多倍化频发,使得许多类群的物种界限模糊,传统依赖形态的鉴定方法面临挑战。针对这一困扰植物分类学和生物多样性研究的问题,中国科学院西双版纳热带植物园(以下简称“版纳植物园”)星耀武团队提出一套用于分类复杂类群物种鉴定的研究框架。团队以东亚广布的多倍体复合体Rorippa dubia–indica为研究对象,构建整合性状演化、标本复核与机器学习的“三位一体”研究体系,从物种鉴定、分布重建与分类解码三个层面,对分类复杂类群开展系统性的二次评估。
研究基于2017–2020年采集的3,136份野外样品,及1893–2021年间的2,015份馆藏标本,结合形态解剖学、细胞学与系统发育推断,识别出一组稳定可靠的诊断性状。在此基础上,研究团队通过机器学习方法重建标本鉴定过程中的判断逻辑,发现现有及历史馆藏标本中存在12–50%的误鉴率。误鉴主要源于对可塑性状的依赖,及分类过程中对诊断性状使用顺序的差异,显著影响物种分布模型的构建。
研究表明,将性状演化、系统发育与机器学习相结合,能够有效解析多倍体复合体中的分类难题,为复杂类群的鉴定、生物多样性评估及保护规划提供可推广的方法学范式。研究同时呼吁对分类复杂类群开展系统性的二次鉴定,以期提供更加准确可靠的物种鉴定数据,助力生物多样性保护和研究事业。
研究成果以“A framework for identifying the polyploid complex in Rorippa (Brassicaceae): combining trait evolution, herbarium records, and machine learning”为题,发表在植物学期刊Annals of Botany。版纳植物园韩廷申副研究员为第一作者,星耀武研究员为通讯作者,科创计划本科生吕俊贤为共同作者。研究得到国家自然科学基金和云南省基础研究专项重大项目的资助。

图1分类复杂类群物种鉴定的研究框架(A)及其应用(B)。