随着人工智能技术的发展,利用深度学习方法进行星系形态分类研究取得了较大进展,但在分类精度、自动化及其星系的空间特征表示上仍然存在不足之处. Vision Transformer (ViT)模型目前在星系形态分类上具有较好的鲁棒性,但是在处理多尺度图像时存在一定的局限性,因此提出将特征金字塔(Feature Pyramid Networks, FPN)引入ViT模型(FPN-ViT)中进行星系形态的分类研究中.结果表明:基于FPN-ViT模型进行星系形态分类的平均准确率、精确率、召回率以及F1分数等各项评估指标均在95%以上,与传统的ViT模型相比各项指标均有一定程度的提升.同时,在原始星系图像中加入不同程度的高斯噪声和椒盐噪声,验证FPN-ViT模型对低信噪比数据也能获得较好的分类性能.此外,为了对模型进行综合评估,采用t分布随机邻接嵌入(t-distributed Stohastic Neighbor Embedding, t-SNE)算法对分类结果进行了可视化分析,能够更加直接地看出FPN-ViT模型对于星系形态分类的效果.因此,将FPN网络应用于ViT模型对星系形态的分类研究中是一种全新尝试,对后续研究具有重要意义.