TY - Data T1 - 用于农田分割的大规模图像文本数据集基准 A1 - 吴海洋 DO - 10.5281/zenodo.15099885 PY - 2025 DA - 2025-07-30 PB - 国家冰川冻土沙漠科学数据中心 AB - 理解和掌握农田的时空特征对于准确的农田分割至关重要。传统的深度学习范式仅依赖于标注数据,在表示农田元素与周围环境之间的空间关系方面存在局限性。它难以有效建模农田的动态时空演变和空间异质性。语言作为一种结构化的知识载体,能够明确表达农田的时空特征,如其形状、分布以及周围环境信息。因此,基于语言驱动的学习范式可有效缓解农田时空异质性带来的挑战。然而,在农田遥感影像领域,目前尚缺乏支持该研究方向的综合性基准数据集。为填补这一空白,我们引入了基于语言的农田描述,并开发了FarmSeg-VL数据集——首个专为时空农田分割设计的细粒度图像-文本数据集。首先,本文提出了一种半自动标注方法,能够准确为每张图像分配标题,确保数据质量和语义丰富性,同时提高数据集构建的效率。其次,FarmSeg-VL 具有显著的时空特征。在时间维度上,它涵盖了四季。在空间维度上,它覆盖了中国八个典型的农业地区,总面积约为 4,300 平方公里。此外,在注释方面,FarmSeg-VL涵盖了农田丰富的时空特征,包括其固有属性、物候特征、空间分布、地形地貌特征以及周边环境的分布。最后,我们对基于FarmSeg-VL训练的视觉语言模型和仅依赖标签的深度学习模型进行了性能分析,证明其作为农田分割标准基准的潜力。 DB - NCDC UR - http://www.ncdc.ac.cn/portal/metadata/f87695e1-7a53-45a7-9203-e82d36e5099a ER -