近日,信息学院(人工智能学院)许福教授团队在农业人工智能方向取得重要研究进展,成功构建了面向中国农作物病虫害领域的知识图谱—CropDP-KG。该成果以《A knowledge graph for crop diseases and pests in China》为题,发表在Nature子刊《Scientific Data》上。该期刊专注于数据集以及促进科学数据共享和再利用的研究,SCI Q1期刊,五年影响因子8.7。

农作物病虫害是影响全球农业生产的重要因素,每年造成严重经济损失。传统病虫害知识分散在不同平台、文献和数据库中,缺乏统一、结构化的表示方法,制约了农业智能决策的发展。针对这一难题,研究团队依托自然语言处理技术与农业领域知识,从“中国农作物病虫害图文数据库”中提取并构建了覆盖广泛、结构清晰的多维知识图谱。
CropDP-KG包含8类核心实体(如病害、害虫、作物、发生区域、症状等)和7类语义关系(如“主要发生地区”“危害作物”“适宜温度”等),共包含13,840个实体和21,961个关系三元组。研究采用BERT-BiLSTM-CRF等深度学习模型实现实体识别,并结合专家标注与验证,确保知识的高准确性与可靠性。

基于该知识图谱,团队还开发了“农作物病虫害知识服务系统”,支持知识查询、问答与可视化功能,用户可通过关键词快速检索病虫害相关属性、发生条件、防治建议等多维度信息,为农业从业者、科研人员及政策制定者提供直观、高效的知识支持。该知识图谱数据已以CSV格式公开发布于Figshare平台,系统代码开源发布在GitHub,推动农业知识共享与后续研究应用。
论文第一作者为青年教师颜荣恩,通讯作者为许福教授和李冬梅教授。安平、孟祥浩、李亚坤、党德鹏教授共同参与研究。
本研究由中央高校基本科研经费(BLX202356)、国家重点研发计划(2022YFF1302700)、国家林草局应急揭榜挂帅项目(202303)及优秀青年团队项目(QNTD202308)共同资助。