孙兴莲 杨欣 丁思惠 李宗俊
摘要:为加强江苏省农业种质资源收集保护,推动种质资源共享利用,采用互联网和大数据技术设计构建江苏省农业种质资源数据服务平台,通过建设多层次、多维度、多用户的资源服务体系,建成集种质信息发布、共享、服务于一体的一站式线上服务平台。平台实现了种质资源共享服务云平台和数据管理后台两大子系统的功能建设,能够推动种质信息互联互通和共享融合,促进资源的有效共享。主要介绍数据服务平台的系统架构、总体功能、业务流程及关键技术。
关键词:种质资源;数据共享;线上服务平台;数据管理;系统设计与构建
中图分类号:S32;S126 文献标志码: A 文章编号:1002-1302(2021)13-0192-06
农业种质资源是保障粮食安全、建设生态文明、支撑农业可持续发展的战略性资源,是农业科技原始创新与现代种业发展的物质基础[1-2]。江苏省位于南北气候过渡带,种质资源种类繁多、类型丰富。为更好地保护特色资源,促进种质资源的开发利用,江苏省于2004年启动农业种质资源保护与利用平台建设,经过多年的努力,已初步建成了覆盖全省主要农业种质资源保护与利用体系,建有包括农作物、林木、水产、家养动物四大类共计30个省级种质资源库(圃),收集并安全保存种质资源6.97万份,积极开展优异种质资源的鉴定评价和创新研究,通过构建种质资源信息共享服务系统对外共享种质资源信息,近10年来累计向省内外300多家单位提供实物种质共享6.6万份次,在支撑现代农业发展与科技创新中发挥了重要作用[3-4]。
近年来,江苏省贯彻落实国务院《关于加强农业种质资源保护与利用的意见》文件精神,结合全省农业种质资源共享服务工作需要、种质资源保护要求和种质创新服务需求,加强农业种质资源数据服务平台建设研究。本研究拟通过运用云计算、大数据、人工智能等新一代信息技术,汇聚集成农业种质资源数据信息,建立面向社会服务的农业种质资源目录,构建集种质资源整合、共享、展示、对接、咨询、培训等服务于一体的新型农业种质资源数据服务平台,以推动种质信息互联互通和共享融合,促进种质资源的有效共享。
1 系统架构
江苏省农业种质资源数据服务平台包括种质资源共享服务云平台和数据管理后台两大子系统。其中,种质资源共享服务云平台主要实现种质资源检索、种质资源申请、服务咨询、对接洽谈、科普园地、种质讲坛等功能,通过线上Web服务形式面向外部用户提供种质资源信息和实物共享服务。数据管理后台主要包括种质资源数据管理、种质资源申请管理、信息发布、服务流程及用户反馈管理、库(圃)运行建设管理和系统管理等模块,根据种质资源库(圃)人员和平台管理人员2种用户角色设定权限,分别实现了种质资源分类管理、数据填报和审核、标签管理、画像分析和智能检索等功能。总体系统逻辑架构如图1所示。
2 系统功能设计
江苏省农业种质资源数据服务平台主要包括两大功能模块:一是面向农业科研人员、企业等用户的种质资源共享服务云平台,二是面向种质资源库(圃)人员和平台管理人员的数据管理后台,其主要功能设计如下。
2.1 种质资源共享服务云平台
种质资源共享服务云平台总体功能结构如图2所示。
2.1.1 种质资源检索 种质资源检索模块可用多种方式实现用户对种质资源信息的检索和浏览,支持按多级分类列表方式进行种质资源信息展示,用户可按照农作物、林木、水产、家养动物等大类进行浏览,也可根据各大类细分物种(如水稻、小麦、玉米等)进行查看;支持按关键词模糊查询和选择具体过滤条件精准检索,用户可通过种质名称、种质外文名等文本字段进行模糊查询,也可按照种质类型、主要特性等选择字段进行筛选查找,如根据主要特性字段可查询高产、优质的种质资源等;支持系统主动推荐,根据用户种质资源的申请历史、浏览历史,系统自动推荐相关种质资源,提高检索结果的丰富度[5]。
2.1.2 种质资源申请 用户检索到所需种质资源即可发起在线申请,首先查看申请须知和申请流程说明,将所需种质资源加入待申请列表并填写申请信息,填写完成后下载打印并签字盖章,将盖章材料上传提交至种质库(圃)审核。用户提交种质申请后可随时查看申请进度,若库(圃)人员审核通过,可根据申请表填写的种质获取方式进行现场获取或快递到付,若为快递到付,在种质寄出后系统支持查看物流单号和第三方物流进度。
2.1.3 服务咨询和对接洽谈 该模块针对种质资源共享服务提供电話咨询和在线咨询,包括数据服务平台咨询内容提交、通讯软件留言等;支持借助互动视频,实现多人在线咨询洽谈、活动直播、知识教学等功能,促进资源共享;支持对线下活动做线上对接,主要包括对接优异资源展示会、专题服务和技术咨询服务等,提供活动需求调研、宣传发动、在线报名、组织举办以及总结宣传等全流程线上对接,并形成活动档案。
2.1.4 科普园地和种质讲坛 该模块实现农业种质资源科普信息的发布浏览,系统支持用户查看各类种质资源科普信息,支持按多种主题类目、分类标签、热度等方式查找和浏览科普文章、优异种质资源信息和种质资源热点报道等。系统支持以文字、图片、视频、直播等方式发布信息,支持直播活动的订阅并接收活动提醒。
2.2 数据管理后台
数据管理后台总体功能结构如图3所示。
2.2.1 供需信息发布 供需信息发布模块主要实现种质资源供需信息的上传、审核、发布、查询等功能,为资源供给方和需求方提供多维度、多形式的资源供需信息发布和查询服务,如需方专题服务需求发布、供方特色资源介绍发布等。
2.2.2 种质资源数据管理 种质资源数据管理是整个系统的核心模块,主要负责维护共享服务云平台的种质资源数据,是种质资源检索引擎的基础数据来源。主要功能包括维护种质资源类目数,方便用户进行分类导航浏览;实现各类种质资源的数据模型定义管理,支持针对不同的物种设置种质资源共性和特性描述数据字段,可设定数据字段的类型和范围,以及可显示字段、筛选条件字段和字段读取权限等;实现种质资源数据的增、删、改、查等功能,可查看和编辑种质资源详细数据;支持种质资源数据的批量导入和导出,方便数据的录入和存档;实现资源数据信息的查重和校验功能,所有上传的服务资源信息均需经过管理员审核后才能正式对外发布和共享;支持库(圃)人员在种质资源共享服务云平台中对种质资源进行上架和下架操作,可设置申请数量,并支持批量上下架[6-7]。
2.2.3 种质资源申请管理 该模块实现了种质资源申请流程的管理,系统可管理申请流程和订单的状态流转,直至用户收到种质资源并进行评价。用户发起并提交种质资源申请后,库(圃)人员可在订单管理页面中查询已提交申请并进行审核处理,若审核通过,库(圃)人员可根据申请要求准备种质等待自取或邮寄,相关物流信息可录入系统。在种质资源申请过程中,用户可随时查询申请进度,系统记录各项流程节点的操作人、操作时间、描述信息等,并通过和第三方物流平台对接,实现订单物流状态的记录和跟踪。
2.2.4 服务流程及用户反馈管理 该模块实现对服务流程以及用户服务和反馈等过程中的各种信息数据进行电子存档,方便后续优化服务流程和改进用户服务质量。同时系统将云平台的服务咨询和对接洽谈数据进行存档,并提供数据检索功能。
2.2.5 库(圃)建设运行管理 库(圃)单位是农业种质资源数据服务平台的重要服务机构,为了提高库(圃)运行服务质量,本模块主要实现对库(圃)单位的建设运行管理,包括种质库(圃)征集流程管理、运行服务数据审核统计和可视化展示三大功能。其中种质库(圃)征集流程管理负责新增种质资源库(圃)的工作流程管理,实现新增库(圃)单位的征集、资料汇总、专家评审、结果审核等过程的信息化;运行服务数据审核统计是根据库(圃)实际运行情况,从多个维度进行库(圃)运行服务数据的收集、填报和审核,以种质资源收集保存、鉴定评价、共享服务和服务成效等运行服务数据为基础,平台绩效考核指标为依据,对种质库(圃)运行服务数据进行统计,能客观地评价各种质库(圃)运行服务情况;运行服务数据可视化展示是以库(圃)运行服务数据为基础,实现管理驾驶舱和各类分析图表可视化,直观地展示各种质库(圃)的运行服务情况,为平台的管理和决策提供可视化数据支撑。
2.2.6 系统管理 系统管理模块主要包括认证管理、系统日志、系统帮助和系统配置等4个功能。其中认证管理主要实现用户管理和权限管理,可创建各种角色的用户,包括管理员、库(圃)人员、普通用户等,支持对不同用户角色设置相应的权限等;系统日志记录关键的用户操作日志,提供操作日志查询服务;系统帮助提供各项菜单的操作文档说明;系统配置可设置各项系统参数配置,如数据导入模板格式配置等。
2.2.7 信息安全 农业种质资源数据服务平台支持多种方式的信息安全保护。对外网站服务通过应用防护防火墙提供安全保护,并通过第三方渗透测试安全认证;数据库安全系统支持敏感数据保护和数据访问审计,防止数据泄露;系统安全审计平台记录用户的访问和操作日志,对违规网络行为实时告警。
3 系统业务流程
江苏省农业种质资源数据服务平台的主要业务流程如图4所示。平台管理员通过管理后臺发布科普园地、种质讲坛等信息,维护各类科技信息资源,用户可浏览种质资源共享服务云平台,选择感兴趣的内容浏览或发起在线服务咨询,平台在线客服可及时回复服务咨询,响应服务洽谈和工作对接,实现线上工作流。种质资源库(圃)人员可以通过管理后台进行种质资源信息的完善和提交、维护库(圃)信息、配置种质资源的图片展示信息和上下架状态,信息通过管理员审核后可对外提供服务。平台管理员结合种质资源标签平台维护和更新相关标签索引信息后,支持用户在种质资源共享服务云平台中进行灵活的信息检索,对于需要的种质资源可在线发起种质资源申请请求,库(圃)人员审核通过后提供种质自取和邮寄服务并在系统中更新物流信息,用户能在线查看申请进度及物流信息跟踪,可在收到种质资源后进行服务评价[8-9]。
4 系统关键技术
本系统的关键实现技术在于种质资源标签管理平台和基于种质资源标签特征的智能推荐技术,为了更好地满足用户种质资源检索需求,并对种质资源相关特征特性做更全面多维的分析,本系统构建种质资源标签平台,通过特征标签管理和大数据相关技术实现种质资源标签体系的管理,实现架构如图5所示。
数据采集层实现对种质资源共性特征、特性特征、用户浏览记录、用户申请种质记录等数据源进行数据采集和实时同步。种质资源标签平台利用上述数据源通过数据平台技术进行整合加工,标签平台的作用是在现有的数据表之上构建跨计算存储的逻辑模型,直接在视图层上对数据进行管理、加工、查询,屏蔽下层的多个大数据计算存储资源,简化数据的使用。通过标签平台实现了种质资源数据灵活动态的特征工程,支持在标签平台中随时添加、组合新的标签定义。例如可将大豆的锈病抗性、灰斑病抗性、霜霉病抗性、紫斑病抗性、细菌性斑点病抗性等各种特性组合起来形成一个综合性的抗病性等级标签。
基于种质资源标签数据,可以对系统中的种质资源数据做一些相关数据分析,包括通过指定不同的标签筛选来定义种质资源群组,并进行群组的相关画像分析,支持对群组进行交集、差集、并集等集合运算。支持对标签数值进行数据分布统计和可视化分析,如可通过箱线图等直观方式体现种质资源特征的分布。系统支持将筛选条件保存起来形成常用查询分组,用户可利用种质资源标签信息进行全方位的信息检索,方便查找到最符合要求的种质资源信息。
结合用户浏览记录和用户已申请的种质资源记录数据,系统还支持基于种质资源特征的智能推荐,根据用户浏览数据中反映出的用户感兴趣的种质资源信息,与种质资源标签平台中保存的特征数据进行匹配,计算出符合用户兴趣的种质资源特征,再联想查找出相似特征的其他种质资源,提高检索结果的满意度[10]。
5 系统实现
本系统通过Web方式对外提供服务,通过前后端分离架构开发实现,通过Java微服务实现后台相关应用程序接口(API)服务,使用Vue实现前端相关页面,借助于大数据平台以及Spark技术实现种质资源标签和画像计算任务,计算结果存入ElasticSearch并对外提供种质资源检索服务,系统部分界面如图6和图7所示。系统具有良好的稳定性、扩展性和易用性,支持面向公众和各外部机构提供农业种质资源相关的共享服务,提高了资源共享服务效率。
6 总结
江苏省农业种质资源数据服务平台运用云计算、大数据等相关信息技术,进一步整合江苏省农业种质资源数据信息,实现了种质资源标签计算、智能检索、服务咨询、科普服务、库(圃)建设运行管理等功能,提高了种质资源开放共享效率,优化了用户体验。后续可进一步结合人工智能算法技术,分析和整合数据,为用户提供更加准确、便捷的服务。
参考文献:
[1]刘 旭,李立会,黎 裕,等. 作物种质资源研究回顾与发展趋势[J]. 农学学报,2018,8(1):10-15.
[2]曹永生,方 沩. 国家农作物种质资源平台的建立和应用[J]. 生物多样性,2010,18(5):454-460.
[3]杨 欣,朱 银,狄佳春,等. 江苏农业种质资源平台运行管理信息系统建设[J]. 植物遗传资源学报,2021,22(2):309-316.
[4]颜 伟,杨 欣,朱 银,等. 江苏省农业种质资源保护与利用平台建设现状与发展建议[J]. 江苏农业科学,2020,48(15):52-57.
[5]叶锡君,孙 敬,张天真.农作物特种遗传资源共享平台的建立[J]. 南京农业大学学报,2011,34(6):7-12.
[6]方 沩,曹永生. 中国作物种质资源信息系统[J]. 科研信息化技术与应用,2012,3(6):66-73.
[7]潘 恺,方 沩,陈丽娜,等. 基于云计算的农作物种质资源数据挖掘平台研究[J]. 植物遗传资源学报,2015,16(3):649-652.
[8]杨 欣,朱 银,徐婷婷,等. 基于移动平台的农业种质资源信息共享服务系统研究[J]. 江苏农业科学,2018,46(23):267-270.
[9]杨 华,王国军,朱天生,等. 上海农作物种质资源库管理信息系统建设[J]. 植物遗传资源学报,2019,20(2):459-465.
[10]李 峰,李军怀,王瑞林,等. 基于商品特征的个性化推荐算法[J]. 计算机工程与应用,2007,43(17):194-197.