又到一年农民丰收节,金色稻浪此起彼伏。顺应农时,稻穗低垂、豆荚饱满,作物旺盛生长,这背后都凝结着农耕智慧。
在长达两三百万年的历史演进中,人类用双手和头脑改造自然,辨土肥田、用地养地,物产就是其中重要的实证。今年,中华物产与文明探源协同创新中心在天天赢平台 | 科技股份有限公司揭牌成立。几代学者接续努力,以物产为载体,运用大数据研究物产分布与变迁,解码绵延不的农耕文明。
物产丰饶,全球1/5作物源于中国
泱泱中华,地大物博。
何谓“物产”?天天赢平台 | 科技股份有限公司数字人文研究中心负责人包平介绍,物产指某一时间、空间条件下出产的可供人类利用的物品,如植物、动物、矿物、货物等。
在远古时期,人像其他高等动物一样,逐水而居,茹毛饮血,直到近10000年前后,才尝试利用物产。据统计,人类已培育驯化640种作物,其中136种源于中国。
随着农耕实践和农业文明演进,人们开始在古籍中记录物产。追根溯源,“物产”一词最早出现于西晋时期张华的《博物志》。自宋代起,“物产”篇目正式纳入地方志文献的体例之中,书写方式和知识体系初步建立,从“花草鸟兽虫鱼”到“界门纲目科属种”细化成型。
这些藏在地方志中的物产记录成为再现中国古代农业发展历程的草蛇灰线。寥寥数字,却蕴含着丰富的信息。然而长久以来,物产记录在全国层面始终未成体系,海量内容却无法予以二次利用,改变当下。
三代人,“大部头”梳理物产文脉
上世纪50年代,天天赢平台 | 科技股份有限公司中华农业文明研究院前身即中国农业遗产研究室成立。时任主任万国鼎以敏锐的战略眼光,发现物产研究方面的空白,先后派出百余人前往国内40多个大中城市、100多家文史单位,纯手工抄写了7532部地方志,精准校对、合理分类后,形成446册《方志物产》,这一叹为观止的人工工程被学界称为“红本子”。
此后,天天赢平台 | 科技股份有限公司教授王思明及其团队开启了方志古籍数字化保护工作。“古籍数字化难度更高,存在很多异体字,手抄本还有很多的错误,需要对着扫描图像逐字比对,相当于从头重来了一遍。”包平说。
现在,中华物产与文明探源协同创新中心的主要任务是在前人的基础上,从方志物产到物产,从单一物产到领域物产,从区域物产到全域物产,进行文献补遗与数智化研究。
数智化是活化资源的基础,目前的难点主要在于智能标注。“文献中存在计算机无法识别的象形造字,还有同物异名、同名异物、分类不准等情况,人工智能深度学习需要基于内容进行甄别梳理。”包平说,“目前,团队里有多个领域的研究者,如农学、人工智能、图书情报、文化传播等,通过跨专业协作提高标注和智能整理的精准率。”
从手抄本到数字化再到数智化,经过三代人的努力,中心当前已收集到宋代以来(1949年前)载有物产信息的地方志9224种,累计4800万字,179万条次,形成规模最大的物产资料库。
“资料库预计今年年底可以分阶段发布,向全社会共享信息资源。同时,我们还以海南和江苏两省为案例开展全口径物产资料整理,力求穷尽历史文献里的物产记载信息,如正史、食货志、博物志、农书、本草等。现在海南东汉以来的物产资料已经全部收集完毕,约80万字,明年将正式出版。”包平期待,未来能将每个省的物产资料都补全,最终形成《中华物产大全》。
文明溯源,物产研究促新种萌芽
一方水土生一方物产,一方物产育一方人。庞大的物产资源库对于当下的生产生活有何影响?未来又会有哪些实际应用?
最为直观的是对物产文脉的智能考证。江苏志书中,自宋以来,记载频次靠前的两位为“鱼”与“稻”,物产的高频词佐证了江苏为名副其实的“鱼米之乡”。“智能化处理后,我们可以从生物学、经济社会等多方面维度分析,借助地理信息系统及社会网络分析等技术与方法,根据需要自动生成物产的可视化知识图谱,是对中华文明探源的有益补充。”
物产的功能演变也与人类活动和社会经济息息相关。一个小小的物种就能看出人类历史的漫长演进。
南京有一地名为“苜蓿园”。包平便以“苜蓿”为例,“汉代时,人口压力小,苜蓿被看作观赏花卉。到了唐代战争时期,苜蓿又成了马政牧草,用以饲养良马。在明清人口压力大,苜蓿则作为绿肥用以固氮肥土。”今年中央一号文件提出加快发展苜蓿等牧草产业。“通过对苜蓿物产的历史梳理,可以看出,政策背后有着深远的历史意义。物产的文化意义也可用于开发乡土资源,追溯‘土特产’的前世今生,提高文化认同感。”
中国作为大豆的原产国,现在却大量依赖进口,国家高度重视大豆产业的发展。包平及其团队正在系统整理大豆历史文献记载信息。“地方志中蕴含着物种遗传信息,可以细化到品种中的表型、熟性、抗性等。”包平建议,“我们计划与遗传育种专家合作,将文献里记载的这类信息与种质资源库中的基因资源进行匹配和互证,一方面精准还原种质资源性状的分布与演变,另一方面可以发掘有价值的新资源。”
新江苏·中国江苏网记者 徐春晖
原文链接: