2024年10月28日习近平总书记在中共中央政治局第十七次集体学习时强调,要锚定2035年建成文化强国的战略目标,不断发展新时代中国特色社会主义文化。图书馆作为文献收集、保存和整理的重要公共文化机构,近年来不断加强文献资源数字化加工及电子资源、网络资源、政府公开信息、影音资源的采集和保存,逐步发展成为全面开放的知识中心和海量文献信息战略保存基地,2022—2023年全国公共图书馆馆藏总量14.36亿册/件,数字资源总量1124万TB。在信息网络泛在延伸、智能技术普及应用、数据资源价值凸显的时代背景下,实现图书馆海量多模态异构数据的高效汇聚、有序组织、融合利用和开放共享,是贯彻落实国家数字文化战略、推动图书馆行业高质量发展的必由之路,同时也是提升中华优秀传统文化传播力和影响力的应有之义。
构建高质量、立体化的信息资源保障和知识服务体系
图书馆人本着“传承文明、服务社会”宗旨,以文献为纽带,以编目为起点,通过信息化、数字化、智慧化手段对存藏资源进行加工、转换和再创造,为公众提供更加丰富优质的文化资源和便捷高效的文化服务。
文献资源内容的深度加工和揭示。对文献内容进行OCR全文识别以及细颗粒度的内容标识、关键知识点的标签和标引,构建了多个基础性、公益性、普及性的知识库,对古籍文献内容中的术语、图像、地理信息等进行知识点识别和精细化标引并提供知识图谱、语义检索等服务,让传统文献资源以更精细、便利的方式为人们所获取和使用。
文献资源呈现形式的创新和拓展。以传统文献资源的内容为根本,通过数字孪生、3D建模、VR/AR等技术打造沉浸式、人机交互的新型数字资源,如《永乐大典》VR全景文化典籍等,实现了虚拟现实技术与古籍文献阅读服务的融合创新。通过资源汇聚和组织相关技术,把不同来源文献的数据对象及结构功能进行整合重组,实现“一种内容、多种媒体”“相同内容、不同呈现”的富媒体形式,发展适应数字网络环境的阅读新体验。
活态资源和记忆资源的建设实践。开展以口述文献、影音文献及散藏于民间的个人记忆等新型资源建设,夯实传承民族记忆、铸牢中华民族共同体意识的文献基础。国家图书馆中国记忆项目,以东北抗日联军、飞虎队等国家重大事件,顾方舟、丘成桐等各领域代表人物,“大漆髹饰”“我们的文字”等优秀传统文化为主题,采集1200余位中国现当代历史亲历者、见证者超过5400小时的口述史料和影音资料,为保护传统文化、继承革命文化、弘扬社会主义先进文化发挥了积极作用。
文献资源价值的深入利用和转化。对文献资源数据进行创新转化和二次利用,开发富有文化价值且实用性强的产品或服务,如提取图书馆馆藏文献、地方文化中的设计元素,开发文创产品;与出版、旅游、非物质文化遗产等行业合作开展研究、展览、出版业务,激发新的文化创意;积极寻求与文化和旅游产业价值链的契合点和融合点,将图书馆的服务延伸到城市空间、文化旅游及社区等场景中,有力推进学习型城市与和谐社会的建设。
图书馆文献资源数据价值仍待进一步挖掘
图书馆文献资源数据具有长尾效应,其历史意义和研究价值随着时间推移反而会不断增加。但目前图书数据应用场景还是以文献信息服务和行业间共建共享为主。今后,需要创新图书馆数据应用渠道,促进文献资源数据与其他社会要素充分融合,实现优秀文化资源的传承创新和活化增值。图书馆文献资源数据往往汇聚到更大范围的知识体系中,才能更好地析出其固有价值或衍生出附加价值。当前,不同层级、不同类型图书馆之间数据共享渠道受限,难以关联互通。因此,需要图书馆界甚至上下游内容服务商加强数据开放意识,实现不同机构数据资源的汇聚和整合,才能发掘图书馆数据更深层的价值。
图书馆是建设社会主义文化强国的重要阵地,应顺应数字经济快速发展和文化科技深度融合趋势,尽快推进智慧化转型,实现广域来源、多种模态文献资源数据的深度挖掘和揭示,进一步发展为中华优秀传统文化的宝库、现代知识的渊薮、社会文明的窗口和公民启智增慧的终身教育课堂。
构建互联互通、开放共享的行业数据生态。以全国智慧图书馆体系建设为抓手,通过文献资源数据建设和服务规范、开放机制和交换协议的标准化,确保各类数据在异构平台间的汇聚整合和服务调度,形成多元共治、多渠道接入、多样态产品输出的市场化运作机制,实现不同类型图书馆、公共文化机构及文化企业间数据的交互流通,在数据责任主体利益共赢前提下最大限度促进文献资源的利用和知识内容的传播。
搭建高效的智慧图书馆数据管理服务平台。实现文本、图片、音频、视频及新型文献资源的统一汇聚,实现图书、报纸、期刊、音像制品等实体资源和电子出版物、网络资源、活态资源和记忆资源的统一揭示,实现文献资源不同颗粒度信息如描述信息、资源实体、知识实体之间的关联关系及知识图谱的关联呈现,实现全国图书馆馆藏知识内容、智慧服务空间、线上线下智慧活动的互联互通,支持公众便捷发现、获取身边的图书馆资源及服务。
通过新技术应用创新知识生产和传播模式。推进人工智能等技术在图书馆管理决策、资源建设和用户服务等环节的深度赋能。通过多模态内容融合及跨时空阅读技术增强传统文化的表现力、传播力和感染力,打造智能交互、沉浸体验智慧化阅读新形态。通过语义识别等技术提取文献资源中细粒度、权威性强的知识内容,形成可见、互通、可信的数据集,丰富文化领域高质量知识内容的供给。通过AIGC相关技术和工具整理生成符合特定用户需求的知识内容,引领全社会知识生产、传播模式的创新。
推动图书馆数据要素跨行业领域融合应用。积极探索图书馆数据要素与经济社会多向融合、交互渗透的有效路径,打造符合市场需求及满足公众需要的产品或服务。根据各行业机构政策研究、科研教育等需要,开展特定主题的知识库或数据集建设,更有效地支持社会经济、人文、历史等领域的深度研究。深化图书馆数据要素在社会公共服务、文化内容生产、文化旅游、文化科技等领域的融合创新,为影视、新闻出版和文化创意等相关行业提供优秀文化元素和精品创意素材,打造数字文化服务的新场景和新模式,实现图书馆数据价值的释放甚至倍增。
我国已进入以数据为核心生产要素的高质量发展时代。图书馆界要抓住这一有利时机,以“数”赋能,乘“智”而上,在实现智慧化转型和可持续发展的同时,借助数智时代的先进技术和理念,深度释放图书馆文献资源数据的知识价值、文化价值、经济价值和社会价值,带动社会公众高质量、高品质的精神生活,为数字中国和智慧社会注入新的动能,为推动文化繁荣、建设文化强国、坚定文化自信作出更大贡献。
(作者系国家图书馆副馆长)
