文化事业
大数据 云计算 人工智能 与数字时代图书馆究竟是什么关系?

转载自@图情轩 



我们所说的数字时代图书馆,既包含了数字化图书馆,也包含了图书馆数字化。数字化图书馆可以将大量纸本资源通过数字化技术重组、建设、展示,更大范围为公众提供文化资源,真正实现公共文化服务均等化、学术研究文献系统化的要求。而图书馆数字化的含义则很广,它不是简单的互联网上的图书馆主页,而是一整套面向对象的、分布式的、平台无关的数字化资源的集合。

随着大数据时代的来临,各种阅读新载体纷纷涌现,大多是电子产品。各种阅读新样态更迭频繁,大多为数字呈现。信息技术和网络技术在数字图书馆的建设中扮演了非常重要的角色。其中,开展数字图书馆建设便是重要途径之一。同时,互联网+、大数据、智慧城市等战略落地,也为图书馆数字化的发展创造了更大空间。

图书馆是文献信息中心也是历史积淀和文化传承的场所,拥有丰富的文献资源和历史遗产。互联网技术不断发展,使得图书馆数字化逐渐成为图书馆发展的重要趋势。随着大数据时代的来临,各种阅读新载体纷纷涌现,各种阅读新样态更迭频繁。



无论是数字化图书馆建设,还是图书馆数字化建设,都是极其复杂而周期漫长的工程,再加之数字图书馆的专业人员和管理人员不足的短板,是图书馆数字化建设不可逾越的困难。

今日头条上近日有一篇《浅谈大数据时代下图书馆的数据处理与服务》的文章就指出,“无须质疑,随着技术的发展,现在的图书馆比以前数字化了许多,自助借书、自助还书、自助查询书籍(精确到哪个书架的哪一行哪一列)。确确实实是方便了许多,但是距离真正的数字化图书馆,还是有一段距离,例如对数据的处理上。”

这位署名为“大数据一哥”的作者写到,随着图书馆信息资源的建设步伐加快及读者服务要求的提高,图书馆在大数据时代已经具有了一定的大数据特征。

首先,图书馆的数据种类繁多,图书馆的数据资源包含所藏文献资源中的纸质纯印本、光盘资源、网络资源、数据库资源等结构化信息,也有日常读者信息、服务信息等非结构化信息,更有图书馆自身建设的相关数据,这些数据的编码方式、数据格式、应用特征即使是一所图书馆内都无法统一,图书馆间更是存在较大差异,并形成了大量的异构数据;

其次,图书馆的信息资源总量日益庞大且每天在迅速增长。全国总的图书馆数字资源总量是一个庞大的数据集;

再次,随着个性化、学科化等越来越专业、编辑服务的实施与出现,用户的服务要求也日益提高,图书馆必须根据用户的服务信息等数据做出相应的服务策略转变,对大量数据的分析与潜在价值挖掘显得不可避免;

第四,图书馆24小时服务、网络服务等新兴服务方式的出现,使得用户的服务信息每时每刻都在递增,但对这些数据的分析和挖掘需进行相应环境、条件的限定,如地域、时段、服务群体等;

第五,尽管图书馆目前的自动化建设水平较高且进入到了一个新的发展阶段,书目信息、用户信息等都有大量的数据库进行记载与统计,但对这些数据及未进入数据库的数据还需进行异构处理,以得出新的服务发现。



未来数字时代,图书馆的数据处理主要是将文献资源等进行数字化、网络化、语义化处理。并在此基础上尽力实现用户的最大满意和最大程度利用,数据库建设、语义化建设、服务手段创新无一例外,但在大数据时代,图书馆的数据处理范围、方式、对象、目的等将发生巨大的变化,如根据读者服务数据对读者借阅习惯、爱好等的数据分析,找出新的服务方案、策略。

同时,在大数据时代,图书馆的传统业务将向数据分析、挖掘方向转移,对大量数据的分析与处理将成为图书馆的主要业务,图书馆资源数据量的扩展、服务质量的提升、服务策略的转变不仅仅是依靠简单如当前的数据共享、丰富资源、创新方式、增加时间等,从大量数据中发现的规律越多、找出的潜在价值越大,图书馆的服务水平等也将提升的越快。

我国图书馆的数字化探索,将不再囿于传统的业务管理模块,而是要以用户需求为核心,充分利用大数据分析、通过云计算、不断推进人工智能建设等方式,进一步展开数字资源的加工与传播,为公众提供全文数据库和多媒体信息处理、图文查询等服务,持续提升服务体验。

那么,图书馆数字化也好,数字化图书馆也好,大数据、云计算、人工智能究竟是个什么关系呢?



一家名为“金智塔”的公众号载文说,一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会提云计算……这三者不能分开来讲,而是有着紧密联系的,互相联系,互相依托的,脱离了谁都不能更好的发展。但很多人将这三者的概念混为一谈,这是不对的。


什么是“大数据”?


大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

简单的描述就是:大数据就是非常庞大的数据,但正因为这些数据因为太多了,所以需要特殊的工具进行收纳、整理、分析。

据IDC发布《数据时代2025》的报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。



那么175ZB的数据到底有多大呢?1ZB相当于1.1万亿GB。如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度将是地球和月球距离的23倍(月地最近距离约39.3万公里),或者绕地球222圈(一圈约为四万公里)。目前美国的平均网速为25Mb/秒,一个人要下载完这175ZB的数据,需要18亿年。

对如此庞大的数据,需要什么样的“特殊工具”进行处理呢?没错,就是云计算


什么是“云计算”?


云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。



用通俗的话说,云计算就是通过大量在云端的计算资源进行计算。如:用户通过自己的电脑发送指令给提供云计算的服务商,通过服务商提供的大量服务器进行“核爆炸”的计算,再将结果返回给用户。

因此,云计算甚至可以让你体验每秒10万亿次的运算能力,也只有这么强大的计算能力才可以对大数据进行处理。


什么是“人工智能”?


人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能其实就是大数据、云计算的一个应用场景。



人工智能不同于传统的机器人,传统机器人只是代替人类做一些已经输入好的指令工作,而人工智能则包含了机器学习,从被动到主动,从模式化实行指令,到自主判断根据情况实行不同的指令,这就是区别。

总之,云计算是大数据的底层架构,大数据依赖云计算来处理大数据,人工智能是大数据的场景应用。三者直接建立起一个体系,所以当云计算、大数据、人工智能这样整合起来,便完成了相遇、相识、相知的过程。

技术的改变以及用户服务要求的变化推动着图书馆服务的变迁,大数据时代的图书馆服务不管是服务的方式、途径、模式等也都将发生改变,由于图书馆的服务策略是经过大量数据捕获、组织、分析和决策而得来的,因此使得图书馆服务变得更具有针对性,服务手段、方式等也会随着图书馆服务策略的调整而调整。

可以预见的是,在调整文献服务、信息咨询、学科服务等这些图书馆必备的服务策略同时,以信息的处理与服务为优势的图书馆的服务范围及领域将会得到更大的扩展,为社会机构如政府、企业做一定的数据分析服务、数据挖掘服务将会成为大数据图书馆的常态服务内容。


转载自@图情轩