您现在的位置:首页 > 相关资讯
数据管理简史:从人工到人工智能

数据管理是一项古老的工作,其历史可以追溯到古巴比伦时期,早在公元前4500年,古巴比伦就出现了人口、土地、牲畜、财产的统计。除此之外,在之后的古埃及、古罗马,以及中世纪的欧洲许多国家,用统计方法收集有关人口、军队、世袭领地、财产、居民职业等资料已经比较普及,并且有相关的财产目录进行编制。这篇文章较全面的梳理了数据发展的历程,希望能够对数据从业者提升自己的职业素养起到帮助。

 

1. 指尖的负担19世纪以前,数据管理0.1)

公元1790年,美国开展了一次全国人口普查,当时的美国正处于经济快速发展的时期,需要统计的数据项目繁杂,人口流动十分频繁。由于落后的统计技术,数据调查员们用了七年半的时间才把数据整理完。事实上,直到第二次人口普查开始,美国政府才得到第一次人口普查的数据。

 


在这个时期数据的概念初步产生,但是数据处理全靠手工,数据管理是一项繁杂、耗费精力的工作。

 

2. 卡片的艺术1800-1960年,数据管理0.2)

在经历了美国的第一次人口普查后,hollerith深知用人工统计数据的弊端,发明了分拣机、制表机以及记录机,用来处理和统计完整的数据,是一定程度上数据第一次变成二进制信息。打卡和制表机一直都是企业办公的必要条件,这种情况持续在1910-1960年代中期。

1946年2月14日人类史上最伟大的发明之一计算机问世了,用穿孔卡片输入数据的方法一直延续下来,计算机也成长出数据处理的主要功能。


这段时期数据已经可以被储存为计算机语言,但仍需要大量的人工才能运行,计算机的运行速度很慢,主要还是依靠手工处理数据,数据不能共享、数据不能长期保存,是这个时期数据管理面临的主要问题。

 

3. 磁盘的存储20世纪中期-1965年,数据管理0.3)

上个世纪50、60年代,主要通过特定的文件系统进行数据管理。文件系统是一种可以快速检索打卡信息的机械手段。恰逢第二代编程语言发展势头正盛,字母编程初步可行,程序第一次具有了可读性,早期的汇编语言成为了早期管理数据的主要方法。


在这个阶段,磁盘可以作为主要的数据存储介质,可以进行简单的共享,并且数据可以长期保存,但是离新系统性的数据管理差距还有很多。

 

4. 结构的飞跃1965-1995年,数据管理0.6)

第一个数据库系统DBMS与20世纪60年代末由美国通用公司研发成功,这是数据管理进入了一个新时代的标志。与此同时,较大存储空间的存盘也产生了,让数据大规模管理得以实现。早在这个时期,就有一批数据库软件问世了,数据由DBMS统一管理与控制,一定程度上第一次实现了数据的结构化,数据有了物理独立性与逻辑独立性。通过DBMS系统,人们可以实现一致的数据处理并减少数据重复度。

 

此时数据已经可以被联机实时处理、分部处理、批处理,共享性较高、冗余度较低、容易扩充,很大的减少了数据工作者的劳动强度,系统性数据管理初见端倪。

 

5. 元数据萌芽1995-2000年,数据管理0.7)

由联机计算机图书中心和美国国家超级计算应用中心联合参与的数据研讨会于1995年3月在没说过的都柏林镇召开。在会上,提出了一个精简的元数据集——都柏林核心元素集。意义在于用一个简单的元数据来记录描述种类繁多的电子信息,达到有效的描述和检索网上图书资源的目的。

 

都柏林核心元素集能够在一定程度上解决网络资源的发现、控制和管理问题。都柏林核心元素集作为元数据概念的提出,为现代元数据体系打下了坚实基础,至此数据管理拉开序幕。

 

6. 初步的认知21世纪初-2008年,数据管理0.8)

关于数据管理的认识最早始于2004年,起因是H. Watson探讨了“数据仓库治理”在 Blue Cross 和 Blue Shield of North Carolina 两家公司的最佳实践,由此拉开了“数据治理”在企业管理中的大幕。同年,非营利组织DAMA协会成立,致力于提升数据管理行业的职业职业素质。

 

从这段时期开始,数据管理由于其在组织内部与外部管理数据上的重要地位而受到广泛的关注,对数据管理的认知初步建立。

 

7. “5v”的驱动2008年,数据管理0.9)

2008年8月,大数据的概念正式提出。由维克托·迈尔-舍恩伯格及肯尼斯·库克耶在其编写的《大数据时代》中正式提出,包含了大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。


大数据和其相关概念的提出,让数据战略成为组织与企业的核心战略推进了数据管理产业发展数据管理工作得到新的活力。


8. 监管的推进2008-2016年,数据管理1.0)

2008-2012年期间,我国的数据管理工作主要面向监管报送系统,是单纯的数据质量提升。举个例子,为了满足监管报送的数据质量要求,银行都实现后根据1104设计质检体系预制梁装箱计划。


虽然这个时期的数据管理能解决并发现监管上的数据质量问题,但是IT管理中的数据管理职能是分散的,因此忽略了数据在更广泛数据环境中的关系,导致还是处于局部质量提升的水平。2012年7月,国际数据管理协会DAMA出版了《DAMA数据管理知识体系指南》,一经推出在数据治理领域一度掀起波澜,进一步推动了国内数据管理走向世界轨道。


9. 系统的主数据2010年至今,数据管理2.0)

随着MIS、MRP、ERP等系统的产生,企业发现有些数据总需要在各个系统之间分享。最早的是外国ERP厂商推出MDM产品,例如Informatica、 Oracle 、IBM、SAP 、微软都采取了自有产品并提供主数据管理解决方案,旨在集中管理单一版本的、完整的和可信任的主数据信息。至大部分企业都处于数据管理2.0时期,例如制造业的一些企业,由于制造产品信息的复杂、数据量巨大、信息化程度不一,所以主数据管理仍是一项大的挑战。


10. 仓库的标准2012年至今,数据管理3.0)

2008-2012年期间,数据管理在国内的工作的重点转向面向数据仓库的数据标准的构建与实施。在Inmon提出数据仓库理论后各大企业都着手数据仓库的建设,局部解决数据质量问题已经不能满足国内的需求,需要统一的数据标准规范数据仓库上下游数据,实现数据联通,建立完善的数据管理机制,解决数据管理没有管控流程、数据管理与业务流程兼容的问题。


数据管理3.0引入了数据驱动业务的概念认可了对协作数据管理的需求,废除了数据局部质量提升体系并且将数据管理责任分散到了企业的大部分部门。


11. 服务与消费2018至今,数据管理4.0)

2018-2020年期间,数据管理的重点放在面向数据服务化的数据消费支撑场景。举例,如银行、政府,在数据质量方面的需求基本得到保障,近几年,在元数据管理技术和平台发展日趋完善的背景下,大中型企业基本实现了数据资产分析的自动化并且可以数据管理2.0的基础上提供数据资产可视与服务化能力,数据管理转变为企业实现数字化的必要手手段。


12. 云与人工智能(现在-未来,数据管理5.0)

随着服务的发展进程推进将主要数据存储到云端成为企业的主流公司从传统的单片架构转向分布式混合云架构。云可以为企业提供按需的数据管理资源,数据管理将不再受限于底层基础架构。云构架实用的新协议的新形式访问媒体边缘和移动设备,用一种新型的不断扩展的数据结构、容器和接口,支持数据驱动,例如自助数据准备、自助分析等。相信在未来数据管理方面将会有新的创新,以满足云环境中企业进行数据管理的需求。  

 


人工智能在今年迎来了许多重大突破。在未来十年内,人工智能有望企业识别和分类大量存储数据,并对基本数据管理程序做出例行决策。人工智能在数据管理领域将变得越来越有价值。包括处理、管理和存储非结构化数据;去冗余数据、实现数据集成、确定最佳存储位置等。


数据管理发展至今已经具备了完善的结构和体系,相信在未来其行业前景和运行模式也将会迎来进一步的提升。

 

文章来源于网络,如有侵权请联系删除,想获取更多资深的数据管理知识,可以了解CDMP数据管理专业人士认证

[1]

 
网络安全热度最高的6本证书...
系统分析师VS系统架构设计...
项目经理考NPDP还是软考高...
盘点五个IT领域下证快的证...
CBA与TOGAF:探寻企业架构...
【收藏】软考电子证书下载...
项目经理任选两本证书,年...
DAMA中国推出“一考两证”...
数据分析具体指的是什么,...
数据分析师需要具备什么数...
CDA认证带你了解数据分析的...
敏捷与DevOps协同工作的注...
DevOps自动化测试的注意事...
DevOps五个好用的工具列表...
IT项目管理实现落地有哪些...
IT项目需求分析重点是建立...


中培IT学院 Copyright@2006-2024  北京中培伟业管理咨询有限公司.ALL Rights Reseved 备案号:京ICP备13024721号-2