如今的企业依靠数据运行。目前的挑战在于存储、管理和保护数据。数据正呈指数级增长,给传统的存储系统带来了压力。
管理数据的第一步是了解不同类型的数据,以及为什么这些差异至关重要。两种主要的数据类型是结构化和非结构化。这两种数据类型在组织和管理方式上存在巨大差异,但在很多方面都可以为企业提供帮助。
一、什么是结构化数据?
结构化数据是可以整齐地组织成集合结构的信息,例如带有行和列的电子表格。最常见的例子是关系数据库,例如用于零售产品下单、酒店预订、设立支票帐户或储蓄帐户的数据库。关系数据库和结构化数据通常被 ERP、CRM、MDM、EMI 等应用程序使用。
想想我们经常在计算机上处理的信息:客户或患者的姓名和地址、电话号码、信用卡号码和到期日、社会保障号码、金融交易、产品名称和 SKU 号码。这些都是结构化数据很好的示例。
结构化数据易于搜索和组织,机器设备可以轻松地处理。用户可以输入数据、搜索数据库、修改和使用数据,通常使用关系数据库管理系统或结构化查询语言 (SQL)。SQL 是专门为管理结构化数据而设计的编程语言。
二、什么是非结构化数据?
顾名思义,其他所有不能按照行列格式整齐排列的数据都是结构化数据,如录音、视频片段、图像、社交媒体帖子、电子邮件内容、客户服务聊天记录、机器传感器数据等等。据 Gartner 估计,非结构化数据约占企业所有数据的 80%,来自其他机构的估计甚至更高。
非结构化数据可以由人类或机器生成。人类生成的信息包括音频文件、视频(如 YouTube 内容和监控)、照片、医疗图像和文本消息。机器生成的数据可以是涡轮机、飞机引擎、物联网、电器的传感器数据、系统日志、交通或天气,也可以是卫星图像、数字监控文件或大气数据。