结构化数据和非结构化数据的区别



非结构化数据
Word文档属于非结构化数据。非结构化数据是指没有预定义的数据模型,数据结构不规则或不完整的数据,常见的非结构化数据包括文档、图片、视频等。Word文档由于其内容的多样性和不固定的格式,无法用数据库二维逻辑表来表现,因此被归类为非结构化数据
结构化数据、半结构化数据和非结构化数据的定义和区别
结构化数据:指具有明确的、预定义的数据模型,遵循一致顺序的数据。常见的结构化数据是关系型数据库中的数据,如企业ERP、OA、HR系统中的数据。结构化数据有明确的含义、严格的顺序和明确的数据类型
半结构化数据:介于结构化数据和非结构化数据之间,具有一定的结构化特征但不完全符合结构化特征的数据。常见的半结构化数据包括日志文件、XML文档、JSON文档、Email等。半结构化数据有基本固定的结构模式,但结构变化较大
非结构化数据:没有预定义的数据模型,数据结构不规则或不完整的数据。常见的非结构化数据包括文档(如Word、PDF、PPT)、图片、视频等。非结构化数据无法用数据库二维逻辑表来表现

