但是,如果DBA只查询或更新一些值,那么键/值是低效的。No 结构化 数据库在信息社会,信息可以分为两类。一类信息可以用数据或者统一的结构来表示,我们称之为结构化 data,比如数字和符号;另一种信息,如文本、图像、声音、网页等。,不能用数字或统一的结构来表示,我们称之为非结构化 data。结构化 data属于非-结构化 data,是非-结构化 data的特例。随着网络技术的发展,特别是Internet和Intranet技术的飞速发展,非结构化数据量与日俱增。

因此,数据库技术也相应地进入了“后关系数据库时代”,发展为基于网络应用的非结构化-1/时代。所谓非结构化 数据库是指数据库的变长记录由几个不可重复的字段组成,每个字段可以由几个不可重复的可重复的子字段组成。简单来说,要么结构化 数据库表示该字段是变量数据库。中国不是结构化 数据库由北京国鑫巴斯软件有限公司的iBase数据库代理

4、“数据仓库之父”谈如何处理非 结构化数据

虽然non-结构化数据很难处理,但它已经存在很久了,绝对比计算机的历史还要久。不信你想想圣经,埃及象形文字,卡马河佛经,这些都是对与错结构化 data,他们的历史可想而知。这些非-结构化数据肯定比硅片早。虽然搜索引擎已经出现了一段时间,但它绝不像印刷时代那么古老。即使现在搜索引擎已经很完善了,但现在还不是随意处理非-结构化数据信息的时候,至少目前是这样。

无用的输入,无用的输出只有当非-结构化数据从数据仓库中提取出来时,非-结构化数据的真实价值才会被搜索引擎释放出来。很难整合非结构化数据。想想那些被提出很久的信息技术问题:无用信息输入和无用信息输出(GIGO),你就知道即使用功能强大的搜索引擎去处理那些本质上没有经过提炼和整合的数据,会得到什么结果。搜索引擎的结果会告诉我们答案,返回给用户的会是一些未经提炼的无用信息。

5、如何将非 结构化数据转化为 结构化数据

与结构化 data(即行数据存储在数据库中,实现的数据可以用二维表结构进行逻辑表示)相比,不方便用数据库二维逻辑表表示的数据称为非。字段可以根据需要进行扩展,即字段个数不确定,可以称为semi 结构化 data,比如存储在Exchange中的数据。

一类信息可以用数据或者统一的结构来表示,我们称之为结构化 data,比如数字和符号;另一种信息,如文本、图像、声音、网页等。,不能用数字或统一的结构来表示,我们称之为非结构化 data。结构化 Data属于非-结构化 Data,是非-结构化 Data的特例。顾名思义,数据清洗就是洗脏地面。由于数据仓库中的数据是面向某个主题的数据集合,这些数据是从多个业务系统中抽取出来的,并且包含历史数据,所以不可避免的会出现一些数据错误,一些数据相互冲突。这些错误或冲突的数据显然是不需要的,它们被称为脏数据位置。

 2/3   首页 上一页 1 2 3 下一页 尾页

文章TAG:结构化  数据库  管理  非结构化数据库管理  
下一篇