From d7d38aebaaea5dc6a6eb71f94faff7f8f6773f8d Mon Sep 17 00:00:00 2001 From: wwek Date: Fri, 25 Jan 2019 22:19:50 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BC=98=E5=8C=96=20=E7=BB=9F=E4=B8=80?= =?UTF-8?q?=E5=90=8D=E7=A7=B0=E4=B8=BA=E2=80=9C=E8=A1=8D=E7=94=9F=E6=95=B0?= =?UTF-8?q?=E6=8D=AE=E2=80=9D=20=E6=B4=BE=E7=94=9F=E6=95=B0=E6=8D=AE=20>?= =?UTF-8?q?=20=E8=A1=8D=E7=94=9F=E6=95=B0=E6=8D=AE=20=EF=BC=8C=E5=8F=82?= =?UTF-8?q?=E8=80=83=E6=97=A2=E6=9C=89=E7=BF=BB=E8=AF=91=EF=BC=8C=E7=94=A8?= =?UTF-8?q?=E8=BF=99=E4=B8=AA=E6=9B=B4=E5=87=86=E7=A1=AE=E4=B8=80=E4=BA=9B?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- SUMMARY.md | 2 +- ch11.md | 2 +- ch2.md | 2 +- glossary.md | 4 ++-- 4 files changed, 5 insertions(+), 5 deletions(-) diff --git a/SUMMARY.md b/SUMMARY.md index 6b29a63..b86fa27 100644 --- a/SUMMARY.md +++ b/SUMMARY.md @@ -13,7 +13,7 @@ * [第七章:事务](ch7.md) * [第八章:分布式系统的麻烦](ch8.md) * [第九章:一致性与共识](ch9.md) -* [第三部分:派生数据](part-iii.md) +* [第三部分:衍生数据](part-iii.md) * [第十章:批处理](ch10.md) * [第十一章:流处理](ch11.md) * [第十二章:数据系统的未来](ch12.md) diff --git a/ch11.md b/ch11.md index 391e771..0202f3d 100644 --- a/ch11.md +++ b/ch11.md @@ -262,7 +262,7 @@ #### 变更数据捕获的实现 -​ 我们可以将日志消费者叫做**衍生数据系统**,正如在第三部分的[介绍](part-iii.md)中所讨论的:存储在搜索索引和数据仓库中的数据,只是**记录系统**数据的额外视图。变更数据捕获是一种机制,可确保对记录系统所做的所有更改都反映在派生数据系统中,以便派生系统具有数据的准确副本。 +​ 我们可以将日志消费者叫做**衍生数据系统**,正如在第三部分的[介绍](part-iii.md)中所讨论的:存储在搜索索引和数据仓库中的数据,只是**记录系统**数据的额外视图。变更数据捕获是一种机制,可确保对记录系统所做的所有更改都反映在衍生数据系统中,以便衍生系统具有数据的准确副本。 ​ 从本质上说,变更数据捕获使得一个数据库成为领导者(被捕获变化的数据库),并将其他组件变为追随者。基于日志的消息代理非常适合从源数据库传输变更事件,因为它保留了消息的顺序(避免了[图11-2](img/fig11-2.png)的重新排序问题)。 diff --git a/ch2.md b/ch2.md index b9c0e2c..c7a0ab0 100644 --- a/ch2.md +++ b/ch2.md @@ -144,7 +144,7 @@ JSON表示比[图2-1](img/fig2-1.png)中的多表模式具有更好的**局部 [^ii]: 关于关系模型的文献区分了几种不同的规范形式,但这些区别几乎没有实际意义。一个经验法则是,如果重复存储了可以存储在一个地方的值,则模式就不是**规范化(normalized)**的。 -> 数据库管理员和开发人员喜欢争论规范化和非规范化,让我们暂时保留判断吧。在本书的[第三部分](part-iii.md),我们将回到这个话题,探讨系统的方法用以处理缓存,非规范化和派生数据。 +> 数据库管理员和开发人员喜欢争论规范化和非规范化,让我们暂时保留判断吧。在本书的[第三部分](part-iii.md),我们将回到这个话题,探讨系统的方法用以处理缓存,非规范化和衍生数据。 不幸的是,对这些数据进行规范化需要多对一的关系(许多人生活在一个特定的地区,许多人在一个特定的行业工作),这与文档模型不太吻合。在关系数据库中,通过ID来引用其他表中的行是正常的,因为连接很容易。在文档数据库中,一对多树结构没有必要用连接,对连接的支持通常很弱[^iii]。 diff --git a/glossary.md b/glossary.md index 872908c..092bc42 100644 --- a/glossary.md +++ b/glossary.md @@ -88,9 +88,9 @@ -### 派生数据(derived data) +### 衍生数据(derived data) -一种数据集,根据其他数据通过可重复运行的流程创建。必要时,你可以运行该流程再次创建派生数据。派生数据通常用于提高特定数据的读取速度。常见的派生数据有索引、缓存和物化视图。参见第三部分的介绍。 +一种数据集,根据其他数据通过可重复运行的流程创建。必要时,你可以运行该流程再次创建衍生数据。衍生数据通常用于提高特定数据的读取速度。常见的衍生数据有索引、缓存和物化视图。参见第三部分的介绍。