From e510f183bda0581fa205c7a630ba3273bc7b11b4 Mon Sep 17 00:00:00 2001 From: Han Yu Date: Tue, 11 Aug 2020 15:46:35 -0700 Subject: [PATCH 1/3] Fix typo --- ch2.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ch2.md b/ch2.md index 4fbc179..f82cf45 100644 --- a/ch2.md +++ b/ch2.md @@ -421,7 +421,7 @@ MapReduce是一个由Google推广的编程模型,用于在多台机器上批 MapReduce将[第10章](ch10.md)中有更详细的描述。现在我们将简要讨论一下MongoDB使用的模型。 -MapReduce既不是一个声明式的查询语言,也不是一个完全命令式的查询API,而是处于两者之间:查询的逻辑用代码片断来表示,这些代码片段会被处理框架重复性调用。它基于`map`(也称为`collect`)和`reduce`(也称为`fold`或`inject`)函数,两个函数存在于许多函数式编程语言中。 +MapReduce既不是一个声明式的查询语言,也不是一个完全命令式的查询API,而是处于两者之间:查询的逻辑用代码片段来表示,这些代码片段会被处理框架重复性调用。它基于`map`(也称为`collect`)和`reduce`(也称为`fold`或`inject`)函数,两个函数存在于许多函数式编程语言中。 最好举例来解释MapReduce模型。假设你是一名海洋生物学家,每当你看到海洋中的动物时,你都会在数据库中添加一条观察记录。现在你想生成一个报告,说明你每月看到多少鲨鱼。 From e1e8d9f17e7b8868afa72672ec3f7ec23e712ffc Mon Sep 17 00:00:00 2001 From: hanyu Date: Mon, 17 Aug 2020 17:31:37 -0700 Subject: [PATCH 2/3] Fix unappropirate translation --- ch3.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ch3.md b/ch3.md index 8cbf6fe..4b1f896 100644 --- a/ch3.md +++ b/ch3.md @@ -193,7 +193,7 @@ $ cat database #### 用SSTables制作LSM树 -这里描述的算法本质上是LevelDB 【6】和RocksDB 【7】中使用的关键值存储引擎库,被设计嵌入到其他应用程序中。除此之外,LevelDB可以在Riak中用作Bitcask的替代品。在Cassandra和HBase中使用了类似的存储引擎【8】,这两种引擎都受到了Google的Bigtable文档【9】(引入了SSTable和memtable)的启发。 +这里描述的算法本质上是LevelDB 【6】和RocksDB 【7】中使用的关键值存储引擎库,被设计嵌入到其他应用程序中。除此之外,LevelDB可以在Riak中用作Bitcask的替代品。在Cassandra和HBase中使用了类似的存储引擎【8】,这两种引擎都受到了Google的Bigtable论文【9】(引入了SSTable和memtable)的启发。 最初这种索引结构是由Patrick O'Neil等人描述的。在日志结构合并树(或LSM树)【10】的基础上,建立在以前的工作上日志结构的文件系统【11】。基于这种合并和压缩排序文件原理的存储引擎通常被称为LSM存储引擎。 From 08f299dec476c16ca6792d98e12c7b58d230a163 Mon Sep 17 00:00:00 2001 From: hanyu Date: Sat, 22 Aug 2020 15:31:41 -0700 Subject: [PATCH 3/3] Fix translation error --- ch3.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ch3.md b/ch3.md index 4b1f896..5350558 100644 --- a/ch3.md +++ b/ch3.md @@ -440,7 +440,7 @@ Teradata,Vertica,SAP HANA和ParAccel等数据仓库供应商通常使用昂 这个模板的变体被称为雪花模式,其中尺寸被进一步分解为子尺寸。例如,品牌和产品类别可能有单独的表格,并且 `dim_product` 表格中的每一行都可以将品牌和类别作为外键引用,而不是将它们作为字符串存储在 `dim_product` 表格中。雪花模式比星形模式更规范化,但是星形模式通常是首选,因为分析师使用它更简单【55】。 -在典型的数据仓库中,表格通常非常宽泛:事实表格通常有100列以上,有时甚至有数百列【51】。维度表也可以是非常宽的,因为它们包括可能与分析相关的所有元数据——例如,`dim_store` 表可以包括在每个商店提供哪些服务的细节,它是否具有店内面包房,方形镜头,商店第一次开幕的日期,最后一次改造的时间,离最近的高速公路的距离等等。 +在典型的数据仓库中,表格通常非常宽泛:事实表格通常有100列以上,有时甚至有数百列【51】。维度表也可以是非常宽的,因为它们包括可能与分析相关的所有元数据——例如,`dim_store` 表可以包括在每个商店提供哪些服务的细节,它是否具有店内面包房,店面面积,商店第一次开幕的日期,最后一次改造的时间,离最近的高速公路的距离等等。