--- title: 索引 weight: 550 breadcrumbs: false --- ### 符号 - 3FS(分布式文件系统), [分布式文件系统](/ch11#sec_batch_dfs) ### A - 中止(事务), [事务](/ch8#ch_transactions), [原子性](/ch8#sec_transactions_acid_atomicity) - 级联, [没有脏读](/ch8#no-dirty-reads) - 在两阶段提交中, [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - 乐观并发控制的性能, [可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 重试已中止的事务, [处理错误和中止](/ch8#handling-errors-and-aborts) - 抽象, [云服务的分层](/ch1#layering-of-cloud-services), [简单性:管理复杂度](/ch2#id38), [数据模型与查询语言](/ch3#ch_datamodels), [事务](/ch8#ch_transactions), [总结](/ch8#summary) - 意外复杂性, [简单性:管理复杂度](/ch2#id38) - 问责制, [责任与问责](/ch14#id371) - 会计(财务数据), [总结](/ch3#summary), [不可变事件的优点](/ch12#sec_stream_immutability_pros) - Accumulo(数据库) - 宽柱数据模型, [读写的数据局部性](/ch3#sec_datamodels_document_locality), [列压缩](/ch4#sec_storage_column_compression) - ACID 属性(事务), [ACID 的含义](/ch8#sec_transactions_acid) - 原子性, [原子性](/ch8#sec_transactions_acid_atomicity), [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 一致性, [一致性](/ch8#sec_transactions_acid_consistency), [维护完整性,尽管软件有Bug](/ch13#id455) - 持久性, [使 B 树可靠](/ch4#sec_storage_btree_wal), [持久性](/ch8#durability) - 隔离性, [隔离性](/ch8#sec_transactions_acid_isolation), [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 确认(消息), [确认与重新传递](/ch12#sec_stream_reordering) - active/active replication(见 multi-leader replication) - active/passive replication(见 基于领导者的复制) - ActiveMQ(消息系统), [消息代理](/ch5#message-brokers), [消息代理与数据库的对比](/ch12#id297) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - ActiveRecord(对象关系映射器), [对象关系映射(ORM)](/ch3#object-relational-mapping-orm), [处理错误和中止](/ch8#handling-errors-and-aborts) - activity (workflows)(见 workflow engines) - Actor 模型, [分布式 actor 框架](/ch5#distributed-actor-frameworks) - (另见 event-driven architecture) - 与流处理的比较, [事件驱动架构与 RPC](/ch12#sec_stream_actors_drpc) - 自适应容量, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - Advanced Message Queuing Protocol(见 AMQP) - 航空航天系统, [拜占庭故障](/ch9#sec_distributed_byzantine) - Aerospike(数据库) - 强一致性模式, [单对象写入](/ch8#sec_transactions_single_object) - AGE(图数据库), [Cypher 查询语言](/ch3#id57) - 汇总 - 数据立方体和已实现视图, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 分批处理, [排序与内存聚合](/ch11#id275) - 流程中, [流分析](/ch12#id318) - 聚合管道(MongoDB), [规范化、反规范化与连接](/ch3#sec_datamodels_normalization), [文档的查询语言](/ch3#query-languages-for-documents) - 敏捷, [可演化性:让变化更容易](/ch2#sec_introduction_evolvability) - 最小化不可逆性, [批处理](/ch11#ch_batch), [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - 充满自信地快速前进, [端到端原则重现](/ch13#id456) - 一致意见, [单值共识](/ch10#single-value-consensus), [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - (另见 共识) - AI (artificial intelligence)(见 machine learning) - AI Act (European Union), [数据系统、法律与社会](/ch1#sec_introduction_compliance) - Airbyte, [数据仓库](/ch1#sec_introduction_dwh) - Airflow(工作流调度器), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows), [批处理](/ch11#ch_batch), [工作流调度](/ch11#sec_batch_workflows) - 云数据仓集成, [查询语言](/ch11#sec_batch_query_lanauges) - 用于 ETL, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 阿卡迈 - 响应时间研究, [平均值、中位数与百分位点](/ch2#id24) - 算法 - 算法正确性, [定义算法的正确性](/ch9#defining-the-correctness-of-an-algorithm) - B树, [B 树](/ch4#sec_storage_b_trees)-[B 树变体](/ch4#b-tree-variants) - 分布式系统, [系统模型与现实](/ch9#sec_distributed_system_model) - 归并排序, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [混洗数据](/ch11#sec_shuffle) - 调度, [资源分配](/ch11#id279) - SSTable 与 LSM 树, [SSTable 文件格式](/ch4#the-sstable-file-format)-[压实策略](/ch4#sec_storage_lsm_compaction) - 全互联复制拓扑, [多主复制拓扑](/ch6#sec_replication_topologies) - AllegroGraph(数据库), [图数据模型](/ch3#sec_datamodels_graph) - SPARQL 查询语言, [SPARQL 查询语言](/ch3#the-sparql-query-language) - ALTER TABLE 语句(SQL), [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility), [编码与演化](/ch5#ch_encoding) - 亚马逊 - Dynamo(见 Dynamo(数据库)) - 响应时间研究, [平均值、中位数与百分位点](/ch2#id24) - Amazon Web Services (AWS) - Aurora(见 Aurora(云数据库)) - ClockBound(见 ClockBound(时间同步)) - 正确性测试, [形式化方法和随机测试](/ch9#sec_distributed_formal) - DynamoDB(见 DynamoDB(数据库)) - EBS(见 EBS(虚拟块设备)) - Kinesis(见 Kinesis(消息系统)) - Neptune(见 Neptune(图数据库)) - 网络可靠性, [实践中的网络故障](/ch9#sec_distributed_network_faults) - S3(见 S3(对象存储)) - 放大 - 偏见, [偏见与歧视](/ch14#id370) - 故障, [维护派生状态](/ch13#id446) - 尾延迟, [响应时间指标的应用](/ch2#sec_introduction_slo_sla), [本地二级索引](/ch7#id166) - 写入放大, [写放大](/ch4#write-amplification) - AMQP(高级消息队列协议), [消息代理与数据库的对比](/ch12#id297) - (另见 messaging systems) - 比较基于日志的邮件, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [重播旧消息](/ch12#sec_stream_replay) - 消息顺序, [确认与重新传递](/ch12#sec_stream_reordering) - 分析系统, [分析型与事务型系统](/ch1#sec_introduction_analytics) - 作为衍生数据系统, [记录系统与派生数据](/ch1#sec_introduction_derived) - 来自运营系统的 ETL, [数据仓库](/ch1#sec_introduction_dwh) - 治理, [超越数据湖](/ch1#beyond-the-data-lake) - 分析, [分析型与事务型系统](/ch1#sec_introduction_analytics)-[记录系统与派生数据](/ch1#sec_introduction_derived) - 与事务处理的比较, [事务处理与分析的特征](/ch1#sec_introduction_oltp) - 数据正常化, [规范化的权衡](/ch3#trade-offs-of-normalization) - data warehousing(见 data warehousing) - predictive(见 predictive analytics) - 与批量处理的关系, [分析(Analytics)](/ch11#sec_batch_olap)-[分析(Analytics)](/ch11#sec_batch_olap) - 计划, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics)-[星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 快速隔离查询, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 流式分析, [流分析](/ch12#id318) - 分析工程, [分析型与事务型系统](/ch1#sec_introduction_analytics) - 反熵, [追赶错过的写入](/ch6#sec_replication_read_repair) - Antithesis(确定性仿真测试), [确定性模拟测试](/ch9#deterministic-simulation-testing) - Apache Accumulo(见 Accumulo) - Apache ActiveMQ(见 ActiveMQ) - Apache AGE(见 AGE) - Apache Arrow(见 Arrow(数据格式)) - Apache Avro(见 Avro) - Apache Beam(见 Beam) - Apache BookKeeper(见 BookKeeper) - Apache Cassandra(见 Cassandra) - Apache Curator(见 Curator) - Apache DataFusion(见 DataFusion(查询引擎)) - Apache Druid(见 Druid(数据库)) - Apache Flink(见 Flink(处理框架)) - Apache HBase(见 HBase) - Apache Iceberg(见 Iceberg(表格式)) - Apache Jena(见 Jena) - Apache Kafka(见 Kafka) - Apache Lucene(见 Lucene) - Apache Oozie(见 Oozie(工作流调度器)) - Apache ORC(见 ORC(数据格式)) - Apache Parquet(见 Parquet(数据格式)) - Apache Pig(查询语言), [查询语言](/ch11#sec_batch_query_lanauges) - Apache Pinot(见 Pinot(数据库)) - Apache Pulsar(见 Pulsar) - Apache Qpid(见 Qpid) - Apache Samza(见 Samza) - Apache Solr(见 Solr) - Apache Spark(见 Spark;见 Spark(处理框架)) - Apache Storm(见 Storm) - Apache Superset(见 Superset(数据可视化软件)) - Apache Thrift(见 Thrift) - Apache ZooKeeper(见 ZooKeeper) - Apama (流式分析), [复合事件处理](/ch12#id317) - append-only files(见 logs) - Application Programming Interfaces (APIs), [数据模型与查询语言](/ch3#ch_datamodels) - 用于改变流, [变更流的 API 支持](/ch12#sec_stream_change_api) - 分布式事务, [XA 事务](/ch8#xa-transactions) - 服务费用, [流经服务的数据流:REST 与 RPC](/ch5#sec_encoding_dataflow_rpc)-[RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - (另见 services) - 可演化性, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - RESTful, [Web 服务](/ch5#sec_web_services) - application state(见 国家) - approximate search(见 similarity search) - 档案储存、数据库数据, [归档存储](/ch5#archival-storage) - arcs(见 edges) - ArcticDB(数据库), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 算术平均值, [平均值、中位数与百分位点](/ch2#id24) - 数组 - 数组数据库, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 多层面, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - Arrow(数据格式), [列式存储](/ch4#sec_storage_column), [DataFrames](/ch11#id287) - artificial intelligence(见 machine learning) - ASCII text, [Protocol Buffers](/ch5#sec_encoding_protobuf) - ASN.1 (schema language), [模式的优点](/ch5#sec_encoding_schemas) - 关联表格, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many), [属性图](/ch3#id56) - 同步网络, [不可靠的网络](/ch9#sec_distributed_networks), [术语表](/glossary) - 比较同步网络, [同步与异步网络](/ch9#sec_distributed_sync_networks) - 系统模型, [系统模型与现实](/ch9#sec_distributed_system_model) - 同步复制, [同步复制与异步复制](/ch6#sec_replication_sync_async), [术语表](/glossary) - 故障数据损失, [领导者故障:故障转移](/ch6#leader-failure-failover) - 从同步跟踪器读取, [复制延迟的问题](/ch6#sec_replication_lag) - 有多个领导, [多主复制](/ch6#sec_replication_multi_leader) - 异步传输模式, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 原子广播, [共享日志作为共识](/ch10#sec_consistency_shared_logs) - 原子钟, [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - (另见 clocks) - 原子性, [术语表](/glossary) - 原子自增, [单对象写入](/ch8#sec_transactions_single_object) - 比较和设置, [条件写入(比较并设置)](/ch8#sec_transactions_compare_and_set), [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - (另见 比较和设置) - 异常数据, [规范化的权衡](/ch3#trade-offs-of-normalization) - 获取和添加/递增, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical), [共识](/ch10#sec_consistency_consensus), [获取并增加作为共识](/ch10#fetch-and-add-as-consensus) - 写入操作, [原子写操作](/ch8#atomic-write-operations) - 原子性, [原子性](/ch8#sec_transactions_acid_atomicity), [单对象与多对象操作](/ch8#sec_transactions_multi_object), [术语表](/glossary) - 原子提交 - 避开, [多分区请求处理](/ch13#id360), [无协调数据系统](/ch13#id454) - 屏蔽和非屏蔽, [三阶段提交](/ch8#three-phase-commit) - 在溪流处理中, [恰好一次消息处理](/ch8#sec_transactions_exactly_once), [再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited), [原子提交再现](/ch12#sec_stream_atomic_commit) - 维护衍生数据, [保持系统同步](/ch12#sec_stream_sync) - 分布式事务, [分布式事务](/ch8#sec_transactions_distributed)-[再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - 用于多对象事务, [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 用于单对象写入, [单对象写入](/ch8#sec_transactions_single_object) - 与协商一致的关系, [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - 可审计性, [信任但验证](/ch13#sec_future_verification)-[用于可审计数据系统的工具](/ch13#id366) - 设计, [为可审计性而设计](/ch13#id365) - 自动审计系统, [不要盲目信任承诺](/ch13#id364) - 通过不可改变性, [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 可审计数据系统工具, [用于可审计数据系统的工具](/ch13#id366) - Aurora(云数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native) - Aurora DSQL(数据库) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 自动缩放, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - Automerge (CRDT library), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 可用性, [可靠性与容错](/ch2#sec_introduction_reliability) - (另见 fault tolerance) - 在 CAP 定理中, [CAP 定理](/ch10#the-cap-theorem) - 领袖选举, [共识的微妙之处](/ch10#subtleties-of-consensus) - 在服务级别协议(SLA)中, [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 可用区, [通过冗余容忍硬件故障](/ch2#tolerating-hardware-faults-through-redundancy), [读己之写](/ch6#sec_replication_ryw) - Avro(数据格式), [Avro](/ch5#sec_encoding_avro)-[动态生成的模式](/ch5#dynamically-generated-schemas) - 动态生成的计划, [动态生成的模式](/ch5#dynamically-generated-schemas) - 对象容器文件, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema), [归档存储](/ch5#archival-storage) - 读者决定作家的计划, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 计划演变, [写入者模式与读取者模式](/ch5#the-writers-schema-and-the-readers-schema) - 批量处理中的用途, [MapReduce](/ch11#sec_batch_mapreduce) - awk (Unix 工具) (英语)., [简单日志分析](/ch11#sec_batch_log_analysis), [简单日志分析](/ch11#sec_batch_log_analysis), [分布式作业编排](/ch11#id278) - Axon Framework, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - Azkaban(工作流调度器), [批处理](/ch11#ch_batch) - Azure Blob Storage(对象存储), [云服务的分层](/ch1#layering-of-cloud-services), [设置新的副本](/ch6#sec_replication_new_replica) - 有条件的标题, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - Azure managed disks, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - Azure SQL DB(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native) - Azure Storage, [对象存储](/ch11#id277) - Azure Synapse Analytics(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native) - Azure Virtual Machines - 现场虚拟机, [故障处理](/ch11#id281) ### B - B树(指数), [B 树](/ch4#sec_storage_b_trees)-[B 树变体](/ch4#b-tree-variants) - B+ trees, [B 树变体](/ch4#b-tree-variants) - 分支因子, [B 树](/ch4#sec_storage_b_trees) - comparison to LSM-trees, [比较 B 树与 LSM 树](/ch4#sec_storage_btree_lsm_comparison)-[磁盘空间使用](/ch4#disk-space-usage) - 崩溃恢复, [使 B 树可靠](/ch4#sec_storage_btree_wal) - 通过分割页面增长, [B 树](/ch4#sec_storage_b_trees) - 不可变变种, [B 树变体](/ch4#b-tree-variants), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 与硬分裂相似, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data) - 变体, [B 树变体](/ch4#b-tree-variants) - B2(对象存储), [分布式文件系统](/ch11#sec_batch_dfs) - Backblaze B2(见 B2(对象存储)) - 后端, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 返回, 指数, [描述性能](/ch2#sec_introduction_percentiles), [处理错误和中止](/ch8#handling-errors-and-aborts) - 背压, [描述性能](/ch2#sec_introduction_percentiles), [读取性能](/ch4#read-performance), [消息传递系统](/ch12#sec_stream_messaging), [术语表](/glossary) - 分批处理, [工作流调度](/ch11#sec_batch_workflows) - in TCP, [TCP 的局限性](/ch9#sec_distributed_tcp) - 备份 - 用于复制的数据库快照, [设置新的副本](/ch6#sec_replication_new_replica) - 在多用户系统中, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 完整性, [不要盲目信任承诺](/ch13#id364) - 抓图隔离, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 使用对象存储, [设置新的副本](/ch6#sec_replication_new_replica) - 相对复制, [复制](/ch6#ch_replication) - 向后兼容, [编码与演化](/ch5#ch_encoding) - BadgerDB(数据库) - 可序列事务, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi) - BASE, contrast to ACID, [ACID 的含义](/ch8#sec_transactions_acid) - 击打弹壳(Unix), [OLTP 系统的存储与索引](/ch4#sec_storage_oltp) - 批处理, [批处理](/ch11#ch_batch)-[本章小结](/ch11#id292), [术语表](/glossary) - 方案规划和职能规划, [MapReduce](/ch11#sec_batch_mapreduce) - 惠益, [批处理](/ch11#ch_batch) - 结合流处理, [统一批处理和流处理](/ch13#id338) - 与流处理的比较, [流处理](/ch12#sec_stream_processing) - 数据流引擎, [数据流引擎](/ch11#sec_batch_dataflow)-[数据流引擎](/ch11#sec_batch_dataflow) - 过失容忍, [故障处理](/ch11#id281), [消息传递系统](/ch12#sec_stream_messaging) - 数据整合, [批处理与流处理](/ch13#sec_future_batch_streaming)-[统一批处理和流处理](/ch13#id338) - 图表和迭代处理, [机器学习](/ch11#id290) - high-level APIs and languages, [查询语言](/ch11#sec_batch_query_lanauges)-[查询语言](/ch11#sec_batch_query_lanauges) - 云数据仓库中, [查询语言](/ch11#sec_batch_query_lanauges) - 在分布式系统中, [分布式系统中的批处理](/ch11#sec_batch_distributed) - 加入和分组, [JOIN 与 GROUP BY](/ch11#sec_batch_join)-[JOIN 与 GROUP BY](/ch11#sec_batch_join) - 限制, [批处理](/ch11#ch_batch) - 基于日志的信息和, [重播旧消息](/ch12#sec_stream_replay) - 保持衍生状态, [维护派生状态](/ch13#id446) - 衡量业绩, [批处理](/ch11#ch_batch) - 模式, [批处理模型](/ch11#id431) - 资源分配, [资源分配](/ch11#id279)-[资源分配](/ch11#id279) - 资源管理员, [分布式作业编排](/ch11#id278) - 调度器, [分布式作业编排](/ch11#id278) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived)-[对外提供派生数据](/ch11#sec_batch_serving_derived) - 移动数据, [混洗数据](/ch11#sec_shuffle)-[混洗数据](/ch11#sec_shuffle) - 任务执行, [分布式作业编排](/ch11#id278) - 使用大小写, [批处理用例](/ch11#sec_batch_output)-[对外提供派生数据](/ch11#sec_batch_serving_derived) - 使用 Unix 工具(例如), [使用 Unix 工具的批处理](/ch11#sec_batch_unix)-[排序与内存聚合](/ch11#id275) - 批处理框架 - 与操作系统的比较, [分布式系统中的批处理](/ch11#sec_batch_distributed) - Beam (数据流库), [统一批处理和流处理](/ch13#id338) - BERT (language model), [向量嵌入](/ch4#id92) - 偏向, [偏见与歧视](/ch14#id370) - bidirectional replication(见 multi-leader replication) - 泥浆大球, [简单性:管理复杂度](/ch2#id38) - 大数据 - 对数据最小化, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [立法与自律](/ch14#sec_future_legislation) - BigQuery(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native), [云数据仓库](/ch4#sec_cloud_data_warehouses), [批处理](/ch11#ch_batch) - DataFrames, [查询语言](/ch11#sec_batch_query_lanauges) - 硬化和集群, [按哈希范围分片](/ch7#sharding-by-hash-range) - 移动数据, [混洗数据](/ch11#sec_shuffle) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - Bigtable(数据库) - 硬化计划, [按键的范围分片](/ch7#sec_sharding_key_range) - 存储布局, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 平板(硬化), [分片](/ch7#ch_sharding) - 宽柱数据模型, [读写的数据局部性](/ch3#sec_datamodels_document_locality), [列压缩](/ch4#sec_storage_column_compression) - 二进制数据编码, [二进制编码](/ch5#binary-encoding)-[模式的优点](/ch5#sec_encoding_schemas) - Avro, [Avro](/ch5#sec_encoding_avro)-[动态生成的模式](/ch5#dynamically-generated-schemas) - MessagePack, [二进制编码](/ch5#binary-encoding)-[二进制编码](/ch5#binary-encoding) - Protocol Buffers, [Protocol Buffers](/ch5#sec_encoding_protobuf)-[字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 二进制编码 - 根据计划, [模式的优点](/ch5#sec_encoding_schemas) - 按网络驱动程序, [模式的优点](/ch5#sec_encoding_schemas) - binary strings, lack of support in JSON and XML, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - 比特币(催眠币), [用于可审计数据系统的工具](/ch13#id366) - 拜占庭断层承受力, [拜占庭故障](/ch9#sec_distributed_byzantine) - 交换中的货币错误, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 位图索引, [列压缩](/ch4#sec_storage_column_compression) - BitTorrent uTP protocol, [TCP 的局限性](/ch9#sec_distributed_tcp) - Bkd-树木(指数), [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 无咎死后, [人类与可靠性](/ch2#id31) - Blazegraph(数据库), [图数据模型](/ch3#sec_datamodels_graph) - SPARQL 查询语言, [SPARQL 查询语言](/ch3#the-sparql-query-language) - blob storage(见 object storage) - 块, [分布式文件系统](/ch11#sec_batch_dfs) - 块设备(磁盘), [存储与计算的分离](/ch1#sec_introduction_storage_compute) - 块链, [总结](/ch3#summary) - 拜占庭断层承受力, [拜占庭故障](/ch9#sec_distributed_byzantine), [共识](/ch10#sec_consistency_consensus), [用于可审计数据系统的工具](/ch13#id366) - 阻止原子承诺, [三阶段提交](/ch8#three-phase-commit) - Bloom 过滤器(算法), [布隆过滤器](/ch4#bloom-filters), [读取性能](/ch4#read-performance), [流分析](/ch12#id318) - BookKeeper (replicated log), [将工作分配给节点](/ch10#allocating-work-to-nodes) - 边框数据集, [流处理](/ch12#ch_stream), [术语表](/glossary) - (另见 batch processing) - 受限延迟, [术语表](/glossary) - 在网络中, [同步与异步网络](/ch9#sec_distributed_sync_networks) - 进程暂停, [响应时间保证](/ch9#sec_distributed_clocks_realtime) - 广播 - 全序广播(见 shared logs) - 无中介消息, [直接从生产者传递给消费者](/ch12#id296) - 粗糙(计量聚合器), [直接从生产者传递给消费者](/ch12#id296) - BTM (transaction coordinator), [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - 缓冲 - Bufstream(消息系统), [设置新的副本](/ch6#sec_replication_new_replica) - Bufstream(消息系统), [磁盘空间使用](/ch12#sec_stream_disk_usage) - 新建或购买, [云服务与自托管](/ch1#sec_introduction_cloud) - 快速网络交通模式, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 商业分析员, [分析型与事务型系统](/ch1#sec_introduction_analytics), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 商业数据处理, [事务处理与分析的特征](/ch1#sec_introduction_oltp) - 商业情报, [分析型与事务型系统](/ch1#sec_introduction_analytics)-[数据仓库](/ch1#sec_introduction_dwh) - Business Process Execution Language (BPEL), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - Business Process Model and Notation (BPMN), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 实例, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 字节序列,编码数据, [编码数据的格式](/ch5#sec_encoding_formats) - 拜占庭断层, [拜占庭故障](/ch9#sec_distributed_byzantine)-[弱形式的谎言](/ch9#weak-forms-of-lying), [系统模型与现实](/ch9#sec_distributed_system_model), [术语表](/glossary) - 拜占庭容错系统, [拜占庭故障](/ch9#sec_distributed_byzantine) - Byzantine Generals Problem, [拜占庭故障](/ch9#sec_distributed_byzantine) - 协商一致算法和, [共识](/ch10#sec_consistency_consensus), [用于可审计数据系统的工具](/ch13#id366) ### C - 缓存, [全内存存储](/ch4#sec_storage_inmemory), [术语表](/glossary) - 意见, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 作为衍生数据, [记录系统与派生数据](/ch1#sec_introduction_derived), [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - in CPUs, [查询执行:编译与向量化](/ch4#sec_storage_vectorized), [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 无效和赡养费, [保持系统同步](/ch12#sec_stream_sync), [维护物化视图](/ch12#sec_stream_mat_view) - 线性一致性, [线性一致性](/ch10#sec_consistency_linearizability) - 云中的本地磁盘, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - 日历同步, [同步引擎与本地优先软件](/ch6#sec_replication_offline_clients), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - California Consumer Privacy Act (CCPA), [数据系统、法律与社会](/ch1#sec_introduction_compliance) - Camunda(工作流程引擎), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - (数据), [记录系统与派生数据](/ch1#sec_introduction_derived) - CAP定理, [CAP 定理](/ch10#the-cap-theorem)-[CAP 定理](/ch10#the-cap-theorem), [术语表](/glossary) - 能力规划, [云时代的运维](/ch1#sec_introduction_operations) - Cap'n Proto(数据格式), [编码数据的格式](/ch5#sec_encoding_formats) - 碳排放, [分布式与单节点系统](/ch1#sec_introduction_distributed) - 级联中止, [没有脏读](/ch8#no-dirty-reads) - 连锁失败, [软件故障](/ch2#software-faults), [运维:自动/手动再平衡](/ch7#sec_sharding_operations), [超时和无界延迟](/ch9#sec_distributed_queueing) - Cassandra(数据库) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307), [变更流的 API 支持](/ch12#sec_stream_change_api) - 压缩战略, [压实策略](/ch4#sec_storage_lsm_compaction) - consistency level ANY, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 散列变硬, [按键的哈希分片](/ch7#sec_sharding_hash), [按哈希范围分片](/ch7#sharding-by-hash-range) - 最后写成的解决冲突, [检测并发写入](/ch6#sec_replication_concurrent) - 无领导复制, [无主复制](/ch6#sec_replication_leaderless) - 轻量事务, [单对象写入](/ch8#sec_transactions_single_object) - 线性,缺少, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 日志结构存储, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 多区域支助, [多地区操作](/ch6#multi-region-operation) - 二级指数, [本地二级索引](/ch7#id166) - 使用时钟, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations), [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 节点(硬化), [分片](/ch7#ch_sharding) - 猫(Unix 工具), [简单日志分析](/ch11#sec_batch_log_analysis) - 目录, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 因果关系, [版本向量](/ch6#version-vectors) - (另见 causal dependencies) - 因果关系, ["先发生"关系与并发](/ch6#sec_replication_happens_before)-[版本向量](/ch6#version-vectors) - 捕获, [版本向量](/ch6#version-vectors), [排序事件以捕获因果关系](/ch13#sec_future_capture_causality), [读也是事件](/ch13#sec_future_read_events) - 按总订单, [全序的限制](/ch13#id335) - 事务中, [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise) - 向朋友发送消息(例如), [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 因果关系, [术语表](/glossary) - 因果顺序 - 与, [逻辑时钟](/ch10#sec_consistency_timestamps) - 与, [逻辑时钟](/ch10#sec_consistency_timestamps)-[使用逻辑时钟强制约束](/ch10#enforcing-constraints-using-logical-clocks) - 发生关系前, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 在可序列事务中, [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise)-[检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 与时钟不符, [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 命令要抓取的事件, [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 违反《公约》的行为, [一致前缀读](/ch6#sec_replication_consistent_prefix), [不同拓扑的问题](/ch6#problems-with-different-topologies), [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 带有同步时钟, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 基于单元格的架构, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 复合事件处理(见 复合事件处理) - CephFS(分布式文件系统), [批处理](/ch11#ch_batch), [对象存储](/ch11#id277) - 证书透明性, [用于可审计数据系统的工具](/ch13#id366) - c组, [分布式作业编排](/ch11#id278) - 数据变更捕获, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication), [数据变更捕获](/ch12#sec_stream_cdc) - 变更流的 API 支持, [变更流的 API 支持](/ch12#sec_stream_change_api) - 比较事件来源, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 执行, [数据变更捕获的实现](/ch12#id307) - 初始快照, [初始快照](/ch12#sec_stream_cdc_snapshot) - 日志压缩, [日志压缩](/ch12#sec_stream_log_compaction) - 更改日志, [状态、流和不变性](/ch12#sec_stream_immutability) - 数据变更捕获, [数据变更捕获](/ch12#sec_stream_cdc) - 操作状态, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 在溪流中连接, [流表连接(流扩充)](/ch12#sec_stream_table_joins) - 日志压缩, [日志压缩](/ch12#sec_stream_log_compaction) - 保持衍生状态, [数据库与流](/ch12#sec_stream_databases) - 混乱工程, [容错](/ch2#id27), [故障注入](/ch9#sec_fault_injection) - 检查站 - 在高性能计算中, [云计算与超级计算](/ch1#id17) - 在流处理器中, [微批次与存档点](/ch12#id329) - 断路器(限制重试), [描述性能](/ch2#sec_introduction_percentiles) - 电路交换网络, [同步与异步网络](/ch9#sec_distributed_sync_networks) - 循环缓冲器, [磁盘空间使用](/ch12#sec_stream_disk_usage) - 循环复制地形, [多主复制拓扑](/ch6#sec_replication_topologies) - Citus(数据库) - 散列变硬, [固定数量的分片](/ch7#fixed-number-of-shards) - ClickHouse(数据库), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [云原生系统架构](/ch1#sec_introduction_cloud_native) - 增量视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - 点击流数据,分析, [JOIN 与 GROUP BY](/ch11#sec_batch_join) - 客户 - 电话服务, [流经服务的数据流:REST 与 RPC](/ch5#sec_encoding_dataflow_rpc) - 脱机, [同步引擎与本地优先软件](/ch6#sec_replication_offline_clients), [有状态、可离线的客户端](/ch13#id347) - 推动状态更改到, [将状态变更推送给客户端](/ch13#id348) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - ClockBound(时间同步), [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval) - use in YugabyteDB, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 时钟, [不可靠的时钟](/ch9#sec_distributed_clocks)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - 原子钟, [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 信任间隔, [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval)-[用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 全球快照, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 混合逻辑时钟, [混合逻辑时钟](/ch10#hybrid-logical-clocks) - logical(见 logical clocks) - 偏斜, [最后写入胜利(丢弃并发写入)](/ch6#sec_replication_lww), [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations), [对同步时钟的依赖](/ch9#sec_distributed_clocks_relying)-[带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 杀人, [单调时钟](/ch9#monotonic-clocks) - 同步和准确性, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy)-[时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - synchronization using GPS, [不可靠的时钟](/ch9#sec_distributed_clocks), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy), [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 时间与单调时钟, [单调时钟与日历时钟](/ch9#sec_distributed_monotonic_timeofday) - 时间标记事件, [你用的是谁的时钟?](/ch12#id438) - 云服务, [云服务与自托管](/ch1#sec_introduction_cloud)-[云计算与超级计算](/ch1#id17) - 可用区, [通过冗余容忍硬件故障](/ch2#tolerating-hardware-faults-through-redundancy), [读己之写](/ch6#sec_replication_ryw) - 数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 需要发现服务, [服务发现](/ch10#service-discovery) - 网络故障, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 利弊关系, [云服务的利弊](/ch1#sec_introduction_cloud_tradeoffs)-[云服务的利弊](/ch1#sec_introduction_cloud_tradeoffs) - 配额, [云时代的运维](/ch1#sec_introduction_operations) - regions(见 regions (geographic distribution)) - 无服务器, [微服务与无服务器](/ch1#sec_introduction_microservices) - 共享资源, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 对超级计算, [云计算与超级计算](/ch1#id17) - 云内, [云原生系统架构](/ch1#sec_introduction_cloud_native)-[云时代的运维](/ch1#sec_introduction_operations) - 云飞 - R2(见 R2(对象存储)) - 组合索引, [在索引中存储值](/ch4#sec_storage_index_heap) - 分组(记录顺序), [按哈希范围分片](/ch7#sharding-by-hash-range) - CockroachDB(数据库) - 基于共识的复制, [单主复制](/ch6#sec_replication_leader) - 一致性模式, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 键程硬化, [分片](/ch7#ch_sharding), [按键的范围分片](/ch7#sec_sharding_key_range) - 可序列事务, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi) - 硬化二级指数, [全局二级索引](/ch7#id167) - 事务, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - 使用模型检查, [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 代码生成 - 用于查询执行, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 带有协议缓冲, [Protocol Buffers](/ch5#sec_encoding_protobuf) - 协作编辑, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 列家庭(大表), [读写的数据局部性](/ch3#sec_datamodels_document_locality), [列压缩](/ch4#sec_storage_column_compression) - 面向列的存储, [列式存储](/ch4#sec_storage_column)-[查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 列压缩, [列压缩](/ch4#sec_storage_column_compression) - 公园, [列式存储](/ch4#sec_storage_column), [归档存储](/ch5#archival-storage) - 排序在, [列存储中的排序顺序](/ch4#sort-order-in-column-storage)-[列存储中的排序顺序](/ch4#sort-order-in-column-storage) - 矢量处理, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 宽柱型, [列压缩](/ch4#sec_storage_column_compression) - 写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - comma-separated values(见 CSV) - 命令查询责任分离, [事件溯源与 CQRS](/ch3#sec_datamodels_events)-[事件溯源与 CQRS](/ch3#sec_datamodels_events), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 命令(活动来源), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 执行(事务), [事务](/ch8#ch_transactions) - 原子提交, [分布式事务](/ch8#sec_transactions_distributed)-[再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - (另见 原子性) - 读作承诺隔离, [读已提交](/ch8#sec_transactions_read_committed) - three-phase commit (3PC), [三阶段提交](/ch8#three-phase-commit) - 两阶段提交, [两阶段提交(2PC)](/ch8#sec_transactions_2pc)-[协调器故障](/ch8#coordinator-failure) - 通用业务, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 压实(Compaction) - 更改日志, [日志压缩](/ch12#sec_stream_log_compaction) - (另见 日志压缩) - 流运算符状态, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 日志结构存储, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 问题, [读取性能](/ch4#read-performance) - 规模分级和分级办法, [压实策略](/ch4#sec_storage_lsm_compaction), [磁盘空间使用](/ch4#disk-space-usage) - 比较和设置, [条件写入(比较并设置)](/ch8#sec_transactions_compare_and_set), [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 执行锁定, [协调服务](/ch10#sec_consistency_coordination) - 执行独特性限制, [约束与唯一性保证](/ch10#sec_consistency_uniqueness) - 在对象存储中, [设置新的副本](/ch6#sec_replication_new_replica) - 与协商一致的关系, [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable), [共识](/ch10#sec_consistency_consensus), [比较并设置作为共识](/ch10#compare-and-set-as-consensus) - 与栅栏标志的关系, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - 与事务的关系, [单对象写入](/ch8#sec_transactions_single_object) - 兼容性, [编码与演化](/ch5#ch_encoding), [数据流的模式](/ch5#sec_encoding_dataflow) - 电话服务, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 编码格式的属性, [总结](/ch5#summary) - 使用数据库, [流经数据库的数据流](/ch5#sec_encoding_dataflow_db)-[归档存储](/ch5#archival-storage) - 补偿事务, [不可变事件的优点](/ch12#sec_stream_immutability_pros), [宽松地解释约束](/ch13#id362) - 汇编, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 复合事件处理, [复合事件处理](/ch12#id317) - 复杂度 - 理论模型中的蒸馏, [将系统模型映射到现实世界](/ch9#mapping-system-models-to-the-real-world) - 重要和意外事项, [简单性:管理复杂度](/ch2#id38) - 使用抽象来隐藏, [数据模型与查询语言](/ch3#ch_datamodels) - 管理, [简单性:管理复杂度](/ch2#id38) - composing data systems(见 unbundling databases) - 压缩 - in SSTables, [SSTable 文件格式](/ch4#the-sstable-file-format) - 计算密集型应用程序, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 电脑游戏, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 缩写索引, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 在散列硬化系统中, [按哈希范围分片](/ch7#sharding-by-hash-range) - 并发 - 演员编程模式, [分布式 actor 框架](/ch5#distributed-actor-frameworks), [事件驱动架构与 RPC](/ch12#sec_stream_actors_drpc) - (另见 event-driven architecture) - 事务隔离薄弱时出现的错误, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 解决冲突, [处理写入冲突](/ch6#sec_replication_write_conflicts)-[处理写入冲突](/ch6#sec_replication_write_conflicts) - 定义, [处理写入冲突](/ch6#sec_replication_write_conflicts) - 检测并行写作, [检测并发写入](/ch6#sec_replication_concurrent)-[版本向量](/ch6#version-vectors) - 双写、 问题, [保持系统同步](/ch12#sec_stream_sync) - 发生关系前, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 在复制系统中, [复制延迟的问题](/ch6#sec_replication_lag)-[版本向量](/ch6#version-vectors), [线性一致性](/ch10#sec_consistency_linearizability)-[线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update) - 多版本并发控制, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 乐观并发控制, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 行动命令, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 通过事件日志减少, [并发控制](/ch12#sec_stream_concurrency), [数据流:应用代码与状态变化的交互](/ch13#id450) - 时间和相对性, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 事务隔离, [隔离性](/ch8#sec_transactions_acid_isolation) - 写偏差, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts) - 有条件写入, [条件写入(比较并设置)](/ch8#sec_transactions_compare_and_set) - 事务中, [单对象写入](/ch8#sec_transactions_single_object) - 在对象存储中, [设置新的副本](/ch6#sec_replication_new_replica) - 会议管理系统(例如), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - conflict-free replicated datatypes (CRDTs), [CRDT 与操作变换](/ch6#sec_replication_crdts) - 用于无头复制, [捕获先发生关系](/ch6#capturing-the-happens-before-relationship) - 防止丢失更新, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 冲突 - 撤销, [冲突避免](/ch6#conflict-avoidance) - 因果关系, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 冲突检测 - 分布式事务, [XA 事务的问题](/ch8#problems-with-xa-transactions) - 在基于日志的系统中, [唯一性约束需要达成共识](/ch13#id452) - in serializable snapshot isolation (SSI), [检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 在两阶段提交中, [系统性的承诺](/ch8#a-system-of-promises) - 解决冲突 - 通过中止事务, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 通过道歉, [宽松地解释约束](/ch13#id362) - 最后写入胜利, [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 使用原子操作, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 确定什么是冲突, [处理写入冲突](/ch6#sec_replication_write_conflicts), [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 无领导复制, [检测并发写入](/ch6#sec_replication_concurrent) - 丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update)-[冲突解决与复制](/ch8#conflict-resolution-and-replication) - 实现, [物化冲突](/ch8#materializing-conflicts) - 决议, [处理写入冲突](/ch6#sec_replication_write_conflicts)-[处理写入冲突](/ch6#sec_replication_write_conflicts) - 自动, [自动冲突解决](/ch6#automatic-conflict-resolution) - 无头系统, [检测并发写入](/ch6#sec_replication_concurrent) - 最后写入胜利, [最后写入胜利(丢弃并发写入)](/ch6#sec_replication_lww) - 使用自定义逻辑, [手动冲突解决](/ch6#manual-conflict-resolution), [捕获先发生关系](/ch6#capturing-the-happens-before-relationship) - 兄弟, [手动冲突解决](/ch6#manual-conflict-resolution), [捕获先发生关系](/ch6#capturing-the-happens-before-relationship) - 合并, [捕获先发生关系](/ch6#capturing-the-happens-before-relationship) - 写偏差, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts) - 调和 - Freight(消息系统), [设置新的副本](/ch6#sec_replication_new_replica), [磁盘空间使用](/ch12#sec_stream_disk_usage) - 计划登记, [JSON 模式](/ch5#json-schema), [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 拥堵(网络) - 撤销, [TCP 的局限性](/ch9#sec_distributed_tcp) - 限制时钟的准确性, [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval) - 排队延迟, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 共识, [共识](/ch10#sec_consistency_consensus)-[总结](/ch10#summary), [术语表](/glossary) - 算法, [共识](/ch10#sec_consistency_consensus), [共识的实践](/ch10#sec_consistency_total_order) - 协商一致编号, [获取并增加作为共识](/ch10#fetch-and-add-as-consensus) - 协调事务, [协调服务](/ch10#sec_consistency_coordination)-[服务发现](/ch10#service-discovery) - 费用, [共识的利弊](/ch10#pros-and-cons-of-consensus) - 无法实现, [共识](/ch10#sec_consistency_consensus) - 防止脑分裂, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 重组, [共识的微妙之处](/ch10#subtleties-of-consensus) - 与原子承诺的关系, [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - relation to compare-and-set (CAS), [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable), [比较并设置作为共识](/ch10#compare-and-set-as-consensus) - 与获取和添加的关系, [获取并增加作为共识](/ch10#fetch-and-add-as-consensus) - 与复制有关, [使用共享日志](/ch10#sec_consistency_smr) - 与共享日志的关系, [共享日志作为共识](/ch10#sec_consistency_shared_logs) - 与独特性制约因素的关系, [唯一性约束需要达成共识](/ch13#id452) - 安全和生活特性, [单值共识](/ch10#single-value-consensus) - 单一价值共识, [单值共识](/ch10#single-value-consensus) - consent (GDPR), [同意与选择自由](/ch14#id375) - 一致性, [一致性](/ch8#sec_transactions_acid_consistency), [及时性与完整性](/ch13#sec_future_integrity) - 跨越不同数据库, [领导者故障:故障转移](/ch6#leader-failure-failover), [保持系统同步](/ch12#sec_stream_sync), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views), [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions) - 因果关系, [一致前缀读](/ch6#sec_replication_consistent_prefix), [不同拓扑的问题](/ch6#problems-with-different-topologies), [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 一致前缀读, [一致前缀读](/ch6#sec_replication_consistent_prefix)-[一致前缀读](/ch6#sec_replication_consistent_prefix) - 一致的快照, [设置新的副本](/ch6#sec_replication_new_replica), [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation)-[快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner), [初始快照](/ch12#sec_stream_cdc_snapshot), [创建索引](/ch13#id340) - (另见 snapshots) - 崩溃恢复, [使 B 树可靠](/ch4#sec_storage_btree_wal) - enforcing constraints(见 constraints) - 最终, [复制延迟的问题](/ch6#sec_replication_lag) - (另见 最终一致性) - in ACID transactions, [一致性](/ch8#sec_transactions_acid_consistency), [维护完整性,尽管软件有Bug](/ch13#id455) - 在 CAP 定理中, [CAP 定理](/ch10#the-cap-theorem) - 领袖选举, [共识的微妙之处](/ch10#subtleties-of-consensus) - 微服务, [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems) - 线性一致性, [复制延迟的解决方案](/ch6#id131), [线性一致性](/ch10#sec_consistency_linearizability)-[线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 含义, [一致性](/ch8#sec_transactions_acid_consistency) - 单调读, [单调读](/ch6#sec_replication_monotonic_reads)-[单调读](/ch6#sec_replication_monotonic_reads) - 二级指数, [多对象事务的需求](/ch8#sec_transactions_need), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation), [理解数据流](/ch13#id443), [创建索引](/ch13#id340) - 读后写, [读己之写](/ch6#sec_replication_ryw)-[读己之写](/ch6#sec_replication_ryw) - 在衍生数据系统中, [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions) - strong(见 线性一致性) - 及时性和完整性, [及时性与完整性](/ch13#sec_future_integrity) - 使用法定人数, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations), [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 连续的散列, [一致性哈希](/ch7#sec_sharding_consistent_hashing) - 一致前缀读, [一致前缀读](/ch6#sec_replication_consistent_prefix) - 限制(数据库), [一致性](/ch8#sec_transactions_acid_consistency), [写偏差的特征](/ch8#characterizing-write-skew) - 同步检查, [宽松地解释约束](/ch13#id362) - 避免协调, [无协调数据系统](/ch13#id454) - 确保一能, [操作标识符](/ch13#id355) - 在基于日志的系统中, [强制约束](/ch13#sec_future_constraints)-[多分区请求处理](/ch13#id360) - 跨越多个硬块, [多分区请求处理](/ch13#id360) - 在两阶段提交中, [分布式事务](/ch8#sec_transactions_distributed), [系统性的承诺](/ch8#a-system-of-promises) - 与协商一致的关系, [唯一性约束需要达成共识](/ch13#id452) - 需要线性, [约束与唯一性保证](/ch10#sec_consistency_uniqueness) - 领事(协调处), [协调服务](/ch10#sec_consistency_coordination) - 用于服务发现, [服务发现](/ch10#service-discovery) - 消费者(信息流), [消息代理](/ch5#message-brokers), [传递事件流](/ch12#sec_stream_transmit) - 背压, [消息传递系统](/ch12#sec_stream_messaging) - 消费者群体, [多个消费者](/ch12#id298) - 以原木计的消费者抵销额, [消费者偏移量](/ch12#sec_stream_log_offsets) - 失败, [确认与重新传递](/ch12#sec_stream_reordering), [消费者偏移量](/ch12#sec_stream_log_offsets) - 扇出, [时间线的物化与更新](/ch2#sec_introduction_materializing), [多个消费者](/ch12#id298), [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging) - 负载平衡, [多个消费者](/ch12#id298), [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging) - 未与生产者保持同步, [消息传递系统](/ch12#sec_stream_messaging), [磁盘空间使用](/ch12#sec_stream_disk_usage), [开展分拆工作](/ch13#sec_future_unbundling_favor) - content models (JSON Schema), [JSON 模式](/ch5#json-schema) - 参数 - 事务之间, [处理错误和中止](/ch8#handling-errors-and-aborts) - 屏蔽线程, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 乐观并发控制的性能, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 双相锁定, [两阶段锁定的性能](/ch8#performance-of-two-phase-locking) - 上下文开关, [延迟与响应时间](/ch2#id23), [进程暂停](/ch9#sec_distributed_clocks_pauses) - 收敛, [自动冲突解决](/ch6#automatic-conflict-resolution)-[CRDT 与操作变换](/ch6#sec_replication_crdts) - 协调 - 撤销, [无协调数据系统](/ch13#id454) - 跨数据中心, [全序的限制](/ch13#id335) - 跨区域, [跨地域运行](/ch6#sec_replication_multi_dc) - 交叉硬度顺序, [分片](/ch8#sharding), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner), [使用共享日志](/ch10#sec_consistency_smr), [多分区请求处理](/ch13#id360) - 路径请求到硬体, [请求路由](/ch7#sec_sharding_routing) - 服务, [锁定与领导者选举](/ch10#locking-and-leader-election), [协调服务](/ch10#sec_consistency_coordination)-[服务发现](/ch10#service-discovery) - 协调者, [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - 失效, [协调器故障](/ch8#coordinator-failure) - in XA transactions, [XA 事务](/ch8#xa-transactions)-[XA 事务的问题](/ch8#problems-with-xa-transactions) - 恢复, [从协调器故障中恢复](/ch8#recovering-from-coordinator-failure) - 复制写(B- 树), [B 树变体](/ch4#b-tree-variants), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 公共对象请求代理体系结构, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - coronal mass ejection(见 solar storm) - 正确性 - 可审计性, [信任但验证](/ch13#sec_future_verification)-[用于可审计数据系统的工具](/ch13#id366) - 拜占庭断层承受力, [拜占庭故障](/ch9#sec_distributed_byzantine) - 处理部分失败, [故障与部分失效](/ch9#sec_distributed_partial_failure) - 在基于日志的系统中, [强制约束](/ch13#sec_future_constraints)-[多分区请求处理](/ch13#id360) - 系统模型中的算法, [定义算法的正确性](/ch9#defining-the-correctness-of-an-algorithm) - 生成数据, [为可审计性而设计](/ch13#id365) - 不可变数据, [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 个人资料, [责任与问责](/ch14#id371), [隐私与数据使用](/ch14#id457) - 时间, [不同拓扑的问题](/ch6#problems-with-different-topologies), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy)-[用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 事务次数, [一致性](/ch8#sec_transactions_acid_consistency), [追求正确性](/ch13#sec_future_correctness), [维护完整性,尽管软件有Bug](/ch13#id455) - 及时性和完整性, [及时性与完整性](/ch13#sec_future_integrity)-[无协调数据系统](/ch13#id454) - 数据腐败 - 检测, [端到端原则](/ch13#sec_future_e2e_argument), [不要盲目信任承诺](/ch13#id364)-[用于可审计数据系统的工具](/ch13#id366) - 由于病态内存访问, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 辐射所致, [拜占庭故障](/ch9#sec_distributed_byzantine) - 由于大脑分裂, [领导者故障:故障转移](/ch6#leader-failure-failover), [分布式锁和租约](/ch9#sec_distributed_lock_fencing) - 由于事务隔离薄弱, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 完整性作为不存在, [及时性与完整性](/ch13#sec_future_integrity) - 网络包, [弱形式的谎言](/ch9#weak-forms-of-lying) - 磁盘, [持久性](/ch8#durability) - 防止使用写头日志, [使 B 树可靠](/ch4#sec_storage_btree_wal) - 从, [批处理](/ch11#ch_batch), [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 余弦相似性(语义搜索), [向量嵌入](/ch4#id92) - Couchbase(数据库) - 文档数据模型, [关系模型与文档模型](/ch3#sec_datamodels_history) - 持久性, [全内存存储](/ch4#sec_storage_inmemory) - 散列变硬, [固定数量的分片](/ch7#fixed-number-of-shards) - 加入支持, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 再平衡, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - vBuckets(硬化), [分片](/ch7#ch_sharding) - CouchDB(数据库) - 作为同步引擎, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - B-树木存储, [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 解决冲突, [手动冲突解决](/ch6#manual-conflict-resolution) - 耦合(松紧), [可演化性:让变化更容易](/ch2#sec_introduction_evolvability) - 覆盖索引, [在索引中存储值](/ch4#sec_storage_index_heap) - CozoDB(数据库), [Datalog:递归关系查询](/ch3#id62) - CPUs - 缓存一致性和内存障碍, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 缓冲和管道, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 计算错误的结果, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - SIMD instructions, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 断层和断层, [系统模型与现实](/ch9#sec_distributed_system_model) - CRDTs(见 conflict-free replicated datatypes) - CREATE INDEX statement (SQL), [多列索引与二级索引](/ch4#sec_storage_index_multicolumn), [创建索引](/ch13#id340) - 信用评级机构, [责任与问责](/ch14#id371) - 加密刷新, [事件溯源与 CQRS](/ch3#sec_datamodels_events), [不变性的局限性](/ch12#sec_stream_immutability_limitations) - 密码, [总结](/ch3#summary) - 密码学 - 防御攻击者, [拜占庭故障](/ch9#sec_distributed_byzantine) - 端到端加密和认证, [端到端原则](/ch13#sec_future_e2e_argument) - CSV (comma-separated values), [OLTP 系统的存储与索引](/ch4#sec_storage_oltp), [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - Curator (ZooKeeper recipes), [锁定与领导者选举](/ch10#locking-and-leader-election), [将工作分配给节点](/ch10#allocating-work-to-nodes) - Cypher(查询语言), [Cypher 查询语言](/ch3#id57) - comparison to SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language) ### D - Daft(处理框架) - DataFrames, [DataFrames](/ch11#id287) - 移动数据, [混洗数据](/ch11#sec_shuffle) - Dagster(工作流调度器), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows), [批处理](/ch11#ch_batch), [工作流调度](/ch11#sec_batch_workflows) - 云数据仓集成, [查询语言](/ch11#sec_batch_query_lanauges) - 仪表板(业务情报), [事务处理与分析的特征](/ch1#sec_introduction_oltp) - Dask(处理框架), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 数据目录, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 数据连接器, [数据仓库](/ch1#sec_introduction_dwh) - 数据合同, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 数据变更捕获, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - data corruption(见 corruption of data) - 数据方块, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 数据工程, [分析型与事务型系统](/ch1#sec_introduction_analytics) - 数据结构, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - data formats(见 编码) - 数据基础设施, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 数据集成, [数据集成](/ch13#sec_future_integration)-[统一批处理和流处理](/ch13#id338), [本章小结](/ch13#id367) - 批量和流处理, [批处理与流处理](/ch13#sec_future_batch_streaming)-[统一批处理和流处理](/ch13#id338) - 保持衍生状态, [维护派生状态](/ch13#id446) - 后处理数据, [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - 统一, [统一批处理和流处理](/ch13#id338) - 通过解开数据库, [分拆数据库](/ch13#sec_future_unbundling)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 与联邦数据库的比较, [一切的元数据库](/ch13#id341) - 通过生成数据合并工具, [组合使用派生数据的工具](/ch13#id442)-[排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 衍生数据与分布式事务, [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions) - 总订单的限制, [全序的限制](/ch13#id335) - 命令事件捕获因果关系, [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 关于数据流的推理, [理解数据流](/ch13#id443) - 需求, [记录系统与派生数据](/ch1#sec_introduction_derived) - 使用批量处理, [批处理](/ch11#ch_batch), [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 数据湖, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 数据湖区, [云数据仓库](/ch4#sec_cloud_data_warehouses), [分析(Analytics)](/ch11#sec_batch_olap) - data locality(见 局部性) - 数据网格, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 数据最小化, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [立法与自律](/ch14#sec_future_legislation) - 数据模型, [数据模型与查询语言](/ch3#ch_datamodels)-[总结](/ch3#summary) - DataFrames and arrays, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 类似图表的模型, [图数据模型](/ch3#sec_datamodels_graph)-[GraphQL](/ch3#id63) - 数据日志语言, [Datalog:递归关系查询](/ch3#id62)-[Datalog:递归关系查询](/ch3#id62) - 属性图, [属性图](/ch3#id56) - RDF and triple-stores, [三元组存储与 SPARQL](/ch3#id59)-[SPARQL 查询语言](/ch3#the-sparql-query-language) - 关系模型对文档模型, [关系模型与文档模型](/ch3#sec_datamodels_history)-[文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 支持多个, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 数据管道, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [记录系统与派生数据](/ch1#sec_introduction_derived), [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 数据产品, [超越数据湖](/ch1#beyond-the-data-lake) - data protection regulations(见 GDPR) - 数据居住法, [分布式与单节点系统](/ch1#sec_introduction_distributed), [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 数据科学, [分析型与事务型系统](/ch1#sec_introduction_analytics), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 数据仓, [数据仓库](/ch1#sec_introduction_dwh) - 数据系统 - 正确性、制约因素和完整性, [追求正确性](/ch13#sec_future_correctness)-[用于可审计数据系统的工具](/ch13#id366) - 数据集成, [数据集成](/ch13#sec_future_integration)-[统一批处理和流处理](/ch13#id338) - 使用目标, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 多样性, 保持同步, [保持系统同步](/ch12#sec_stream_sync) - 可维护性, [可运维性](/ch2#sec_introduction_maintainability)-[可演化性:让变化更容易](/ch2#sec_introduction_evolvability) - 可能的错误, [事务](/ch8#ch_transactions) - 可靠性, [可靠性与容错](/ch2#sec_introduction_reliability)-[人类与可靠性](/ch2#id31) - 硬件故障, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 人类错误, [人类与可靠性](/ch2#id31) - 重要性, [人类与可靠性](/ch2#id31) - 软件故障, [软件故障](/ch2#software-faults) - 可伸缩性, [可伸缩性](/ch2#sec_introduction_scalability)-[可伸缩性原则](/ch2#id35) - 解析数据库, [分拆数据库](/ch13#sec_future_unbundling)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 不可靠的时钟, [不可靠的时钟](/ch9#sec_distributed_clocks)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - 数据存储, [数据仓库](/ch1#sec_introduction_dwh), [术语表](/glossary) - 基于云的解决办法, [云数据仓库](/ch4#sec_cloud_data_warehouses) - ETL, [数据仓库](/ch1#sec_introduction_dwh), [保持系统同步](/ch12#sec_stream_sync) - 用于批处理, [批处理](/ch11#ch_batch) - 保持数据系统的同步, [保持系统同步](/ch12#sec_stream_sync) - 设计, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 硬化和集群, [按哈希范围分片](/ch7#sharding-by-hash-range) - 缓慢变化的维度, [连接的时间依赖性](/ch12#sec_stream_join_time) - 数据密集型应用, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 数据库管理员, [云时代的运维](/ch1#sec_introduction_operations) - 内部分布式事务, [跨不同系统的分布式事务](/ch8#sec_transactions_xa), [数据库内部的分布式事务](/ch8#sec_transactions_internal), [原子提交再现](/ch12#sec_stream_atomic_commit) - 数据库 - 归档存储, [归档存储](/ch5#archival-storage) - 信件经纪人的比较, [消息代理与数据库的对比](/ch12#id297) - 数据流, [流经数据库的数据流](/ch5#sec_encoding_dataflow_db) - 端到端参数, [端到端原则](/ch13#sec_future_e2e_argument)-[在数据系统中应用端到端思考](/ch13#id357) - 检查完整性, [端到端原则重现](/ch13#id456) - 与事件流的关系, [数据库与流](/ch12#sec_stream_databases)-[不变性的局限性](/ch12#sec_stream_immutability_limitations) - (另见 changelogs) - 变更流的 API 支持, [变更流的 API 支持](/ch12#sec_stream_change_api), [应用代码和状态的分离](/ch13#id344) - 数据变更捕获, [数据变更捕获](/ch12#sec_stream_cdc)-[变更流的 API 支持](/ch12#sec_stream_change_api) - 事件溯源, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 保持系统同步, [保持系统同步](/ch12#sec_stream_sync)-[保持系统同步](/ch12#sec_stream_sync) - 不可改变事件哲学, [状态、流和不变性](/ch12#sec_stream_immutability)-[不变性的局限性](/ch12#sec_stream_immutability_limitations) - 分拆, [分拆数据库](/ch13#sec_future_unbundling)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 构建数据存储技术, [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - 围绕数据流设计应用程序, [围绕数据流设计应用](/ch13#sec_future_dataflow)-[流处理器和服务](/ch13#id345) - 观察导出状态, [观察派生数据状态](/ch13#sec_future_observing)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 数据中心 - 失败, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - geographically distributed(见 regions (geographic distribution)) - 多种使用和共享资源, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 网络架构, [云计算与超级计算](/ch1#id17) - 网络断层, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 数据流动, [数据流的模式](/ch5#sec_encoding_dataflow)-[分布式 actor 框架](/ch5#distributed-actor-frameworks), [围绕数据流设计应用](/ch13#sec_future_dataflow)-[流处理器和服务](/ch13#id345) - 数据流系统的正确性, [数据流系统的正确性](/ch13#id453) - 数据流引擎, [数据流引擎](/ch11#sec_batch_dataflow) - 与流处理的比较, [流处理](/ch12#sec_stream_processing) - DataFrames, [DataFrames](/ch11#id287) - 批次处理框架中的支持, [批处理](/ch11#ch_batch) - 事件驱动, [事件驱动的架构](/ch5#sec_encoding_dataflow_msg)-[分布式 actor 框架](/ch5#distributed-actor-frameworks) - 关于, [理解数据流](/ch13#id443) - 通过数据库, [流经数据库的数据流](/ch5#sec_encoding_dataflow_db) - 通过服务, [流经服务的数据流:REST 与 RPC](/ch5#sec_encoding_dataflow_rpc)-[RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - workflow engines(见 workflow engines) - DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 执行, [DataFrames](/ch11#id287) - 分批处理, [DataFrames](/ch11#id287) - 在笔记本中, [机器学习](/ch11#id290) - 批次处理框架中的支持, [批处理](/ch11#ch_batch) - DataFusion(查询引擎), [云数据仓库](/ch4#sec_cloud_data_warehouses) - Datalog(查询语言), [Datalog:递归关系查询](/ch3#id62)-[Datalog:递归关系查询](/ch3#id62) - 数据流(变化数据捕获), [变更流的 API 支持](/ch12#sec_stream_change_api) - 数据类型 - binary strings in XML and JSON, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - 无冲突, [CRDT 与操作变换](/ch6#sec_replication_crdts) - 在 Avro 编码中, [Avro](/ch5#sec_encoding_avro) - 在协议缓冲中, [字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - numbers in XML and JSON, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - 日期和日期, [数据系统、法律与社会](/ch1#sec_introduction_compliance) - Datomic(数据库) - B-树木存储, [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 数据模型, [图数据模型](/ch3#sec_datamodels_graph), [三元组存储与 SPARQL](/ch3#id59) - 数据日志查询语言, [Datalog:递归关系查询](/ch3#id62) - 切除, [不变性的局限性](/ch12#sec_stream_immutability_limitations) - 事务语言, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 事务的序列执行, [实际串行执行](/ch8#sec_transactions_serial) - Daylight Saving Time (DST), [日历时钟](/ch9#time-of-day-clocks) - Db2(数据库) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307) - DBA (database administrator), [云时代的运维](/ch1#sec_introduction_operations) - 僵局, [显式锁定](/ch8#explicit-locking) - 检测, 分布式事务, [XA 事务的问题](/ch8#problems-with-xa-transactions) - in two-phase locking (2PL), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - Debezium(变化数据捕获), [数据变更捕获的实现](/ch12#id307) - 卡桑德拉岛, [变更流的 API 支持](/ch12#sec_stream_change_api) - 数据整合, [分拆系统与集成系统](/ch13#id448) - 声明语言, [数据模型与查询语言](/ch3#ch_datamodels), [术语表](/glossary) - 并同步引擎, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 数据日志, [Datalog:递归关系查询](/ch3#id62) - 文档数据库中, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - recursive SQL queries, [SQL 中的图查询](/ch3#id58) - SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language) - DeepSeek - 3FS(见 3FS) - 延迟 - 限制网络延迟, [同步与异步网络](/ch9#sec_distributed_sync_networks) - 边框进程暂停, [响应时间保证](/ch9#sec_distributed_clocks_realtime) - 无限制的网络延迟, [超时和无界延迟](/ch9#sec_distributed_queueing) - 未绑定的进程暂停, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 删除数据, [不变性的局限性](/ch12#sec_stream_immutability_limitations) - in LSM storage, [磁盘空间使用](/ch4#disk-space-usage) - 法律依据, [数据系统、法律与社会](/ch1#sec_introduction_compliance) - Delta Lake(表格式), [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 硬化和集群, [按哈希范围分片](/ch7#sharding-by-hash-range) - 非军事区(联网), [对外提供派生数据](/ch11#sec_batch_serving_derived) - 非正常化(数据表示), [规范化、反规范化与连接](/ch3#sec_datamodels_normalization)-[多对一与多对多关系](/ch3#sec_datamodels_many_to_many), [术语表](/glossary) - 在衍生数据系统中, [记录系统与派生数据](/ch1#sec_introduction_derived) - in event sourcing/CQRS, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 社会网络案例研究, [社交网络案例研究中的反规范化](/ch3#denormalization-in-the-social-networking-case-study) - 实际意见, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 更新衍生数据, [单对象与多对象操作](/ch8#sec_transactions_multi_object), [多对象事务的需求](/ch8#sec_transactions_need), [组合使用派生数据的工具](/ch13#id442) - 相对于正常化, [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 衍生数据, [记录系统与派生数据](/ch1#sec_introduction_derived), [流处理](/ch12#ch_stream), [术语表](/glossary) - 批处理, [批处理](/ch11#ch_batch) - 事件溯源与 CQRS, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 从变化数据抓取, [数据变更捕获的实现](/ch12#id307) - 通过日志维护导出状态, [数据库与流](/ch12#sec_stream_databases)-[变更流的 API 支持](/ch12#sec_stream_change_api), [状态、流和不变性](/ch12#sec_stream_immutability)-[并发控制](/ch12#sec_stream_concurrency) - 通过对流的订阅来观察, [端到端的事件流](/ch13#id349) - 批量和流处理的产出, [批处理与流处理](/ch13#sec_future_batch_streaming) - 通过应用程序代码, [应用代码作为派生函数](/ch13#sec_future_dataflow_derivation) - 相对于已分配事务, [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions) - 设计模式, [简单性:管理复杂度](/ch2#id38) - 决定性行动, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs), [故障与部分失效](/ch9#sec_distributed_partial_failure), [术语表](/glossary) - 专有权, [幂等性](/ch12#sec_stream_idempotence), [理解数据流](/ch13#id443) - 计算衍生数据, [维护派生状态](/ch13#id446), [数据流系统的正确性](/ch13#id453), [为可审计性而设计](/ch13#id365) - 如果来源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 状态机器复制, [使用共享日志](/ch10#sec_consistency_smr), [数据库与流](/ch12#sec_stream_databases) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) - 测试中, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 加入, [连接的时间依赖性](/ch12#sec_stream_join_time) - 使代码确定性, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 概览, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 确定性模拟测试(DST), [确定性模拟测试](/ch9#deterministic-simulation-testing) - DevOps, [云时代的运维](/ch1#sec_introduction_operations) - 维度表, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - dimensional modeling(见 star schemas) - directed acyclic graphs (DAG) - 工作流程, [工作流调度](/ch11#sec_batch_workflows) - (另见 workflow engines) - 脏读, [没有脏读](/ch8#no-dirty-reads) - 脏字(事务隔离), [没有脏写](/ch8#sec_transactions_dirty_write) - 分类 - 存储和计算, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - discord(分组聊天) - GraphQL example, [GraphQL](/ch3#id63) - 歧视, [偏见与歧视](/ch14#id370) - disks(见 hard disks) - 分布式行为者框架, [分布式 actor 框架](/ch5#distributed-actor-frameworks) - 分布式文件系统, [分布式文件系统](/ch11#sec_batch_dfs)-[分布式文件系统](/ch11#sec_batch_dfs) - 比较对象存储, [对象存储](/ch11#id277) - 由 Flink 使用, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 已分发分类账, [总结](/ch3#summary) - 分布式系统, [分布式系统的麻烦](/ch9#ch_distributed)-[总结](/ch9#summary), [术语表](/glossary) - 拜占庭断层, [拜占庭故障](/ch9#sec_distributed_byzantine)-[弱形式的谎言](/ch9#weak-forms-of-lying) - 检测网络断层, [检测故障](/ch9#id307) - 过失和部分失败, [故障与部分失效](/ch9#sec_distributed_partial_failure) - 协商一致的正式化, [单值共识](/ch10#single-value-consensus) - 无法取得的结果, [CAP 定理](/ch10#the-cap-theorem), [共识](/ch10#sec_consistency_consensus) - 出现故障的问题, [领导者故障:故障转移](/ch6#leader-failure-failover) - multi-region(见 regions (geographic distribution)) - 网络问题, [不可靠的网络](/ch9#sec_distributed_networks)-[我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 问题, [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems) - 法定人数,依赖, [多数派原则](/ch9#sec_distributed_majority) - 使用原因, [分布式与单节点系统](/ch1#sec_introduction_distributed), [复制](/ch6#ch_replication) - 同步时钟, 依赖, [对同步时钟的依赖](/ch9#sec_distributed_clocks_relying)-[用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 系统模型, [系统模型与现实](/ch9#sec_distributed_system_model)-[确定性模拟测试](/ch9#deterministic-simulation-testing) - 使用时钟和时间, [不可靠的时钟](/ch9#sec_distributed_clocks) - distributed transactions(见 transactions) - Django(网络框架), [处理错误和中止](/ch8#handling-errors-and-aborts) - DMZ (demilitarized zone), [对外提供派生数据](/ch11#sec_batch_serving_derived) - DNS (Domain Name System), [请求路由](/ch7#sec_sharding_routing), [服务发现](/ch10#service-discovery) - 用于负载平衡, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - Docker (集装箱管理器), [应用代码和状态的分离](/ch13#id344) - 文档数据模型, [关系模型与文档模型](/ch3#sec_datamodels_history)-[文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 比较关系模式, [何时使用哪种模型](/ch3#sec_datamodels_document_summary)-[文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 多对象事务, 需要, [多对象事务的需求](/ch8#sec_transactions_need) - 硬化二级指数, [分片与二级索引](/ch7#sec_sharding_secondary_indexes) - 相对关系模式 - 模式的趋同, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 数据位置, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - document-partitioned indexes(见 local secondary indexes) - 领域驱动设计, [简单性:管理复杂度](/ch2#id38), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 点版向量, [版本向量](/ch6#version-vectors) - 双重登录簿记, [总结](/ch3#summary) - DRBD (Distributed Replicated Block Device), [单主复制](/ch6#sec_replication_leader) - 漂移(小时), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - Druid(数据库), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [列式存储](/ch4#sec_storage_column), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 处理写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - 预汇总, [分析(Analytics)](/ch11#sec_batch_olap) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - Dryad(数据流引擎), [数据流引擎](/ch11#sec_batch_dataflow) - 双写、 问题, [保持系统同步](/ch12#sec_stream_sync) - DuckDB(数据库), [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems), [压实策略](/ch4#sec_storage_lsm_compaction) - 面向列的存储, [列式存储](/ch4#sec_storage_column) - 用于 ETL, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 减少重复,消除, [抑制重复](/ch13#id354) - (另见 幂等性) - using a unique ID, [操作标识符](/ch13#id355), [多分区请求处理](/ch13#id360) - 持久性, [使 B 树可靠](/ch4#sec_storage_btree_wal), [持久性](/ch8#durability), [术语表](/glossary) - 持久执行, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - Restate(见 Restate (workflow engine)) - Temporal(见 Temporal (workflow engine)) - durable functions(见 workflow engines) - 时间(时间), [不可靠的时钟](/ch9#sec_distributed_clocks) - 用单音钟测量, [单调时钟](/ch9#monotonic-clocks) - 动态输入语言 - 类比于阅读时的图案, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - Dynamo(数据库), [无主复制](/ch6#sec_replication_leaderless) - Dynamo-style databases(见 leaderless replication) - DynamoDB(数据库) - 自动缩放, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 散列变硬, [按哈希范围分片](/ch7#sharding-by-hash-range) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 硬化二级指数, [全局二级索引](/ch7#id167) ### E - EBS(虚拟块设备), [存储与计算的分离](/ch1#sec_introduction_storage_compute) - 比较对象存储, [设置新的副本](/ch6#sec_replication_new_replica) - ECC(见 error-correcting codes) - EDB Postgres Distributed(数据库), [跨地域运行](/ch6#sec_replication_multi_dc) - 边缘(图), [图数据模型](/ch3#sec_datamodels_graph) - 属性图模型, [属性图](/ch3#id56) - 编辑距离(全文搜索), [全文检索](/ch4#sec_storage_full_text) - 有效即时语义, [容错](/ch12#sec_stream_fault_tolerance), [恰好执行一次操作](/ch13#id353) - (另见 恰好一次语义) - 维护完整性, [数据流系统的正确性](/ch13#id453) - Elastic Compute Cloud (EC2) - 现场实例, [故障处理](/ch11#id281) - 弹性, [分布式与单节点系统](/ch1#sec_introduction_distributed) - 云数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses), [查询语言](/ch11#sec_batch_query_lanauges) - 弹性搜索(搜索服务器) - 本地二级指数, [本地二级索引](/ch7#id166) - 剖析器(流搜索), [在流上搜索](/ch12#id320) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - 硬调和, [固定数量的分片](/ch7#fixed-number-of-shards) - 使用 Lucene, [全文检索](/ch4#sec_storage_full_text) - 精灵(编程语言), [端到端的事件流](/ch13#id349) - ELT (extract-load-transform), [数据仓库](/ch1#sec_introduction_dwh) - 与批量处理的关系, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 严重平行(算法) - 提取-转换-加载(ETL)(见 ETL) - MapReduce, [MapReduce](/ch11#sec_batch_mapreduce) - (另见 MapReduce) - 嵌入式存储引擎, [压实策略](/ch4#sec_storage_lsm_compaction) - 嵌入(显示器), [向量嵌入](/ch4#id92) - 编码(数据格式), [编码与演化](/ch5#ch_encoding)-[模式的优点](/ch5#sec_encoding_schemas) - Avro, [Avro](/ch5#sec_encoding_avro)-[动态生成的模式](/ch5#dynamically-generated-schemas) - binary variants of JSON and XML, [二进制编码](/ch5#binary-encoding) - 兼容性, [编码与演化](/ch5#ch_encoding) - 电话服务, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 使用数据库, [流经数据库的数据流](/ch5#sec_encoding_dataflow_db)-[归档存储](/ch5#archival-storage) - 定义, [编码数据的格式](/ch5#sec_encoding_formats) - JSON, XML, and CSV, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - 语言特定格式, [特定语言的格式](/ch5#id96) - 计划的价值, [模式的优点](/ch5#sec_encoding_schemas) - Protocol Buffers, [Protocol Buffers](/ch5#sec_encoding_protobuf)-[字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 数据说明, [编码数据的格式](/ch5#sec_encoding_formats) - 端到端原则, [端到端原则](/ch13#sec_future_e2e_argument)-[在数据系统中应用端到端思考](/ch13#id357) - 检查完整性, [端到端原则重现](/ch13#id456) - 发布/订阅流, [端到端的事件流](/ch13#id349) - 浓缩(流), [流表连接(流扩充)](/ch12#sec_stream_table_joins) - Enterprise JavaBeans (EJB), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - 企业软件, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - entities(见 vertices) - 电子存储, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - 时代(协商一致算法), [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 时代(Unix 时间戳), [日历时钟](/ch9#time-of-day-clocks) - 清除编码(错误校正), [分布式文件系统](/ch11#sec_batch_dfs) - 错误处理 - 网络断层, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 事务中, [处理错误和中止](/ch8#handling-errors-and-aborts) - 错误更正代码, [硬件与软件故障](/ch2#sec_introduction_hardware_faults), [分布式文件系统](/ch11#sec_batch_dfs) - Esper (CEP engine), [复合事件处理](/ch12#id317) - 基本复杂性, [简单性:管理复杂度](/ch2#id38) - 协调事务, [协调服务](/ch10#sec_consistency_coordination)-[服务发现](/ch10#service-discovery) - 生成栅栏标志, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens), [协调服务](/ch10#sec_consistency_coordination) - 线性操作, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable), [共识的微妙之处](/ch10#subtleties-of-consensus) - 锁和领袖选举, [锁定与领导者选举](/ch10#locking-and-leader-election) - 用于服务发现, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery), [服务发现](/ch10#service-discovery) - 用于硬性转让, [请求路由](/ch7#sec_sharding_routing) - 使用 Raft 算法, [单主复制](/ch6#sec_replication_leader) - 伊特鲁姆(块链), [用于可审计数据系统的工具](/ch13#id366) - 以太网(网络), [云计算与超级计算](/ch1#id17), [不可靠的网络](/ch9#sec_distributed_networks), [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 包检查和, [弱形式的谎言](/ch9#weak-forms-of-lying), [端到端原则](/ch13#sec_future_e2e_argument) - 道德操守, [将事情做正确](/ch14)-[立法与自律](/ch14#sec_future_legislation) - 道德守则和专业实务, [将事情做正确](/ch14) - 立法和自律, [立法与自律](/ch14#sec_future_legislation) - 预测分析, [预测分析](/ch14#id369)-[反馈回路](/ch14#id372) - 扩大偏见, [偏见与歧视](/ch14#id370) - 反馈循环, [反馈回路](/ch14#id372) - 隐私和跟踪, [隐私与追踪](/ch14#id373)-[立法与自律](/ch14#sec_future_legislation) - 同意和选择自由, [同意与选择自由](/ch14#id375) - 数据作为资产和权力, [数据作为资产与权力](/ch14#id376) - 隐私的含义, [隐私与数据使用](/ch14#id457) - 监视, [监视](/ch14#id374) - 尊重、尊严和机构, [立法与自律](/ch14#sec_future_legislation) - 意外后果, [将事情做正确](/ch14), [反馈回路](/ch14#id372) - ETL, [数据仓库](/ch1#sec_introduction_dwh), [保持系统同步](/ch12#sec_stream_sync), [术语表](/glossary) - 与批量处理的关系, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage)-[提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 使用批量处理, [批处理](/ch11#ch_batch) - 欧几利得距离(语义搜索), [向量嵌入](/ch4#id92) - European Union - AI Act(见 AI Act) - GDPR(见 GDPR) - 事件溯源, [事件溯源与 CQRS](/ch3#sec_datamodels_events)-[事件溯源与 CQRS](/ch3#sec_datamodels_events) - 并更改数据捕获, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 与变化数据捕获的比较, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 不可更改性和可审计性, [状态、流和不变性](/ch12#sec_stream_immutability), [为可审计性而设计](/ch13#id365) - 大型可靠数据系统, [操作标识符](/ch13#id355), [数据流系统的正确性](/ch13#id453) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - event streams(见 streams) - 事件驱动的架构, [事件驱动的架构](/ch5#sec_encoding_dataflow_msg)-[分布式 actor 框架](/ch5#distributed-actor-frameworks) - 分布式行为者框架, [分布式 actor 框架](/ch5#distributed-actor-frameworks) - 事件, [传递事件流](/ch12#sec_stream_transmit) - 决定总顺序, [全序的限制](/ch13#id335) - 从事件日志中得出看法, [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 事件时间与处理时间, [事件时间与处理时间](/ch12#id322), [微批次与存档点](/ch12#id329), [统一批处理和流处理](/ch13#id338) - 不可改变的优点, [不可变事件的优点](/ch12#sec_stream_immutability_pros), [为可审计性而设计](/ch13#id365) - 命令捕获因果关系, [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 读作:, [读也是事件](/ch13#sec_future_read_events) - 疏远者, [处理滞留事件](/ch12#id323) - 溪流处理中的时间戳, [你用的是谁的时钟?](/ch12#id438) - EventSource (browser API), [将状态变更推送给客户端](/ch13#id348) - EventStoreDB(数据库), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 最终一致性, [复制](/ch6#ch_replication), [复制延迟的问题](/ch6#sec_replication_lag), [安全性与活性](/ch9#sec_distributed_safety_liveness) - (另见 conflicts) - 和长期不一致, [及时性与完整性](/ch13#sec_future_integrity) - 最终的一致性, [自动冲突解决](/ch6#automatic-conflict-resolution) - 证据 - 数据用作, [人类与可靠性](/ch2#id31) - 可演化性, [可演化性:让变化更容易](/ch2#sec_introduction_evolvability), [编码与演化](/ch5#ch_encoding) - 电话服务, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 事件溯源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 图表结构数据, [属性图](/ch3#id56) - 数据库, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility), [流经数据库的数据流](/ch5#sec_encoding_dataflow_db)-[归档存储](/ch5#archival-storage), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views), [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - 后处理数据, [应用演化后重新处理数据](/ch13#sec_future_reprocessing), [统一批处理和流处理](/ch13#id338) - Avro 的策略进化, [写入者模式与读取者模式](/ch5#the-writers-schema-and-the-readers-schema) - 协议缓冲的策略演变, [字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 阅读时的图谋, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility), [编码与演化](/ch5#ch_encoding), [模式的优点](/ch5#sec_encoding_schemas) - 恰好一次语义, [恰好一次消息处理](/ch8#sec_transactions_exactly_once), [再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited), [容错](/ch12#sec_stream_fault_tolerance), [恰好执行一次操作](/ch13#id353) - 与批量处理器对等, [统一批处理和流处理](/ch13#id338) - 维护完整性, [数据流系统的正确性](/ch13#id453) - 使用持久执行, [持久化执行](/ch5#durable-execution) - 独占模式, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 指数备份, [描述性能](/ch2#sec_introduction_percentiles), [处理错误和中止](/ch8#handling-errors-and-aborts) - ext4 (file system), [分布式文件系统](/ch11#sec_batch_dfs) - eXtended Architecture transactions(见 XA 事务) - ETL(见 提取-转换-加载(ETL)) ### F - 脸书 - 费斯(媒介指数), [向量嵌入](/ch4#id92) - 反应(用户界面库), [端到端的事件流](/ch13#id349) - 社会图表, [图数据模型](/ch3#sec_datamodels_graph) - 事实 - 事实表(星图), [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 在数据日志中, [Datalog:递归关系查询](/ch3#id62) - 如果来源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 慢故障, [系统模型与现实](/ch9#sec_distributed_system_model) - 失败停止模式, [系统模型与现实](/ch9#sec_distributed_system_model) - 故障切换, [领导者故障:故障转移](/ch6#leader-failure-failover), [术语表](/glossary) - (另见 基于领导者的复制) - 无领导复制,没有, [当节点故障时写入数据库](/ch6#id287) - 领袖选举, [分布式锁和租约](/ch9#sec_distributed_lock_fencing), [共识](/ch10#sec_consistency_consensus), [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 潜在问题, [领导者故障:故障转移](/ch6#leader-failure-failover) - 失败 - 通过经销事务扩充, [维护派生状态](/ch13#id446) - 检测失败, [检测故障](/ch9#id307) - 自动再平衡导致连锁故障, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 超时和无限制延误, [超时和无界延迟](/ch9#sec_distributed_queueing), [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 使用协调服务, [协调服务](/ch10#sec_consistency_coordination) - 错对错, [可靠性与容错](/ch2#sec_introduction_reliability) - 部分失败, [故障与部分失效](/ch9#sec_distributed_partial_failure), [总结](/ch9#summary) - 费斯(媒介指数), [向量嵌入](/ch4#id92) - 假阳性(Bloom 过滤器), [布隆过滤器](/ch4#bloom-filters) - 扇出, [时间线的物化与更新](/ch2#sec_introduction_materializing), [多个消费者](/ch12#id298) - 断层注射, [容错](/ch2#id27), [实践中的网络故障](/ch9#sec_distributed_network_faults), [故障注入](/ch9#sec_fault_injection) - 断层隔离, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 过失容忍, [可靠性与容错](/ch2#sec_introduction_reliability)-[人类与可靠性](/ch2#id31), [术语表](/glossary) - 协商一致的形式化, [单值共识](/ch10#single-value-consensus) - 容忍人为失误, [批处理](/ch11#ch_batch) - 分批处理, [故障处理](/ch11#id281) - 在基于日志的系统中, [在数据系统中应用端到端思考](/ch13#id357), [及时性与完整性](/ch13#sec_future_integrity)-[数据流系统的正确性](/ch13#id453) - 在溪流处理中, [容错](/ch12#sec_stream_fault_tolerance)-[失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 原子提交, [原子提交再现](/ch12#sec_stream_atomic_commit) - 幂等性, [幂等性](/ch12#sec_stream_idempotence) - 保持衍生状态, [维护派生状态](/ch13#id446) - 微打斗和检查站, [微批次与存档点](/ch12#id329) - 失败后重建状态, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 分布式事务, [XA 事务](/ch8#xa-transactions)-[再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - 基于领导和无领导者的复制, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 事务原子性, [原子性](/ch8#sec_transactions_acid_atomicity), [分布式事务](/ch8#sec_transactions_distributed)-[恰好一次消息处理](/ch8#sec_transactions_exactly_once) - 错误 - 拜占庭断层, [拜占庭故障](/ch9#sec_distributed_byzantine)-[弱形式的谎言](/ch9#weak-forms-of-lying) - 失败与, [可靠性与容错](/ch2#sec_introduction_reliability) - 事务处理, [事务](/ch8#ch_transactions) - 超级计算机和云计算处理, [云计算与超级计算](/ch1#id17) - 硬件, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 在分布式系统中, [故障与部分失效](/ch9#sec_distributed_partial_failure) - introducing deliberately(见 fault injection) - 网络断层, [实践中的网络故障](/ch9#sec_distributed_network_faults)-[检测故障](/ch9#id307) - 非对称断层, [多数派原则](/ch9#sec_distributed_majority) - 检测, [检测故障](/ch9#id307) - 容忍,多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 软件故障, [软件故障](/ch2#software-faults) - tolerating(见 fault tolerance) - 特性工程(机器学习), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 联邦数据库, [一切的元数据库](/ch13#id341) - Feldera(数据库) - 增量视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - 围栏, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 屏障, [领导者故障:故障转移](/ch6#leader-failure-failover), [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens)-[多副本隔离](/ch9#fencing-with-multiple-replicas) - 生成栅栏标志, [使用共享日志](/ch10#sec_consistency_smr), [协调服务](/ch10#sec_consistency_coordination) - 栅栏标志的属性, [定义算法的正确性](/ch9#defining-the-correctness-of-an-algorithm) - 流处理器写入数据库, [幂等性](/ch12#sec_stream_idempotence), [恰好执行一次操作](/ch13#id353) - 获取和添加 - 与协商一致的关系, [获取并增加作为共识](/ch10#fetch-and-add-as-consensus) - 纤维通道(网络), [分布式文件系统](/ch11#sec_batch_dfs) - 字段标记(协议缓冲), [Protocol Buffers](/ch5#sec_encoding_protobuf)-[字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - Figma (图形软件), [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - filesystem in userspace (FUSE), [设置新的副本](/ch6#sec_replication_new_replica), [分布式文件系统](/ch11#sec_batch_dfs) - 在对象存储中, [对象存储](/ch11#id277) - 财务数据 - 会计分类账, [总结](/ch3#summary) - 不可改变性, [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 时间序列数据, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 五特兰, [数据仓库](/ch1#sec_introduction_dwh) - FizzBee (specification language), [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 平面指数(媒介指数), [向量嵌入](/ch4#id92) - FlatBuffers(数据格式), [编码数据的格式](/ch5#sec_encoding_formats) - Flink(处理框架), [批处理](/ch11#ch_batch), [数据流引擎](/ch11#sec_batch_dataflow) - 成本效率, [查询语言](/ch11#sec_batch_query_lanauges) - DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes), [DataFrames](/ch11#id287) - 过失容忍, [故障处理](/ch11#id281), [微批次与存档点](/ch12#id329), [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - FlinkML, [机器学习](/ch11#id290) - 数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses) - high availability using ZooKeeper, [协调服务](/ch10#sec_consistency_coordination) - 集成批量和流处理, [统一批处理和流处理](/ch13#id338) - 查询优化器, [查询语言](/ch11#sec_batch_query_lanauges) - 移动数据, [混洗数据](/ch11#sec_shuffle) - 流处理, [流分析](/ch12#id318) - streaming SQL support, [复合事件处理](/ch12#id317) - 流量控制, [TCP 的局限性](/ch9#sec_distributed_tcp), [消息传递系统](/ch12#sec_stream_messaging), [术语表](/glossary) - FLP result (on consensus), [共识](/ch10#sec_consistency_consensus) - Flyte(工作流调度器), [机器学习](/ch11#id290) - 追随者, [单主复制](/ch6#sec_replication_leader), [术语表](/glossary) - (另见 基于领导者的复制) - 正式方法, [形式化方法和随机测试](/ch9#sec_distributed_formal)-[确定性模拟测试](/ch9#deterministic-simulation-testing) - 转发兼容性, [编码与演化](/ch5#ch_encoding) - 前进衰变(算法), [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 化石(版本控制系统), [并发控制](/ch12#sec_stream_concurrency) - 避免, [不变性的局限性](/ch12#sec_stream_immutability_limitations) - FoundationDB(数据库) - 一致性模式, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 确定性模拟测试, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 键程硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 进程/核心模式, [分片的利与弊](/ch7#sec_sharding_reasons) - 可序列事务, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi), [可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 事务, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - 分数索引, [何时使用哪种模型](/ch3#sec_datamodels_document_summary) - 碎裂(B树), [磁盘空间使用](/ch4#disk-space-usage) - 框架(计算机图形), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 前端 (网页开发), [数据系统架构中的权衡](/ch1#ch_tradeoffs) - FrostDB(数据库) - 确定性模拟测试(DST), [确定性模拟测试](/ch9#deterministic-simulation-testing) - fsync (系统调用), [使 B 树可靠](/ch4#sec_storage_btree_wal), [持久性](/ch8#durability) - 全文检索, [全文检索](/ch4#sec_storage_full_text), [术语表](/glossary) - 和模糊的指数, [全文检索](/ch4#sec_storage_full_text) - Lucene 存储引擎, [全文检索](/ch4#sec_storage_full_text) - 硬化指数, [分片与二级索引](/ch7#sec_sharding_secondary_indexes) - Function as a Service (FaaS), [微服务与无服务器](/ch1#sec_introduction_microservices) - 职能方案拟订 - inspiration for MapReduce, [MapReduce](/ch11#sec_batch_mapreduce) - 职能要求, [定义非功能性需求](/ch2#ch_nonfunctional) - FUSE(见 filesystem in userspace (FUSE)) - 模糊, [形式化方法和随机测试](/ch9#sec_distributed_formal) - fuzzy search(见 similarity search) ### G - Gallina(特写语言), [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 游戏开发, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 垃圾收集 - 不可改变性和, [不变性的局限性](/ch12#sec_stream_immutability_limitations) - 进程暂停, [延迟与响应时间](/ch2#id23), [进程暂停](/ch9#sec_distributed_clocks_pauses)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact), [多数派原则](/ch9#sec_distributed_majority) - (另见 process pauses) - 加油站算法定价, [反馈回路](/ch14#id372) - GDPR (regulation), [数据系统、法律与社会](/ch1#sec_introduction_compliance), [不变性的局限性](/ch12#sec_stream_immutability_limitations) - 同意书, [同意与选择自由](/ch14#id375) - 数据最小化, [立法与自律](/ch14#sec_future_legislation) - 合法权益, [同意与选择自由](/ch14#id375) - 使用权, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 清除的权利, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [磁盘空间使用](/ch4#disk-space-usage), [面向多租户的分片](/ch7#sec_sharding_multitenancy) - GenBank (genome database), [总结](/ch3#summary) - General Data Protection Regulation(见 GDPR (regulation)) - 基因组分析, [总结](/ch3#summary) - geographic distribution(见 regions (geographic distribution)) - 地理空间指数, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - Git(版本控制系统), [并发控制](/ch12#sec_stream_concurrency) - 本地第一软件, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 合并冲突, [手动冲突解决](/ch6#manual-conflict-resolution) - GitHub, postmortems, [领导者故障:故障转移](/ch6#leader-failure-failover), [领导者故障:故障转移](/ch6#leader-failure-failover), [将系统模型映射到现实世界](/ch9#mapping-system-models-to-the-real-world) - 全球二级指数, [全局二级索引](/ch7#id167), [总结](/ch7#summary) - globally unique identifiers(见 UUIDs) - GlusterFS(分布式文件系统), [批处理](/ch11#ch_batch), [分布式文件系统](/ch11#sec_batch_dfs), [对象存储](/ch11#id277) - GNU Coreutils (Linux), [排序与内存聚合](/ch11#id275) - Go(编程语言) - 垃圾收集, [限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - GoldenGate (change data capture), [数据变更捕获的实现](/ch12#id307) - (另见 Oracle) - 谷歌 - BigQuery(见 BigQuery(数据库)) - Bigtable(见 Bigtable(数据库)) - Chubby(锁服务), [协调服务](/ch10#sec_consistency_coordination) - Cloud Storage(对象存储), [设置新的副本](/ch6#sec_replication_new_replica), [对象存储](/ch11#id277) - 请求先决条件, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - Compute Engine - 预设实例, [故障处理](/ch11#id281) - 数据流(流程处理) - 数据仓集成, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 移动数据, [混洗数据](/ch11#sec_shuffle) - 数据流(流处理器), [流分析](/ch12#id318), [原子提交再现](/ch12#sec_stream_atomic_commit), [统一批处理和流处理](/ch13#id338) - (另见 Beam) - 数据流(变化数据捕获), [变更流的 API 支持](/ch12#sec_stream_change_api) - Docs(协作编辑), [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps), [CRDT 与操作变换](/ch6#sec_replication_crdts) - 操作转换, [CRDT 与操作变换](/ch6#sec_replication_crdts) - Dremel(查询引擎), [列式存储](/ch4#sec_storage_column) - Firestore(数据库), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - MapReduce (batch processing), [批处理](/ch11#ch_batch) - (另见 MapReduce) - Percolator(事务系统), [实现线性一致的 ID 生成器](/ch10#implementing-a-linearizable-id-generator) - 持久性磁盘(云服务), [存储与计算的分离](/ch1#sec_introduction_storage_compute) - Pub/Sub(消息系统), [消息代理](/ch5#message-brokers), [消息代理与数据库的对比](/ch12#id297), [使用日志进行消息存储](/ch12#id300) - 响应时间研究, [平均值、中位数与百分位点](/ch2#id24) - 工作表(协作电子表格), [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps), [CRDT 与操作变换](/ch6#sec_replication_crdts) - Spanner(见 Spanner(数据库)) - TrueTime (clock API), [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval) - 流言协议, [请求路由](/ch7#sec_sharding_routing) - 治理, [超越数据湖](/ch1#beyond-the-data-lake) - 政府对数据的使用, [数据作为资产与权力](/ch14#id376) - GPS (Global Positioning System) - 用于时钟同步, [不可靠的时钟](/ch9#sec_distributed_clocks), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy), [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - GPT (language model), [向量嵌入](/ch4#id92) - GPU (graphics processing unit), [云服务的分层](/ch1#layering-of-cloud-services), [分布式与单节点系统](/ch1#sec_introduction_distributed) - gradual rollout(见 rolling upgrades) - GraphQL(查询语言), [GraphQL](/ch3#id63) - 验证, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 图表, [术语表](/glossary) - 作为数据模型, [图数据模型](/ch3#sec_datamodels_graph)-[GraphQL](/ch3#id63) - 属性图, [属性图](/ch3#id56) - RDF and triple-stores, [三元组存储与 SPARQL](/ch3#id59)-[SPARQL 查询语言](/ch3#the-sparql-query-language) - DAGs(见 directed acyclic graphs) - 处理和分析, [机器学习](/ch11#id290) - 查询语言 - 密码, [Cypher 查询语言](/ch3#id57) - 数据日志, [Datalog:递归关系查询](/ch3#id62)-[Datalog:递归关系查询](/ch3#id62) - GraphQL, [GraphQL](/ch3#id63) - 格伦林, [图数据模型](/ch3#sec_datamodels_graph) - recursive SQL queries, [SQL 中的图查询](/ch3#id58) - SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language)-[SPARQL 查询语言](/ch3#the-sparql-query-language) - 转弯, [属性图](/ch3#id56) - 灰色失败, [系统模型与现实](/ch9#sec_distributed_system_model) - 无领导复制, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 格勒姆林(图形查询语言), [图数据模型](/ch3#sec_datamodels_graph) - grep (Unix 工具) (英语)., [简单日志分析](/ch11#sec_batch_log_analysis) - gRPC (service calls), [微服务与无服务器](/ch1#sec_introduction_microservices), [Web 服务](/ch5#sec_web_services) - 前向和后向兼容性, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - GUIDs(见 UUIDs) ### H - Hadoop(数据基础设施) - 比较分布式数据库, [批处理](/ch11#ch_batch) - MapReduce(见 MapReduce) - NodeManager, [分布式作业编排](/ch11#id278) - YARN(见 YARN (job scheduler)) - HANA(见 SAP HANA(数据库)) - 发生关系前, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 硬盘 - 访问模式, [顺序与随机写入](/ch4#sidebar_sequential) - 侦查腐败, [端到端原则](/ch13#sec_future_e2e_argument), [不要盲目信任承诺](/ch13#id364) - 错误在, [硬件与软件故障](/ch2#sec_introduction_hardware_faults), [持久性](/ch8#durability) - 顺序对随机写入, [顺序与随机写入](/ch4#sidebar_sequential) - 连续写入吞吐量, [磁盘空间使用](/ch12#sec_stream_disk_usage) - 硬件故障, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 散列函数 - 在 Bloom 过滤器中, [布隆过滤器](/ch4#bloom-filters) - 加入散列 - 在溪流处理中, [流表连接(流扩充)](/ch12#sec_stream_table_joins) - 散列变硬, [按键的哈希分片](/ch7#sec_sharding_hash)-[一致性哈希](/ch7#sec_sharding_consistent_hashing), [总结](/ch7#summary) - 连续的散列, [一致性哈希](/ch7#sec_sharding_consistent_hashing) - Hash mod N的问题, [哈希取模节点数](/ch7#hash-modulo-number-of-nodes) - 区域查询, [按哈希范围分片](/ch7#sharding-by-hash-range) - 合适的散列函数, [按键的哈希分片](/ch7#sec_sharding_hash) - 有固定的硬块数, [固定数量的分片](/ch7#fixed-number-of-shards) - 散列表格, [日志结构存储](/ch4#sec_storage_log_structured) - Hazelcast(模拟数据网) - FencedLock, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - Flake ID Generator, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - HBase(数据库) - 由于缺乏围栏而出现错误, [分布式锁和租约](/ch9#sec_distributed_lock_fencing) - 键程硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 日志结构存储, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 区域(硬化), [分片](/ch7#ch_sharding) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 大小级紧凑, [压实策略](/ch4#sec_storage_lsm_compaction) - 宽柱数据模型, [读写的数据局部性](/ch3#sec_datamodels_document_locality), [列压缩](/ch4#sec_storage_column_compression) - HDFS (Hadoop Distributed File System), [批处理](/ch11#ch_batch), [分布式文件系统](/ch11#sec_batch_dfs) - (另见 distributed filesystems) - 检查数据完整性, [不要盲目信任承诺](/ch13#id364) - DataNode, [分布式文件系统](/ch11#sec_batch_dfs) - NameNode, [分布式文件系统](/ch11#sec_batch_dfs) - use in MapReduce, [MapReduce](/ch11#sec_batch_mapreduce) - 工作流程示例, [工作流调度](/ch11#sec_batch_workflows) - HdrHistogram (numerical library), [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 头 (Unix 工具), [简单日志分析](/ch11#sec_batch_log_analysis), [分布式作业编排](/ch11#id278) - 头顶(财产图), [属性图](/ch3#id56) - 头部阻塞, [延迟与响应时间](/ch2#id23) - 堆积文件(数据库), [在索引中存储值](/ch4#sec_storage_index_heap) - 多转换并发控制, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl) - 热量管理, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 被套期请求, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 分散事务, [跨不同系统的分布式事务](/ch8#sec_transactions_xa), [XA 事务的问题](/ch8#problems-with-xa-transactions) - 启发式决策, [从协调器故障中恢复](/ch8#recovering-from-coordinator-failure) - 十六进制(注解本), [机器学习](/ch11#id290) - 六边形 - 地理空间索引, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - Hibernate(对象关系映射器), [对象关系映射(ORM)](/ch3#object-relational-mapping-orm) - 层次模型, [关系模型与文档模型](/ch3#sec_datamodels_history) - 可导航的小世界(媒介指数), [向量嵌入](/ch4#id92) - hierarchical queries(见 recursive common table expressions) - high availability(见 fault tolerance) - 高频事务, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - high-performance computing (HPC), [云计算与超级计算](/ch1#id17) - 提示移交, [追赶错过的写入](/ch6#sec_replication_read_repair) - 直方图, [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 蜂窝(数据仓), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 查询优化器, [查询语言](/ch11#sec_batch_query_lanauges) - HNSW (vector index), [向量嵌入](/ch4#id92) - 购物窗口(流程处理), [窗口的类型](/ch12#id324) - (另见 windows) - Hoptimator(查询引擎), [一切的元数据库](/ch13#id341) - 地平线丑闻, [人类与可靠性](/ch2#id31) - 缺乏事务, [事务](/ch8#ch_transactions) - horizontal scaling(见 scaling out) - 通过磨损, [分片的利与弊](/ch7#sec_sharding_reasons) - HornetQ(消息系统), [消息代理](/ch5#message-brokers), [消息代理与数据库的对比](/ch12#id297) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 热键, [键值数据的分片](/ch7#sec_sharding_key_value) - 热点, [键值数据的分片](/ch7#sec_sharding_key_value) - 由于名人, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 时间序列数据, [按键的范围分片](/ch7#sec_sharding_key_range) - 解除武装, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - hot standbys(见 基于领导者的复制) - HTAP(见 hybrid transactional/analytic processing) - HTTP, use in APIs(见 services) - 人类错误, [人类与可靠性](/ch2#id31), [实践中的网络故障](/ch9#sec_distributed_network_faults), [批处理](/ch11#ch_batch) - 混合逻辑时钟, [混合逻辑时钟](/ch10#hybrid-logical-clocks) - 混合事务/分析处理, [数据仓库](/ch1#sec_introduction_dwh), [分析型数据存储](/ch4#sec_storage_analytics) - hydrating IDs (join), [社交网络案例研究中的反规范化](/ch3#denormalization-in-the-social-networking-case-study) - 高频图, [属性图](/ch3#id56) - HyperLogLog (algorithm), [流分析](/ch12#id318) ### I - I/O operations, waiting for, [进程暂停](/ch9#sec_distributed_clocks_pauses) - IaaS(见 infrastructure as a service (IaaS)) - IBM - Db2(数据库) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 可序列隔离, [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - MQ(消息系统), [消息代理与数据库的对比](/ch12#id297) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - System R(数据库), [事务到底是什么?](/ch8#sec_transactions_overview) - WebSphere(消息系统), [消息代理](/ch5#message-brokers) - Iceberg(表格式), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 对象存储的数据库, [设置新的副本](/ch6#sec_replication_new_replica) - 基于日志的信息代理存储, [磁盘空间使用](/ch12#sec_stream_disk_usage) - 幂等性, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc), [幂等性](/ch12#sec_stream_idempotence), [术语表](/glossary) - by giving operations unique IDs, [多分区请求处理](/ch13#id360) - by giving requests unique IDs, [操作标识符](/ch13#id355) - 对于完全的语义, [再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - 一元业务, [恰好执行一次操作](/ch13#id353) - 工作流程引擎中, [持久化执行](/ch5#durable-execution) - 不可改变性 - 好处, [不可变事件的优点](/ch12#sec_stream_immutability_pros), [为可审计性而设计](/ch13#id365) - 和清除的权利, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [磁盘空间使用](/ch4#disk-space-usage) - 删除加密, [事件溯源与 CQRS](/ch3#sec_datamodels_events), [不变性的局限性](/ch12#sec_stream_immutability_limitations) - 从事件日志中获取状态, [状态、流和不变性](/ch12#sec_stream_immutability)-[不变性的局限性](/ch12#sec_stream_immutability_limitations) - 事故恢复, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 在B树上, [B 树变体](/ch4#b-tree-variants), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 如果来源, [事件溯源与 CQRS](/ch3#sec_datamodels_events), [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 限制, [并发控制](/ch12#sec_stream_concurrency) - 阻抗不匹配, [对象关系不匹配](/ch3#sec_datamodels_document) - 存疑, [协调器故障](/ch8#coordinator-failure) - 锁定, [存疑时持有锁](/ch8#holding-locks-while-in-doubt) - 孤儿事务, [从协调器故障中恢复](/ch8#recovering-from-coordinator-failure) - 模拟数据库, [全内存存储](/ch4#sec_storage_inmemory) - 持久性, [持久性](/ch8#durability) - 序列事务执行, [实际串行执行](/ch8#sec_transactions_serial) - 事件 - 导致错误定罪的会计软件错误, [人类与可靠性](/ch2#id31) - 无咎死后, [人类与可靠性](/ch2#id31) - 跳跃秒坠机, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 数据腐败和货币错误造成的经济损失, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 硬盘上的数据腐败, [持久性](/ch8#durability) - 数据损失,因最后写成, [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 磁盘上无法读取的数据, [将系统模型映射到现实世界](/ch9#mapping-system-models-to-the-real-world) - 由于重用主钥匙而披露敏感数据, [领导者故障:故障转移](/ch6#leader-failure-failover) - 事务序列性中的错误, [维护完整性,尽管软件有Bug](/ch13#id455) - gigabit network interface with 1 Kb/s throughput, [系统模型与现实](/ch9#sec_distributed_system_model) - 跳跃第二次崩溃, [软件故障](/ch2#software-faults) - 网络断层, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 网络接口只放下入境包, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 网络分区和全数据中心故障, [故障与部分失效](/ch9#sec_distributed_partial_failure) - 网络故障处理不当, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 向前合伙人发送消息, [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 咬海底电缆的鲨鱼, [实践中的网络故障](/ch9#sec_distributed_network_faults) - split brain due to 1-minute packet delay, [领导者故障:故障转移](/ch6#leader-failure-failover), [实践中的网络故障](/ch9#sec_distributed_network_faults) - SSD failure after 32,768 hours, [软件故障](/ch2#software-faults) - 线程争吵导致服务下降, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 服务器架中的振动, [延迟与响应时间](/ch2#id23) - 违反独特性限制, [维护完整性,尽管软件有Bug](/ch13#id455) - incremental view maintenance (IVM), [维护物化视图](/ch12#sec_stream_mat_view) - 数据整合, [分拆系统与集成系统](/ch13#id448) - 索引, [OLTP 系统的存储与索引](/ch4#sec_storage_oltp), [术语表](/glossary) - 并快照隔离, [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 作为衍生数据, [记录系统与派生数据](/ch1#sec_introduction_derived), [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - B树, [B 树](/ch4#sec_storage_b_trees)-[B 树变体](/ch4#b-tree-variants) - 分组, [在索引中存储值](/ch4#sec_storage_index_heap) - comparison of B-trees and LSM-trees, [比较 B 树与 LSM 树](/ch4#sec_storage_btree_lsm_comparison)-[磁盘空间使用](/ch4#disk-space-usage) - 覆盖(包括各栏), [在索引中存储值](/ch4#sec_storage_index_heap) - 创建, [创建索引](/ch13#id340) - 全文检索, [全文检索](/ch4#sec_storage_full_text) - 地理空间, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 索引范围锁定, [索引范围锁](/ch8#sec_transactions_2pl_range) - 多列(压缩), [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 中学, [多列索引与二级索引](/ch4#sec_storage_index_multicolumn) - (另见 secondary indexes) - 双写问题, [保持系统同步](/ch12#sec_stream_sync), [理解数据流](/ch13#id443) - 硬化指数和二级指数, [分片与二级索引](/ch7#sec_sharding_secondary_indexes)-[全局二级索引](/ch7#id167), [总结](/ch7#summary) - 人烟稀少, [SSTable 文件格式](/ch4#the-sstable-file-format) - SSTable 与 LSM 树, [SSTable 文件格式](/ch4#the-sstable-file-format)-[压实策略](/ch4#sec_storage_lsm_compaction) - 数据变化时更新, [保持系统同步](/ch12#sec_stream_sync), [维护物化视图](/ch12#sec_stream_mat_view) - Industrial Revolution, [回顾工业革命](/ch14#id377) - InfiniBand (networks), [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - InfluxDB IOx (storage engine), [列式存储](/ch4#sec_storage_column) - information retrieval(见 全文检索) - infrastructure as a service (IaaS), [云服务与自托管](/ch1#sec_introduction_cloud), [云服务的分层](/ch1#layering-of-cloud-services) - InnoDB (storage engine) - 主密钥的分组索引, [在索引中存储值](/ch4#sec_storage_index_heap) - 不防止丢失的更新, [自动检测丢失的更新](/ch8#automatically-detecting-lost-updates) - 防止写入skew, [写偏差的特征](/ch8#characterizing-write-skew), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 可序列隔离, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 实例(云计算), [云服务的分层](/ch1#layering-of-cloud-services) - integrating different data systems(见 数据集成) - 诚信, [及时性与完整性](/ch13#sec_future_integrity) - 协调-避免数据系统, [无协调数据系统](/ch13#id454) - 数据流系统的正确性, [数据流系统的正确性](/ch13#id453) - 协商一致形式化, [单值共识](/ch10#single-value-consensus), [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - 完整性检查, [不要盲目信任承诺](/ch13#id364) - (另见 审计) - 端到端, [端到端原则](/ch13#sec_future_e2e_argument), [端到端原则重现](/ch13#id456) - 使用快照隔离, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 尽管软件错误仍然维护, [维护完整性,尽管软件有Bug](/ch13#id455) - Interface Definition Language (IDL), [Protocol Buffers](/ch5#sec_encoding_protobuf), [Avro](/ch5#sec_encoding_avro), [Web 服务](/ch5#sec_web_services) - 不变式, [一致性](/ch8#sec_transactions_acid_consistency) - (另见 constraints) - 反向文件索引(向量索引), [向量嵌入](/ch4#id92) - 倒转索引, [全文检索](/ch4#sec_storage_full_text) - 不可逆转,尽量减少, [可演化性:让变化更容易](/ch2#sec_introduction_evolvability), [事件溯源与 CQRS](/ch3#sec_datamodels_events), [批处理](/ch11#ch_batch) - ISDN (Integrated Services Digital Network), [同步与异步网络](/ch9#sec_distributed_sync_networks) - 隔离性 - cgroups(见 cgroups) - 隔离性, [隔离性](/ch8#sec_transactions_acid_isolation), [单对象与多对象操作](/ch8#sec_transactions_multi_object), [术语表](/glossary) - 正确性和, [追求正确性](/ch13#sec_future_correctness) - 用于单对象写入, [单对象写入](/ch8#sec_transactions_single_object) - 可串行化, [可串行化](/ch8#sec_transactions_serializability)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 实际执行, [实际串行执行](/ch8#sec_transactions_serial)-[串行执行总结](/ch8#summary-of-serial-execution) - 可串行化快照隔离, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 两阶段锁定, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl)-[索引范围锁](/ch8#sec_transactions_2pl_range) - 违反, [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 薄弱的隔离水平, [弱隔离级别](/ch8#sec_transactions_isolation_levels)-[物化冲突](/ch8#materializing-conflicts) - 防止丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update)-[冲突解决与复制](/ch8#conflict-resolution-and-replication) - 读已提交, [读已提交](/ch8#sec_transactions_read_committed)-[实现读已提交](/ch8#sec_transactions_read_committed_impl) - 快照隔离, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation)-[快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - IVF (vector index), [向量嵌入](/ch4#id92) ### J - 数据库连接 - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 网络驱动程序, [模式的优点](/ch5#sec_encoding_schemas) - Java Enterprise Edition (EE), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc), [两阶段提交(2PC)](/ch8#sec_transactions_2pc), [XA 事务](/ch8#xa-transactions) - Java Message Service (JMS), [消息代理与数据库的对比](/ch12#id297) - (另见 messaging systems) - 比较基于日志的邮件, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [重播旧消息](/ch12#sec_stream_replay) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 消息顺序, [确认与重新传递](/ch12#sec_stream_reordering) - Java Transaction API (JTA), [两阶段提交(2PC)](/ch8#sec_transactions_2pc), [XA 事务](/ch8#xa-transactions) - Java Virtual Machine (JVM) - 垃圾收集, [进程暂停](/ch9#sec_distributed_clocks_pauses), [限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - JIT compilation, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 批次处理器中的工艺再利用, [数据流引擎](/ch11#sec_batch_dataflow) - Jena (RDF framework), [RDF 数据模型](/ch3#the-rdf-data-model) - SPARQL 查询语言, [SPARQL 查询语言](/ch3#the-sparql-query-language) - Jepsen(过失容忍度测试), [故障注入](/ch9#sec_fault_injection), [追求正确性](/ch13#sec_future_correctness) - jitter (网络延迟), [平均值、中位数与百分位点](/ch2#id24), [网络拥塞和排队](/ch9#network-congestion-and-queueing) - JMESPath(查询语言), [查询语言](/ch11#sec_batch_query_lanauges) - 合并表格, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many), [属性图](/ch3#id56) - 加入, [术语表](/glossary) - 作为关系运算符表示, [查询语言](/ch11#sec_batch_query_lanauges) - handling GraphQL query, [GraphQL](/ch3#id63) - 应用程序代码, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization), [社交网络案例研究中的反规范化](/ch3#denormalization-in-the-social-networking-case-study) - in DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 关系数据库和文档数据库, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization) - 二级指数和, [多列索引与二级索引](/ch4#sec_storage_index_multicolumn) - 排序合并, [JOIN 与 GROUP BY](/ch11#sec_batch_join) - 串流连接, [流连接](/ch12#sec_stream_joins)-[连接的时间依赖性](/ch12#sec_stream_join_time) - 串流流连接, [流流连接(窗口连接)](/ch12#id440) - 串行表连接, [流表连接(流扩充)](/ch12#sec_stream_table_joins) - 表格连接, [表表连接(维护物化视图)](/ch12#id326) - 时间的依赖性, [连接的时间依赖性](/ch12#sec_stream_join_time) - 文档数据库中的支持, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - JOTM (transaction coordinator), [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - 日记(文件系统), [使 B 树可靠](/ch4#sec_storage_btree_wal) - JSON - 管道汇总(用克里语), [文档的查询语言](/ch3#query-languages-for-documents) - Avro 方案说明, [Avro](/ch5#sec_encoding_avro) - 二进制变体, [二进制编码](/ch5#binary-encoding) - 数据位置, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 文档数据模型, [关系模型与文档模型](/ch3#sec_datamodels_history) - 应用数据的问题, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - GraphQL response, [GraphQL](/ch3#id63) - 关系数据库, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - 代表简历(例), [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - 模式, [JSON 模式](/ch5#json-schema) - JSON-LD, [三元组存储与 SPARQL](/ch3#id59) - JsonPath(查询语言), [查询语言](/ch11#sec_batch_query_lanauges) - JuiceFS(分布式文件系统), [分布式文件系统](/ch11#sec_batch_dfs), [对象存储](/ch11#id277) - 朱皮特(注解本), [机器学习](/ch11#id290) - just-in-time (JIT) compilation, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) ### K - Kafka(消息系统), [消息代理](/ch5#message-brokers), [使用日志进行消息存储](/ch12#id300) - 消费者群体, [多个消费者](/ch12#id298) - 数据整合, [分拆系统与集成系统](/ch13#id448) - 用于事件源代码, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - Kafka 连接(数据库整合), [数据变更捕获的实现](/ch12#id307), [变更流的 API 支持](/ch12#sec_stream_change_api), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 卡夫卡流(流处理器), [流分析](/ch12#id318), [维护物化视图](/ch12#sec_stream_mat_view) - 恰好一次语义, [再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - 过失容忍, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - ksqlDB (stream database), [维护物化视图](/ch12#sec_stream_mat_view) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 日志压缩, [日志压缩](/ch12#sec_stream_log_compaction), [维护物化视图](/ch12#sec_stream_mat_view) - 页:1, [使用日志进行消息存储](/ch12#id300), [幂等性](/ch12#sec_stream_idempotence) - 分区, [分片](/ch7#ch_sharding) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 计划登记, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - 分层存储, [磁盘空间使用](/ch12#sec_stream_disk_usage) - 事务, [数据库内部的分布式事务](/ch8#sec_transactions_internal), [原子提交再现](/ch12#sec_stream_atomic_commit) - 不洁领袖选举, [共识的微妙之处](/ch10#subtleties-of-consensus) - 使用模型检查, [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - kappa 架构, [统一批处理和流处理](/ch13#id338) - 关键价值储存, [OLTP 系统的存储与索引](/ch4#sec_storage_oltp) - 比较对象存储, [对象存储](/ch11#id277) - 记忆, [全内存存储](/ch4#sec_storage_inmemory) - LSM storage, [日志结构存储](/ch4#sec_storage_log_structured)-[磁盘空间使用](/ch4#disk-space-usage) - 分片, [键值数据的分片](/ch7#sec_sharding_key_value)-[偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 键的散列, [按键的哈希分片](/ch7#sec_sharding_hash), [总结](/ch7#summary) - 按密钥范围, [按键的范围分片](/ch7#sec_sharding_key_range), [总结](/ch7#summary) - 摇摆和热点, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - Kinesis(消息系统), [消息代理](/ch5#message-brokers), [使用日志进行消息存储](/ch12#id300) - 数据仓集成, [云数据仓库](/ch4#sec_cloud_data_warehouses) - Kryo (Java), [特定语言的格式](/ch5#id96) - ksqlDB (stream database), [维护物化视图](/ch12#sec_stream_mat_view) - Kubernetes(集群经理), [云服务与自托管](/ch1#sec_introduction_cloud), [微服务与无服务器](/ch1#sec_introduction_microservices), [分布式作业编排](/ch11#id278), [应用代码和状态的分离](/ch13#id344) - 库贝流, [机器学习](/ch11#id290) - 立方体, [分布式作业编排](/ch11#id278) - 算子, [分布式作业编排](/ch11#id278) - 使用等数据d, [请求路由](/ch7#sec_sharding_routing), [协调服务](/ch10#sec_consistency_coordination) - KùzuDB (database), [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems), [图数据模型](/ch3#sec_datamodels_graph) - 作为嵌入式存储引擎, [压实策略](/ch4#sec_storage_lsm_compaction) - Cypher 查询语言, [Cypher 查询语言](/ch3#id57) ### L - labeled property graphs(见 property graphs) - 羊肉达建筑, [统一批处理和流处理](/ch13#id338) - Lamport 时间戳, [Lamport 时间戳](/ch10#lamport-timestamps) - Lance(数据格式), [云数据仓库](/ch4#sec_cloud_data_warehouses), [列式存储](/ch4#sec_storage_column) - (另见 column-oriented storage) - large language models (LLMs) - 预处理培训数据, [机器学习](/ch11#id290) - 最后写入胜利, [最后写入胜利(丢弃并发写入)](/ch6#sec_replication_lww), [检测并发写入](/ch6#sec_replication_concurrent), [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 问题, [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 容易丢失更新, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 延迟, [延迟与响应时间](/ch2#id23) - (另见 响应时间) - 跨区域, [分布式与单节点系统](/ch1#sec_introduction_distributed) - 在两阶段锁定下的不稳定, [两阶段锁定的性能](/ch8#performance-of-two-phase-locking) - 网络延迟和资源利用, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 根据请求减少套期保值, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 响应时间对比, [延迟与响应时间](/ch2#id23) - 尾延迟, [平均值、中位数与百分位点](/ch2#id24), [响应时间指标的应用](/ch2#sec_introduction_slo_sla), [本地二级索引](/ch7#id166) - law(见 legal matters) - (云服务), [云服务的分层](/ch1#layering-of-cloud-services) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader)-[逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - (另见 复制) - 故障切换, [领导者故障:故障转移](/ch6#leader-failure-failover), [分布式锁和租约](/ch9#sec_distributed_lock_fencing) - 处理节点断电, [处理节点故障](/ch6#sec_replication_failover) - 实施复制日志 - 数据变更捕获, [数据变更捕获](/ch12#sec_stream_cdc)-[变更流的 API 支持](/ch12#sec_stream_change_api) - (另见 changelogs) - 基于语句的, [基于语句的复制](/ch6#statement-based-replication) - 预写日志(WAL)传输, [预写日志(WAL)传输](/ch6#write-ahead-log-wal-shipping) - 操作的可线性, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 锁定和领导者选举, [锁定与领导者选举](/ch10#locking-and-leader-election) - 日志序列号, [设置新的副本](/ch6#sec_replication_new_replica), [消费者偏移量](/ch12#sec_stream_log_offsets) - 读缩放架构, [复制延迟的问题](/ch6#sec_replication_lag), [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 与协商一致的关系, [共识](/ch10#sec_consistency_consensus), [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus), [共识的利弊](/ch10#pros-and-cons-of-consensus) - 设立新的追随者, [设置新的副本](/ch6#sec_replication_new_replica) - 同步对同步, [同步复制与异步复制](/ch6#sec_replication_sync_async)-[同步复制与异步复制](/ch6#sec_replication_sync_async) - 无领导复制, [无主复制](/ch6#sec_replication_leaderless)-[版本向量](/ch6#version-vectors) - (另见 复制) - 追赶丢失的写入, [追赶错过的写入](/ch6#sec_replication_read_repair) - 检测并行写作, [检测并发写入](/ch6#sec_replication_concurrent)-[版本向量](/ch6#version-vectors) - 版本向量, [版本向量](/ch6#version-vectors) - 多区域, [多地区操作](/ch6#multi-region-operation) - 法定人数, [读写仲裁](/ch6#sec_replication_quorum_condition)-[多地区操作](/ch6#multi-region-operation) - 一致性限制, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations)-[监控陈旧性](/ch6#monitoring-staleness), [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 跳跃秒, [软件故障](/ch2#software-faults), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 时钟, [日历时钟](/ch9#time-of-day-clocks) - 租赁, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 与协调处合作执行, [协调服务](/ch10#sec_consistency_coordination) - 需要围栏, [分布式锁和租约](/ch9#sec_distributed_lock_fencing) - 与协商一致的关系, [单值共识](/ch10#single-value-consensus) - 分类账(会计), [总结](/ch3#summary) - 不可改变性, [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 遗留系统,维护, [可运维性](/ch2#sec_introduction_maintainability) - 法律事项, [数据系统、法律与社会](/ch1#sec_introduction_compliance)-[数据系统、法律与社会](/ch1#sec_introduction_compliance) - 数据删除, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [磁盘空间使用](/ch4#disk-space-usage) - 数据存储, [分布式与单节点系统](/ch1#sec_introduction_distributed), [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 隐私监管, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [立法与自律](/ch14#sec_future_legislation) - legitimate interest (GDPR), [同意与选择自由](/ch14#id375) - 平面压缩, [压实策略](/ch4#sec_storage_lsm_compaction), [磁盘空间使用](/ch4#disk-space-usage) - Levenshtein 自动地图, [全文检索](/ch4#sec_storage_full_text) - 跛脚(部分失败), [系统模型与现实](/ch9#sec_distributed_system_model) - 线性(项目管理软件), [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 线性代数, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 线性可缩放性, [描述负载](/ch2#id33) - 线性一致性, [复制延迟的解决方案](/ch6#id131), [线性一致性](/ch10#sec_consistency_linearizability)-[线性一致性与网络延迟](/ch10#linearizability-and-network-delays), [术语表](/glossary) - 和共识, [共识](/ch10#sec_consistency_consensus) - 费用, [线性一致性的代价](/ch10#sec_linearizability_cost)-[线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - CAP定理, [CAP 定理](/ch10#the-cap-theorem) - memory on multi-core CPUs, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 定义, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition)-[什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - ID generation, [线性一致的 ID 生成器](/ch10#sec_consistency_linearizable_id) - 协调事务, [协调服务](/ch10#sec_consistency_coordination) - 数据系统 - 避免协调, [无协调数据系统](/ch13#id454) - 不同复制方法, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable)-[线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 使用法定人数, [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 在协商一致的制度中读取, [共识的微妙之处](/ch10#subtleties-of-consensus) - 依赖, [依赖线性一致性](/ch10#sec_consistency_linearizability_usage)-[跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - 限制和独特性, [约束与唯一性保证](/ch10#sec_consistency_uniqueness) - 跨渠道时间依赖性, [跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - 锁定和领导者选举, [锁定与领导者选举](/ch10#locking-and-leader-election) - 可序列性, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 链接数据, [三元组存储与 SPARQL](/ch3#id59) - LinkedIn - Espresso(数据库), [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - LIquid(数据库), [Datalog:递归关系查询](/ch3#id62) - 配置文件(例), [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - Linux 跳过第二个错误, [软件故障](/ch2#software-faults), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - Litestream (备份工具), [设置新的副本](/ch6#sec_replication_new_replica) - 生活属性, [安全性与活性](/ch9#sec_distributed_safety_liveness) - LLVM (compiler), [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - LMDB (storage engine), [压实策略](/ch4#sec_storage_lsm_compaction), [B 树变体](/ch4#b-tree-variants), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 负载 - 应付, [可伸缩性原则](/ch2#id35) - 描述, [描述负载](/ch2#id33) - 负载平衡, [描述性能](/ch2#sec_introduction_percentiles), [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - 硬件, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - 软件, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - 使用信件经纪人, [多个消费者](/ch12#id298) - 装弹, [描述性能](/ch2#sec_introduction_percentiles) - 本地二级指数, [本地二级索引](/ch7#id166), [总结](/ch7#summary) - 本地第一软件, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 局部性, [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships), [读写的数据局部性](/ch3#sec_datamodels_document_locality), [术语表](/glossary) - 分批处理, [数据流引擎](/ch11#sec_batch_dataflow) - 在状态客户端, [同步引擎与本地优先软件](/ch6#sec_replication_offline_clients), [有状态、可离线的客户端](/ch13#id347) - 在溪流处理中, [流表连接(流扩充)](/ch12#sec_stream_table_joins), [失败后重建状态](/ch12#sec_stream_state_fault_tolerance), [流处理器和服务](/ch13#id345), [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 地点透明度, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - 在演员模式中, [分布式 actor 框架](/ch5#distributed-actor-frameworks) - 锁定, [云服务的利弊](/ch1#sec_introduction_cloud_tradeoffs) - 锁, [术语表](/glossary) - 死锁, [显式锁定](/ch8#explicit-locking), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 分布式锁定, [分布式锁和租约](/ch9#sec_distributed_lock_fencing)-[多副本隔离](/ch9#fencing-with-multiple-replicas), [锁定与领导者选举](/ch10#locking-and-leader-election) - 栅栏标志, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - 与协调处合作执行, [协调服务](/ch10#sec_consistency_coordination) - 与协商一致的关系, [单值共识](/ch10#single-value-consensus) - 用于事务隔离 - 在快照隔离中, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl) - in two-phase locking (2PL), [两阶段锁定(2PL)](/ch8#sec_transactions_2pl)-[索引范围锁](/ch8#sec_transactions_2pl_range) - 使操作原子化, [原子写操作](/ch8#atomic-write-operations) - 性能, [两阶段锁定的性能](/ch8#performance-of-two-phase-locking) - 防止肮脏的写作, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - 防止带有索引范围锁的幽灵, [索引范围锁](/ch8#sec_transactions_2pl_range), [检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 读取锁(共享模式), [实现读已提交](/ch8#sec_transactions_read_committed_impl), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 共享模式和专属模式, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 分布式事务 - 发现僵局, [XA 事务的问题](/ch8#problems-with-xa-transactions) - 持有锁的可疑事务, [存疑时持有锁](/ch8#holding-locks-while-in-doubt) - 实现冲突, [物化冲突](/ch8#materializing-conflicts) - 通过明确锁定防止丢失更新, [显式锁定](/ch8#explicit-locking) - 日志序列号, [设置新的副本](/ch6#sec_replication_new_replica), [消费者偏移量](/ch12#sec_stream_log_offsets) - 逻辑时钟, [用于事件排序的时间戳](/ch9#sec_distributed_lww), [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical)-[使用逻辑时钟强制约束](/ch10#enforcing-constraints-using-logical-clocks), [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 最后写成的, [最后写入胜利(丢弃并发写入)](/ch6#sec_replication_lww) - 读后写入一致性, [读己之写](/ch6#sec_replication_ryw) - 混合逻辑时钟, [混合逻辑时钟](/ch10#hybrid-logical-clocks) - 执行制约因素不足, [使用逻辑时钟强制约束](/ch10#enforcing-constraints-using-logical-clocks) - Lamport 时间戳, [Lamport 时间戳](/ch10#lamport-timestamps) - 逻辑复制, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 用于获取变化数据, [数据变更捕获的实现](/ch12#id307) - LogicBlox(数据库), [Datalog:递归关系查询](/ch3#id62) - 日志(数据结构), [OLTP 系统的存储与索引](/ch4#sec_storage_oltp), [共享日志作为共识](/ch10#sec_consistency_shared_logs), [术语表](/glossary) - (另见 shared logs) - 不可改变性的好处, [不可变事件的优点](/ch12#sec_stream_immutability_pros) - 和清除的权利, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [磁盘空间使用](/ch4#disk-space-usage) - 压实(Compaction), [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [压实策略](/ch4#sec_storage_lsm_compaction), [日志压缩](/ch12#sec_stream_log_compaction), [状态、流和不变性](/ch12#sec_stream_immutability) - 流运算符状态, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 执行独特性限制, [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 基于日志的信息, [基于日志的消息代理](/ch12#sec_stream_log)-[重播旧消息](/ch12#sec_stream_replay) - 比较传统消息, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [重播旧消息](/ch12#sec_stream_replay) - 减 减, [消费者偏移量](/ch12#sec_stream_log_offsets) - 磁盘空间使用情况, [磁盘空间使用](/ch12#sec_stream_disk_usage) - 重播旧信件, [重播旧消息](/ch12#sec_stream_replay), [应用演化后重新处理数据](/ch13#sec_future_reprocessing), [统一批处理和流处理](/ch13#id338) - 缓慢的消费者, [当消费者跟不上生产者时](/ch12#id459) - 使用日志存储信件, [使用日志进行消息存储](/ch12#id300) - 日志结构存储, [OLTP 系统的存储与索引](/ch4#sec_storage_oltp)-[压实策略](/ch4#sec_storage_lsm_compaction) - log-structured merge tree(见 LSM-trees) - 与协商一致的关系, [共享日志作为共识](/ch10#sec_consistency_shared_logs) - 复制, [单主复制](/ch6#sec_replication_leader), [复制日志的实现](/ch6#sec_replication_implementation)-[逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 数据变更捕获, [数据变更捕获](/ch12#sec_stream_cdc)-[变更流的 API 支持](/ch12#sec_stream_change_api) - (另见 changelogs) - 与快照协调, [设置新的副本](/ch6#sec_replication_new_replica) - 逻辑(基于row) 复制, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) - 预写日志(WAL)传输, [预写日志(WAL)传输](/ch6#write-ahead-log-wal-shipping) - 伸缩性限制, [全序的限制](/ch13#id335) - 浏览器(商业情报软件), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [分析(Analytics)](/ch11#sec_batch_olap) - 松耦合, [开展分拆工作](/ch13#sec_future_unbundling_favor) - lost updates(见 updates) - 莲花笔记(同步引擎), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - LSM-trees (indexes), [SSTable 文件格式](/ch4#the-sstable-file-format)-[压实策略](/ch4#sec_storage_lsm_compaction) - 与B树的比较, [比较 B 树与 LSM 树](/ch4#sec_storage_btree_lsm_comparison)-[磁盘空间使用](/ch4#disk-space-usage) - Lucene(存储引擎), [全文检索](/ch4#sec_storage_full_text) - 相似性搜索, [全文检索](/ch4#sec_storage_full_text) - 最后写入胜利(见 最后写入胜利) ### M - 机器学习 - 批量推论, [机器学习](/ch11#id290) - data preparation with DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 删除培训数据, [数据系统、法律与社会](/ch1#sec_introduction_compliance) - 部署数据产品, [超越数据湖](/ch1#beyond-the-data-lake) - 道德考虑, [预测分析](/ch14#id369) - (另见 ethics) - 特性工程, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [机器学习](/ch11#id290) - 分析系统, [分析型与事务型系统](/ch1#sec_introduction_analytics) - 迭代处理, [机器学习](/ch11#id290) - LLMs(见 large language models (LLMs)) - 培训数据产生的模型, [应用代码作为派生函数](/ch13#sec_future_dataflow_derivation) - 与批量处理的关系, [机器学习](/ch11#id290)-[机器学习](/ch11#id290) - 使用数据湖, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - using GPUs, [云服务的分层](/ch1#layering-of-cloud-services), [分布式与单节点系统](/ch1#sec_introduction_distributed) - 使用矩阵, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 疯狂(决定性模拟测试), [确定性模拟测试](/ch9#deterministic-simulation-testing) - 万金油, [可伸缩性原则](/ch2#id35) - 可维护性, [可运维性](/ch2#sec_introduction_maintainability)-[可演化性:让变化更容易](/ch2#sec_introduction_evolvability), [流式系统的哲学](/ch13#ch_philosophy) - 可演化性(见 可演化性) - 可操作性, [可运维性:让运维更轻松](/ch2#id37) - 简化和管理复杂性, [简单性:管理复杂度](/ch2#id38) - 多种关系, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many) - 模拟为图表, [图数据模型](/ch3#sec_datamodels_graph) - 多对一关系, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many) - 在恒星计时, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - MapReduce (batch processing), [批处理](/ch11#ch_batch), [MapReduce](/ch11#sec_batch_mapreduce)-[MapReduce](/ch11#sec_batch_mapreduce) - 用户活动活动分析(实例), [JOIN 与 GROUP BY](/ch11#sec_batch_join) - 与流处理的比较, [流处理](/ch12#sec_stream_processing) - 不利条件和限制, [MapReduce](/ch11#sec_batch_mapreduce) - 过失容忍, [故障处理](/ch11#id281) - 高级工具, [查询语言](/ch11#sec_batch_query_lanauges) - 映射和缩小函数, [MapReduce](/ch11#sec_batch_mapreduce) - 移动数据, [混洗数据](/ch11#sec_shuffle) - 排序合并, [JOIN 与 GROUP BY](/ch11#sec_batch_join) - 工作流程, [工作流调度](/ch11#sec_batch_workflows) - (另见 workflow engines) - 编组(见 编码) - MartenDB(数据库), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 主奴隶复制(过时术语), [单主复制](/ch6#sec_replication_leader) - 物化, [术语表](/glossary) - 总价值, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 冲突, [物化冲突](/ch8#materializing-conflicts) - 实际意见, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 作为衍生数据, [记录系统与派生数据](/ch1#sec_introduction_derived), [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - 如果来源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 增量视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - (另见 incremental view maintenance (IVM)) - 维护,使用流处理, [维护物化视图](/ch12#sec_stream_mat_view), [表表连接(维护物化视图)](/ch12#id326) - 社会网络时间表实例, [时间线的物化与更新](/ch2#sec_introduction_materializing) - 物化, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - 增量视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - 矩阵, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 人烟稀少, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - Maxwell(变化数据捕获), [数据变更捕获的实现](/ch12#id307) - 说, [平均值、中位数与百分位点](/ch2#id24) - 媒体监测, [在流上搜索](/ch12#id320) - 中位数, [平均值、中位数与百分位点](/ch2#id24) - 会议室预订(例), [写偏差的更多例子](/ch8#more-examples-of-write-skew), [谓词锁](/ch8#predicate-locks), [强制约束](/ch13#sec_future_constraints) - 调试(调试服务器), [全内存存储](/ch4#sec_storage_inmemory) - Memgraph(数据库), [图数据模型](/ch3#sec_datamodels_graph) - Cypher 查询语言, [Cypher 查询语言](/ch3#id57) - 内存 - 壁障, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 腐败, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 模拟数据库, [全内存存储](/ch4#sec_storage_inmemory) - 持久性, [持久性](/ch8#durability) - 序列事务执行, [实际串行执行](/ch8#sec_transactions_serial) - 数据模拟表示, [编码数据的格式](/ch5#sec_encoding_formats) - 内存表, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 随机比特- flips in, [信任但验证](/ch13#sec_future_verification) - 索引的使用, [日志结构存储](/ch4#sec_storage_log_structured) - 内存表, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 商品(版本控制系统), [并发控制](/ch12#sec_stream_concurrency) - 合并, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 合并排序的文件, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [混洗数据](/ch11#sec_shuffle) - 默克尔树, [用于可审计数据系统的工具](/ch13#id366) - Mesos(分组管理器), [应用代码和状态的分离](/ch13#id344) - message brokers(见 messaging systems) - message-passing(见 event-driven architecture) - MessagePack (encoding format), [二进制编码](/ch5#binary-encoding) - 通讯系统, [流处理](/ch12#ch_stream)-[重播旧消息](/ch12#sec_stream_replay) - (另见 streams) - 后压、缓冲或丢弃信件, [消息传递系统](/ch12#sec_stream_messaging) - 无中介消息, [直接从生产者传递给消费者](/ch12#id296) - 事件日志, [基于日志的消息代理](/ch12#sec_stream_log)-[重播旧消息](/ch12#sec_stream_replay) - 作为数据模型, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 比较传统消息, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [重播旧消息](/ch12#sec_stream_replay) - 减 减, [消费者偏移量](/ch12#sec_stream_log_offsets) - 重播旧信件, [重播旧消息](/ch12#sec_stream_replay), [应用演化后重新处理数据](/ch13#sec_future_reprocessing), [统一批处理和流处理](/ch13#id338) - 缓慢的消费者, [当消费者跟不上生产者时](/ch12#id459) - 恰好一次语义, [恰好一次消息处理](/ch8#sec_transactions_exactly_once), [再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited), [容错](/ch12#sec_stream_fault_tolerance) - 信件经纪人, [消息代理](/ch12#id433)-[确认与重新传递](/ch12#sec_stream_reordering) - 承认和重新交付, [确认与重新传递](/ch12#sec_stream_reordering) - 比较事件日志, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [重播旧消息](/ch12#sec_stream_replay) - 同一主题的多个消费者, [多个消费者](/ch12#id298) - versus RPC, [事件驱动的架构](/ch5#sec_encoding_dataflow_msg) - 消息丢失, [消息传递系统](/ch12#sec_stream_messaging) - 可靠性, [消息传递系统](/ch12#sec_stream_messaging) - 以日志为基础的信件中的独特性, [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 可调味的失败, [描述性能](/ch2#sec_introduction_percentiles) - 计票 - 无服务器, [微服务与无服务器](/ch1#sec_introduction_microservices) - 存储, [云时代的运维](/ch1#sec_introduction_operations) - 微批次, [微批次与存档点](/ch12#id329) - 微服务, [微服务与无服务器](/ch1#sec_introduction_microservices) - (另见 services) - 各种服务的因果关系, [全序的限制](/ch13#id335) - 松耦合, [开展分拆工作](/ch13#sec_future_unbundling_favor) - 与批量/流程处理器的关系, [批处理](/ch11#ch_batch), [流处理器和服务](/ch13#id345) - 微软 - Azure Blob Storage(见 Azure Blob Storage) - Azure managed disks, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - Azure Service Bus(消息系统), [消息代理](/ch5#message-brokers), [消息代理与数据库的对比](/ch12#id297) - Azure SQL DB(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native) - Azure Storage, [对象存储](/ch11#id277) - Azure Stream Analytics, [流分析](/ch12#id318) - Azure Synapse Analytics(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native) - 分布式组件对象模型, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - MSDTC (transaction coordinator), [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - SQL Server(见 SQL Server) - Microsoft Power BI(见 Power BI (business intelligence software)) - 迁移(重写)数据, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility), [不同时间写入的不同值](/ch5#different-values-written-at-different-times), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views), [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - MinIO(对象存储), [分布式文件系统](/ch11#sec_batch_dfs) - 移动应用程序, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 嵌入式数据库, [压实策略](/ch4#sec_storage_lsm_compaction) - 模式检查, [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 模块操作员(%), [哈希取模节点数](/ch7#hash-modulo-number-of-nodes) - Mojo(编程语言) - 内存管理, [限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - MongoDB(数据库) - 管道合计, [文档的查询语言](/ch3#query-languages-for-documents) - 原子操作, [原子写操作](/ch8#atomic-write-operations) - BSON, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 文档数据模型, [关系模型与文档模型](/ch3#sec_datamodels_history) - 散列变硬, [按键的哈希分片](/ch7#sec_sharding_hash), [按哈希范围分片](/ch7#sharding-by-hash-range) - 在云层中, [云原生系统架构](/ch1#sec_introduction_cloud_native) - 加入支持, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 加入(\$$ookup 运算符), [规范化、反规范化与连接](/ch3#sec_datamodels_normalization) - JSON Schema validation, [JSON 模式](/ch5#json-schema) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - ObjectIds, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - 基于范围的硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 二级指数, [本地二级索引](/ch7#id166) - 硬分裂, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data) - 存储程序, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 监测, [云时代的运维](/ch1#sec_introduction_operations), [人类与可靠性](/ch2#id31), [可运维性:让运维更轻松](/ch2#id37) - 单音钟, [单调时钟](/ch9#monotonic-clocks) - 单调读, [单调读](/ch6#sec_replication_monotonic_reads) - Morel(查询语言), [查询语言](/ch11#sec_batch_query_lanauges) - MSMQ(消息系统), [XA 事务](/ch8#xa-transactions) - 多列索引, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 多领导复制, [多主复制](/ch6#sec_replication_multi_leader)-[处理写入冲突](/ch6#sec_replication_write_conflicts) - (另见 复制) - 协作编辑, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 冲突检测, [处理写入冲突](/ch6#sec_replication_write_conflicts) - 解决冲突, [处理写入冲突](/ch6#sec_replication_write_conflicts) - 供多区域复制, [跨地域运行](/ch6#sec_replication_multi_dc), [线性一致性的代价](/ch10#sec_linearizability_cost) - 线性,缺少, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 可脱机客户端, [同步引擎与本地优先软件](/ch6#sec_replication_offline_clients) - 复制地形, [多主复制拓扑](/ch6#sec_replication_topologies)-[不同拓扑的问题](/ch6#problems-with-different-topologies) - 多对象事务, [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 需求, [多对象事务的需求](/ch8#sec_transactions_need) - Multi-Paxos (consensus algorithm), [共识的实践](/ch10#sec_consistency_total_order) - 多读单写锁定, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 多表索引集群表, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 多版本并发控制, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl), [总结](/ch8#summary) - detecting stale MVCC reads, [检测陈旧的 MVCC 读取](/ch8#detecting-stale-mvcc-reads) - 索引和快照隔离, [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 使用同步时钟, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 多层面阵列, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 多重租赁, [存储与计算的分离](/ch1#sec_introduction_storage_compute), [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 通过磨损, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 使用嵌入式数据库, [压实策略](/ch4#sec_storage_lsm_compaction) - 与拜占庭断层承受能力相比, [拜占庭故障](/ch9#sec_distributed_byzantine) - 相互排斥, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - (另见 locks) - MySQL(数据库) - archiving WAL to object stores, [设置新的副本](/ch6#sec_replication_new_replica) - 二进制日志坐标, [设置新的副本](/ch6#sec_replication_new_replica) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307), [变更流的 API 支持](/ch12#sec_stream_change_api) - 循环复制地形, [多主复制拓扑](/ch6#sec_replication_topologies) - 一致的快照, [设置新的副本](/ch6#sec_replication_new_replica) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - global transaction identifiers (GTIDs), [设置新的副本](/ch6#sec_replication_new_replica) - 在云层中, [云原生系统架构](/ch1#sec_introduction_cloud_native) - InnoDB storage engine(见 InnoDB) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 基于行的复制, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 分片(见 Vitess(数据库)) - 快速隔离支持, [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - (另见 InnoDB) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) ### N - N+1 query problem, [对象关系映射(ORM)](/ch3#object-relational-mapping-orm) - 纳米msg(信息库), [直接从生产者传递给消费者](/ch12#id296) - Narayana(事务协调员), [两阶段提交(2PC)](/ch8#sec_transactions_2pc) - NATS(消息系统), [消息代理](/ch5#message-brokers) - 自然语言处理, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - Neo4j(数据库) - Cypher 查询语言, [Cypher 查询语言](/ch3#id57) - 图表数据模型, [图数据模型](/ch3#sec_datamodels_graph) - Neon(数据库), [设置新的副本](/ch6#sec_replication_new_replica) - 侄子(数据流引擎), [数据流引擎](/ch11#sec_batch_dataflow) - Neptune(图数据库), [图数据模型](/ch3#sec_datamodels_graph) - Cypher 查询语言, [Cypher 查询语言](/ch3#id57) - SPARQL 查询语言, [SPARQL 查询语言](/ch3#the-sparql-query-language) - 网码(游戏开发), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - Network Attached Storage (NAS), [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing), [分布式文件系统](/ch11#sec_batch_dfs) - 网络模型(数据表示), [关系模型与文档模型](/ch3#sec_datamodels_history) - Network Time Protocol(见 网络时间协议) - 网络 - 拥堵和排队, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 数据中心网络地形, [云计算与超级计算](/ch1#id17) - faults(见 faults) - 线性化和网络延迟, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 网络分区, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 在 CAP 定理中, [线性一致性的代价](/ch10#sec_linearizability_cost) - 超时和无限制延误, [超时和无界延迟](/ch9#sec_distributed_queueing) - NewSQL, [关系模型与文档模型](/ch3#sec_datamodels_history), [复制延迟的解决方案](/ch6#id131) - 事务和, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - 下键锁定, [索引范围锁](/ch8#sec_transactions_2pl_range) - NFS (network file system), [分布式文件系统](/ch11#sec_batch_dfs) - 在对象存储中, [对象存储](/ch11#id277) - Nimble(数据格式), [云数据仓库](/ch4#sec_cloud_data_warehouses), [列式存储](/ch4#sec_storage_column) - (另见 column-oriented storage) - node (in graphs)(见 vertices) - 节点(进程), [分布式与单节点系统](/ch1#sec_introduction_distributed), [术语表](/glossary) - 在基于领导器的复制中处理断电, [处理节点故障](/ch6#sec_replication_failover) - 失败的系统模型, [系统模型与现实](/ch9#sec_distributed_system_model) - 吵闹的邻居, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 原子承诺, [三阶段提交](/ch8#three-phase-commit) - 非决定性操作, [基于语句的复制](/ch6#statement-based-replication) - (另见 deterministic operations) - 在分布式系统中, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 工作流程引擎中, [持久化执行](/ch5#durable-execution) - 部分失败, [故障与部分失效](/ch9#sec_distributed_partial_failure) - 非决定因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 不起作用的要求, [定义非功能性需求](/ch2#ch_nonfunctional), [总结](/ch2#summary) - 不可重复读作, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - (另见 读取偏差) - 规范化, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization)-[多对一与多对多关系](/ch3#sec_datamodels_many_to_many), [术语表](/glossary) - 外国关键参考文献, [多对象事务的需求](/ch8#sec_transactions_need) - 社会网络案例研究, [社交网络案例研究中的反规范化](/ch3#denormalization-in-the-social-networking-case-study) - 在记录系统中, [记录系统与派生数据](/ch1#sec_introduction_derived) - 相对于非正常化, [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - NoSQL, [关系模型与文档模型](/ch3#sec_datamodels_history), [复制延迟的解决方案](/ch6#id131), [分拆数据库](/ch13#sec_future_unbundling) - 事务和, [事务到底是什么?](/ch8#sec_transactions_overview) - Notation3 (N3), [三元组存储与 SPARQL](/ch3#id59) - 网络时间协议, [不可靠的时钟](/ch9#sec_distributed_clocks) - 准确性, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy), [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 对单音钟的调整, [单调时钟](/ch9#monotonic-clocks) - 多个服务器地址, [弱形式的谎言](/ch9#weak-forms-of-lying) - XML 与 JSON 编码中的数字, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - NumPy (Python library), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes), [列式存储](/ch4#sec_storage_column) - NVMe (Non-Volatile Memory Express)(见 solid state drives (SSDs)) ### O - 对象数据库, [关系模型与文档模型](/ch3#sec_datamodels_history) - 对象存储, [云服务的分层](/ch1#layering-of-cloud-services), [对象存储](/ch11#id277)-[对象存储](/ch11#id277) - Azure Blob Storage(见 Azure Blob Storage) - 比较分布式文件系统, [对象存储](/ch11#id277) - 与关键价值库存的比较, [对象存储](/ch11#id277) - 数据库由, [设置新的副本](/ch6#sec_replication_new_replica) - 备份, [复制](/ch6#ch_replication) - 用于云数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses), [写入列式存储](/ch4#writing-to-column-oriented-storage) - 数据库复制, [设置新的副本](/ch6#sec_replication_new_replica) - Google Cloud Storage(见 Google Cloud Storage) - 对象大小, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - S3(见 S3(对象存储)) - storing LSM segment files, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 支持围栏, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - 数据湖中的使用, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 对象关系映射(ORM)框架, [对象关系映射(ORM)](/ch3#object-relational-mapping-orm) - 处理错误和中止事务, [处理错误和中止](/ch8#handling-errors-and-aborts) - 不安全的读写周期代码, [原子写操作](/ch8#atomic-write-operations) - 对象关系不匹配, [对象关系不匹配](/ch3#sec_datamodels_document) - 可观察性, [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems), [人类与可靠性](/ch2#id31), [可运维性:让运维更轻松](/ch2#id37) - 观察员模式, [应用代码和状态的分离](/ch13#id344) - OBT (one big table), [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics), [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 离线系统, [批处理](/ch11#ch_batch) - (另见 batch processing) - 离线第一应用程序, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps), [有状态、可离线的客户端](/ch13#id347) - 页:1 - 加工过的原木中的消费者抵消额, [消费者偏移量](/ch12#sec_stream_log_offsets) - 已磨损日志中的消息, [使用日志进行消息存储](/ch12#id300) - OLAP, [事务处理与分析的特征](/ch1#sec_introduction_oltp), [术语表](/glossary) - 数据方块, [物化视图与数据立方体](/ch4#sec_storage_materialized_views) - OLTP, [事务处理与分析的特征](/ch1#sec_introduction_oltp), [术语表](/glossary) - 分析查询与, [分析(Analytics)](/ch11#sec_batch_olap) - 数据正常化, [规范化的权衡](/ch3#trade-offs-of-normalization) - 工作量特点, [实际串行执行](/ch8#sec_transactions_serial) - 现场部署, [云服务与自托管](/ch1#sec_introduction_cloud) - 数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 一个大表格(数据仓计划), [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics), [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 单热编码, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 一对夫妇关系, [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - 一对多种关系, [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - JSON representation, [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - 在线系统, [批处理](/ch11#ch_batch) - (另见 services) - 相对于科学计算, [云计算与超级计算](/ch1#id17) - 肿瘤, [三元组存储与 SPARQL](/ch3#id59) - Oozie(工作流调度器), [批处理](/ch11#ch_batch) - OpenAPI (service definition format), [微服务与无服务器](/ch1#sec_introduction_microservices), [Web 服务](/ch5#sec_web_services), [Web 服务](/ch5#sec_web_services) - use of JSON Schema, [JSON 模式](/ch5#json-schema) - openCypher(见 Cypher(查询语言)) - OpenLink Virtuoso(见 Virtuoso(数据库)) - OpenStack - Swift(对象存储), [对象存储](/ch11#id277) - 可操作性, [可运维性:让运维更轻松](/ch2#id37) - 操作系统与数据库, [分拆数据库](/ch13#sec_future_unbundling) - 业务系统, [分析型与事务型系统](/ch1#sec_introduction_analytics) - (另见 在线事务处理) - 作为记录系统, [记录系统与派生数据](/ch1#sec_introduction_derived) - ETL into analytical systems, [数据仓库](/ch1#sec_introduction_dwh) - 操作转换, [CRDT 与操作变换](/ch6#sec_replication_crdts) - 行动组, [云时代的运维](/ch1#sec_introduction_operations) - 算子, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 在溪流处理中, [流处理](/ch12#sec_stream_processing) - 乐观并发控制, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 乐观锁定, [条件写入(比较并设置)](/ch8#sec_transactions_compare_and_set) - Oracle(数据库) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - GoldenGate (change data capture), [数据变更捕获的实现](/ch12#id307) - 等级查询, [SQL 中的图查询](/ch3#id58), [SQL 中的图查询](/ch3#id58) - 缺乏序列性, [隔离性](/ch8#sec_transactions_acid_isolation) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 多表索引集群表, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 无法阻止写入 skew, [写偏差的特征](/ch8#characterizing-write-skew) - PL/SQL language, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 防止丢失更新, [自动检测丢失的更新](/ch8#automatically-detecting-lost-updates) - 读作承诺隔离, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - Real Application Clusters (RAC), [锁定与领导者选举](/ch10#locking-and-leader-election) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation), [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - TimesTen (in-memory database), [全内存存储](/ch4#sec_storage_inmemory) - WAL-based replication, [预写日志(WAL)传输](/ch6#write-ahead-log-wal-shipping) - ORC(数据格式), [云数据仓库](/ch4#sec_cloud_data_warehouses), [列式存储](/ch4#sec_storage_column) - (另见 column-oriented storage) - 协调(服务部署), [云服务与自托管](/ch1#sec_introduction_cloud), [微服务与无服务器](/ch1#sec_introduction_microservices) - 批量任务执行, [分布式作业编排](/ch11#id278)-[分布式作业编排](/ch11#id278) - 工作流程引擎, [批处理](/ch11#ch_batch) - 顺序 - 事件日志, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 总订单的限制, [全序的限制](/ch13#id335) - 逻辑时间戳, [逻辑时钟](/ch10#sec_consistency_timestamps) - of auto-incrementing IDs, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - 共享日志, [共识的实践](/ch10#sec_consistency_total_order)-[共识的利弊](/ch10#pros-and-cons-of-consensus) - Orkes(工作流程引擎), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 孤儿页面(B- 树), [使 B 树可靠](/ch4#sec_storage_btree_wal) - 发件箱图案, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 异常值(响应时间), [平均值、中位数与百分位点](/ch2#id24) - 外包, [云服务与自托管](/ch1#sec_introduction_cloud) - 超载, [描述性能](/ch2#sec_introduction_percentiles), [处理错误和中止](/ch8#handling-errors-and-aborts) ### P - PACELC principle, [CAP 定理](/ch10#the-cap-theorem) - 软件包管理器, [应用代码和状态的分离](/ch13#id344) - 包切换, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - 数据包 - 腐败, [弱形式的谎言](/ch9#weak-forms-of-lying) - sending via UDP, [直接从生产者传递给消费者](/ch12#id296) - PageRank (algorithm), [图数据模型](/ch3#sec_datamodels_graph), [查询语言](/ch11#sec_batch_query_lanauges), [机器学习](/ch11#id290) - paging(见 virtual memory) - 大熊猫(蟒蛇图书馆), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes), [列式存储](/ch4#sec_storage_column), [DataFrames](/ch11#id287) - Parquet(数据格式), [云数据仓库](/ch4#sec_cloud_data_warehouses), [列式存储](/ch4#sec_storage_column), [归档存储](/ch5#archival-storage), [查询语言](/ch11#sec_batch_query_lanauges) - (另见 column-oriented storage) - 对象存储的数据库, [设置新的副本](/ch6#sec_replication_new_replica) - 文档数据模型, [列式存储](/ch4#sec_storage_column) - 批量处理中的用途, [MapReduce](/ch11#sec_batch_mapreduce) - 部分失败, [故障与部分失效](/ch9#sec_distributed_partial_failure), [总结](/ch9#summary) - 跛脚, [系统模型与现实](/ch9#sec_distributed_system_model) - 部分同步(系统模型), [系统模型与现实](/ch9#sec_distributed_system_model) - 分区键, [分片的利与弊](/ch7#sec_sharding_reasons), [键值数据的分片](/ch7#sec_sharding_key_value) - 分区(见 分片) - Paxos(协商一致算法), [共识](/ch10#sec_consistency_consensus), [共识的实践](/ch10#sec_consistency_total_order) - 票数, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - Multi-Paxos, [共识的实践](/ch10#sec_consistency_total_order) - payment card industry (PCI), [数据系统、法律与社会](/ch1#sec_introduction_compliance) - PCI (payment card industry) compliance, [数据系统、法律与社会](/ch1#sec_introduction_compliance) - 百分位点, [平均值、中位数与百分位点](/ch2#id24), [术语表](/glossary) - 高效计算, [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 高百分数的重要性, [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - use in service level agreements (SLAs), [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - Percolator (Google), [实现线性一致的 ID 生成器](/ch10#implementing-a-linearizable-id-generator) - Percona XtraBackup (MySQL tool), [设置新的副本](/ch6#sec_replication_new_replica) - 性能 - 作为过失的降解, [系统模型与现实](/ch9#sec_distributed_system_model) - 描述, [描述性能](/ch2#sec_introduction_percentiles) - 分布式事务, [跨不同系统的分布式事务](/ch8#sec_transactions_xa) - 内存数据库, [全内存存储](/ch4#sec_storage_inmemory) - 线性, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 多领导者复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 权限隔离, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 永久不一致, [及时性与完整性](/ch13#sec_future_integrity) - 悲观并发控制, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - pglogical (PostgreSQL extension), [跨地域运行](/ch6#sec_replication_multi_dc) - pgvector (矢量指数), [向量嵌入](/ch4#id92) - 幻读, [导致写偏差的幻读](/ch8#sec_transactions_phantom) - 物化冲突, [物化冲突](/ch8#materializing-conflicts) - 预防,序列性, [谓词锁](/ch8#predicate-locks) - physical clocks(见 clocks) - pick菜(蟒鱼), [特定语言的格式](/ch5#id96) - Pinot(数据库), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [列式存储](/ch4#sec_storage_column) - 处理写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - 预汇总, [分析(Analytics)](/ch11#sec_batch_olap) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived), [对外提供派生数据](/ch11#sec_batch_serving_derived) - 编审中的执行 - 数据仓查询, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 枢轴表, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 时间点, [不可靠的时钟](/ch9#sec_distributed_clocks) - 点查询, [事务处理与分析的特征](/ch1#sec_introduction_oltp) - 极地(数据目录), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 投票, [表示用户、帖子与关注关系](/ch2#id20) - 多边存储器, [一切的元数据库](/ch13#id341) - POSIX (portable operating system interface) - 符合的文件系统, [设置新的副本](/ch6#sec_replication_new_replica), [分布式文件系统](/ch11#sec_batch_dfs), [对象存储](/ch11#id277) - 邮政局地平线丑闻, [人类与可靠性](/ch2#id31) - 缺乏事务, [事务](/ch8#ch_transactions) - PostgreSQL(数据库) - archiving WAL to object stores, [设置新的副本](/ch6#sec_replication_new_replica) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307), [变更流的 API 支持](/ch12#sec_stream_change_api) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 外国数据包, [一切的元数据库](/ch13#id341) - 全文搜索支持, [组合使用派生数据的工具](/ch13#id442) - 在云层中, [云原生系统架构](/ch1#sec_introduction_cloud_native) - JSON Schema validation, [JSON 模式](/ch5#json-schema) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 日志序列号, [设置新的副本](/ch6#sec_replication_new_replica) - 逻辑解码, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 实现视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - MVCC implementation, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl), [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 分割对硬化, [分片](/ch7#ch_sharding) - pgvector (矢量指数), [向量嵌入](/ch4#id92) - PL/pgSQL language, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - PostGIS geospatial indexes, [多维索引与全文索引](/ch4#sec_storage_multidimensional) - 防止丢失更新, [自动检测丢失的更新](/ch8#automatically-detecting-lost-updates) - 防止写入skew, [写偏差的特征](/ch8#characterizing-write-skew), [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi) - 读作承诺隔离, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - 表示图表, [属性图](/ch3#id56) - 可串行化快照隔离, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi) - 分片(见 Citus(数据库)) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation), [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - WAL-based replication, [预写日志(WAL)传输](/ch6#write-ahead-log-wal-shipping) - 倒排列表, [全文检索](/ch4#sec_storage_full_text) - 在硬化指数中, [本地二级索引](/ch7#id166) - 死后无咎, [人类与可靠性](/ch2#id31) - PouchDB(数据库), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - Power BI (business intelligence software), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [分析(Analytics)](/ch11#sec_batch_olap) - 预汇总, [分析(Analytics)](/ch11#sec_batch_olap) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - 分享前, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data) - Precision Time Protocol (PTP), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 上游锁定, [谓词锁](/ch8#predicate-locks) - 预测分析, [分析型与事务型系统](/ch1#sec_introduction_analytics), [预测分析](/ch14#id369)-[反馈回路](/ch14#id372) - 扩大偏见, [偏见与歧视](/ch14#id370) - ethics of(见 ethics) - 反馈循环, [反馈回路](/ch14#id372) - 预设, [资源分配](/ch11#id279) - 在分布式调度器中, [故障处理](/ch11#id281) - 线程, [进程暂停](/ch9#sec_distributed_clocks_pauses) - Prefect(工作流调度器), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows), [批处理](/ch11#ch_batch), [工作流调度](/ch11#sec_batch_workflows) - 云数据仓集成, [查询语言](/ch11#sec_batch_query_lanauges) - Presto(查询引擎), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 主密钥, [多列索引与二级索引](/ch4#sec_storage_index_multicolumn), [术语表](/glossary) - 自动递增, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - 对分区键, [按哈希范围分片](/ch7#sharding-by-hash-range) - primary-backup replication(见 基于领导者的复制) - 隐私, [隐私与追踪](/ch14#id373)-[立法与自律](/ch14#sec_future_legislation) - 同意和选择自由, [同意与选择自由](/ch14#id375) - 数据作为资产和权力, [数据作为资产与权力](/ch14#id376) - 删除数据, [不变性的局限性](/ch12#sec_stream_immutability_limitations) - ethical considerations(见 ethics) - 立法和自律, [立法与自律](/ch14#sec_future_legislation) - 含义, [隐私与数据使用](/ch14#id457) - 条例, [数据系统、法律与社会](/ch1#sec_introduction_compliance) - 监视, [监视](/ch14#id374) - 跟踪行为数据, [隐私与追踪](/ch14#id373) - 概率算法, [响应时间指标的应用](/ch2#sec_introduction_slo_sla), [流分析](/ch12#id318) - 进程暂停, [进程暂停](/ch9#sec_distributed_clocks_pauses)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - 处理时间(事件), [时间推理](/ch12#sec_stream_time) - 生产者(信息流), [传递事件流](/ch12#sec_stream_transmit) - 产品分析, [事务处理与分析的特征](/ch1#sec_introduction_oltp) - 面向列的存储, [列式存储](/ch4#sec_storage_column) - 编程语言 - 用于储存程序, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 预测(活动来源), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - Prolog(语言), [Datalog:递归关系查询](/ch3#id62) - (另见 Datalog) - 属性图, [属性图](/ch3#id56) - Cypher 查询语言, [Cypher 查询语言](/ch3#id57) - Property Graph Query Language (PGQL), [SQL 中的图查询](/ch3#id58) - 基于属性的测试, [人类与可靠性](/ch2#id31), [形式化方法和随机测试](/ch9#sec_distributed_formal) - Protocol Buffers(数据格式), [Protocol Buffers](/ch5#sec_encoding_protobuf)-[字段标签与模式演化](/ch5#field-tags-and-schema-evolution), [Protocol Buffers](/ch5#sec_encoding_protobuf) - 字段标记和计划演变, [字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 数据来源, [为可审计性而设计](/ch13#id365) - 发布/订阅模式, [消息传递系统](/ch12#sec_stream_messaging) - 出版社(信息流), [传递事件流](/ch12#sec_stream_transmit) - Pulsar (流线平台), [确认与重新传递](/ch12#sec_stream_reordering) - PyTorch (machine learning library), [机器学习](/ch11#id290) ### Q - Qpid(消息系统), [消息代理与数据库的对比](/ch12#id297) - quality of service (QoS), [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - Quantcast File System(分布式文件系统), [对象存储](/ch11#id277) - 查询引擎 - 汇编和矢量化, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 在云数据仓库中, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 算子, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 优化申报查询, [数据模型与查询语言](/ch3#ch_datamodels) - 查询语言 - 密码, [Cypher 查询语言](/ch3#id57) - 数据日志, [Datalog:递归关系查询](/ch3#id62) - GraphQL, [GraphQL](/ch3#id63) - MongoDB aggregation pipeline, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization), [文档的查询语言](/ch3#query-languages-for-documents) - recursive SQL queries, [SQL 中的图查询](/ch3#id58) - SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language) - SQL, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization) - 查询优化器, [查询语言](/ch11#sec_batch_query_lanauges) - 查询计划, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 排队延迟, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 头部阻塞, [延迟与响应时间](/ch2#id23) - 延迟和反应时间, [延迟与响应时间](/ch2#id23) - 队列(消息), [消息代理](/ch5#message-brokers) - QUIC (protocol), [TCP 的局限性](/ch9#sec_distributed_tcp) - 法定人数, [读写仲裁](/ch6#sec_replication_quorum_condition)-[多地区操作](/ch6#multi-region-operation), [术语表](/glossary) - 用于无头复制, [读写仲裁](/ch6#sec_replication_quorum_condition) - 在共识算法中, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 一致性的限制, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations)-[监控陈旧性](/ch6#monitoring-staleness), [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 在分布式系统中作出决定, [多数派原则](/ch9#sec_distributed_majority) - 监测停滞情况, [监控陈旧性](/ch6#monitoring-staleness) - 多区域复制, [多地区操作](/ch6#multi-region-operation) - 依赖耐久性, [将系统模型映射到现实世界](/ch9#mapping-system-models-to-the-real-world) - 配额, [云时代的运维](/ch1#sec_introduction_operations) ### R - R(语言), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes), [DataFrames](/ch11#id287) - R树(指数), [多维索引与全文索引](/ch4#sec_storage_multidimensional) - R2(对象存储), [云服务的分层](/ch1#layering-of-cloud-services), [分布式文件系统](/ch11#sec_batch_dfs) - RabbitMQ(消息系统), [消息代理](/ch5#message-brokers), [消息代理与数据库的对比](/ch12#id297) - 法定人数队列(复制), [单主复制](/ch6#sec_replication_leader) - 种族条件, [隔离性](/ch8#sec_transactions_acid_isolation) - (另见 并发) - 以可线性避免, [跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - 由双写引起, [保持系统同步](/ch12#sec_stream_sync) - 造成资金损失, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 肮脏的写作, [没有脏写](/ch8#sec_transactions_dirty_write) - 逆增量, [没有脏写](/ch8#sec_transactions_dirty_write) - 丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update)-[冲突解决与复制](/ch8#conflict-resolution-and-replication) - 以事件日志防止, [并发控制](/ch12#sec_stream_concurrency), [数据流:应用代码与状态变化的交互](/ch13#id450) - 以可序列隔离的方式防止, [可串行化](/ch8#sec_transactions_serializability) - 事务隔离薄弱, [弱隔离级别](/ch8#sec_transactions_isolation_levels) - 写偏差, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts) - Raft(协商一致算法), [共识](/ch10#sec_consistency_consensus), [共识的实践](/ch10#sec_consistency_total_order) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 对网络问题的敏感性, [共识的利弊](/ch10#pros-and-cons-of-consensus) - 任期, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 用于等, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - RAID (Redundant Array of Independent Disks), [存储与计算的分离](/ch1#sec_introduction_storage_compute), [通过冗余容忍硬件故障](/ch2#tolerating-hardware-faults-through-redundancy), [分布式文件系统](/ch11#sec_batch_dfs) - 铁路,计划迁移, [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - RAM(见 memory) - RAMCloud (in-memory storage), [全内存存储](/ch4#sec_storage_inmemory) - 随机写入(访问模式), [顺序与随机写入](/ch4#sidebar_sequential) - 区域查询 - 在B树上, [B 树](/ch4#sec_storage_b_trees), [读取性能](/ch4#read-performance) - in LSM-trees, [读取性能](/ch4#read-performance) - 散列地图中不高效, [日志结构存储](/ch4#sec_storage_log_structured) - 与大麻的磨损,, [按哈希范围分片](/ch7#sharding-by-hash-range) - 排名算法, [机器学习](/ch11#id290) - Ray(工作流调度器), [机器学习](/ch11#id290) - RDF (Resource Description Framework), [RDF 数据模型](/ch3#the-rdf-data-model) - querying with SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language) - 远程直接内存访问, [云服务的分层](/ch1#layering-of-cloud-services), [云计算与超级计算](/ch1#id17) - 反应(用户界面库), [端到端的事件流](/ch13#id349) - 被动方案拟订, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 读取承诺隔离级别, [读已提交](/ch8#sec_transactions_read_committed)-[实现读已提交](/ch8#sec_transactions_read_committed_impl) - 执行, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - 多版本并发控制, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl) - 没有脏读, [没有脏读](/ch8#no-dirty-reads) - 没有污秽的文字, [没有脏写](/ch8#sec_transactions_dirty_write) - 读取模型(活动来源), [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 读路径, [观察派生数据状态](/ch13#sec_future_observing) - (无铅复制), [追赶错过的写入](/ch6#sec_replication_read_repair) - 线性, [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 只读副本(见 基于领导者的复制) - 读取偏差, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation), [总结](/ch8#summary) - 读取未承诺的隔离级别, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - 写后读一致性, [读己之写](/ch6#sec_replication_ryw), [及时性与完整性](/ch13#sec_future_integrity) - 交叉设备, [读己之写](/ch6#sec_replication_ryw) - 在衍生数据系统中, [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions) - 读 - 修改 - 写入周期, [防止丢失更新](/ch8#sec_transactions_lost_update) - 读缩放架构, [复制延迟的问题](/ch6#sec_replication_lag), [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 与磨损, [分片的利与弊](/ch7#sec_sharding_reasons) - 读作事件, [读也是事件](/ch13#sec_future_read_events) - 实时 - analytics(见 product analytics) - 协作编辑, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 发布/订阅数据流, [端到端的事件流](/ch13#id349) - 响应时间保障, [响应时间保证](/ch9#sec_distributed_clocks_realtime) - 每日时钟, [日历时钟](/ch9#time-of-day-clocks) - Realm(数据库), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 重新平衡困难, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data)-[运维:自动/手动再平衡](/ch7#sec_sharding_operations), [术语表](/glossary) - (另见 分片) - 自动或人工重新平衡, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 固定块数, [固定数量的分片](/ch7#fixed-number-of-shards) - 每个节点的固定硬度数, [按哈希范围分片](/ch7#sharding-by-hash-range) - Hash mod N的问题, [哈希取模节点数](/ch7#hash-modulo-number-of-nodes) - 新鲜度保证, [线性一致性](/ch10#sec_consistency_linearizability) - 建议引擎, [分析型与事务型系统](/ch1#sec_introduction_analytics) - building using DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 迭代处理, [机器学习](/ch11#id290) - 重组(协商一致), [共识的微妙之处](/ch10#subtleties-of-consensus) - 记录, [MapReduce](/ch11#sec_batch_mapreduce) - 流处理中的事件, [传递事件流](/ch12#sec_stream_transmit) - 递归查询 - 在密钥中, [Cypher 查询语言](/ch3#id57) - 在数据日志中, [Datalog:递归关系查询](/ch3#id62) - in SPARQL, [SPARQL 查询语言](/ch3#the-sparql-query-language) - lack of, in GraphQL, [GraphQL](/ch3#id63) - SQL common table expressions, [SQL 中的图查询](/ch3#id58) - Red Hat - Apicurio Registry, [JSON 模式](/ch5#json-schema) - 红黑树, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 重新交付(通讯), [确认与重新传递](/ch12#sec_stream_reordering) - Redis(数据库) - 原子操作, [原子写操作](/ch8#atomic-write-operations) - CRDT support, [CRDT 与操作变换](/ch6#sec_replication_crdts) - 持久性, [全内存存储](/ch4#sec_storage_inmemory) - Lua 脚本, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 进程/核心模式, [分片的利与弊](/ch7#sec_sharding_reasons) - 单条执行, [实际串行执行](/ch8#sec_transactions_serial) - redo log(见 write-ahead log) - Redpanda(消息系统), [消息代理](/ch5#message-brokers), [设置新的副本](/ch6#sec_replication_new_replica) - 分层存储, [磁盘空间使用](/ch12#sec_stream_disk_usage) - Redshift(数据库), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 冗余 - 硬件组件, [通过冗余容忍硬件故障](/ch2#tolerating-hardware-faults-through-redundancy) - 生成数据, [记录系统与派生数据](/ch1#sec_introduction_derived) - (另见 衍生数据) - Reed--Solomon codes (error correction), [分布式文件系统](/ch11#sec_batch_dfs) - 重构, [可演化性:让变化更容易](/ch2#sec_introduction_evolvability) - (另见 可演化性) - (地理分布), [读己之写](/ch6#sec_replication_ryw) - (另见 datacenters) - 协商一致, [共识的利弊](/ch10#pros-and-cons-of-consensus) - 定义, [读己之写](/ch6#sec_replication_ryw) - 延迟, [分布式与单节点系统](/ch1#sec_introduction_distributed) - linearizable ID generation, [实现线性一致的 ID 生成器](/ch10#implementing-a-linearizable-id-generator) - 在整个区域复制, [跨地域运行](/ch6#sec_replication_multi_dc)-[不同拓扑的问题](/ch6#problems-with-different-topologies), [线性一致性的代价](/ch10#sec_linearizability_cost), [全序的限制](/ch13#id335) - 无主(无领导者), [多地区操作](/ch6#multi-region-operation) - 多领导者, [跨地域运行](/ch6#sec_replication_multi_dc) - 区域(硬化), [分片](/ch7#ch_sharding) - 寄存器, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - regulation(见 legal matters) - 关系数据模型, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [关系模型与文档模型](/ch3#sec_datamodels_history)-[文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 与文件模型的比较, [何时使用哪种模型](/ch3#sec_datamodels_document_summary)-[文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - graph queries in SQL, [SQL 中的图查询](/ch3#id58) - 模拟数据库, [全内存存储](/ch4#sec_storage_inmemory) - 多对多对多的关系, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many) - 多对象事务, 需要, [多对象事务的需求](/ch8#sec_transactions_need) - 对象关系不匹配, [对象关系不匹配](/ch3#sec_datamodels_document) - 代表可重排列表, [何时使用哪种模型](/ch3#sec_datamodels_document_summary) - 对文档模式 - 模式的趋同, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 数据位置, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 关系数据库 - 最终一致性, [复制延迟的问题](/ch6#sec_replication_lag) - 历史, [关系模型与文档模型](/ch3#sec_datamodels_history) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 逻辑日志, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 哲学比Unix, [分拆数据库](/ch13#sec_future_unbundling), [一切的元数据库](/ch13#id341) - 方案变化, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility), [编码与演化](/ch5#ch_encoding), [不同时间写入的不同值](/ch5#different-values-written-at-different-times) - 硬化二级指数, [分片与二级索引](/ch7#sec_sharding_secondary_indexes) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) - B树指数的使用, [B 树](/ch4#sec_storage_b_trees) - relationships(见 edges) - 可靠性, [可靠性与容错](/ch2#sec_introduction_reliability)-[人类与可靠性](/ch2#id31), [流式系统的哲学](/ch13#ch_philosophy) - 从不可靠的组件建立可靠的系统, [故障与部分失效](/ch9#sec_distributed_partial_failure) - 硬件故障, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 人类错误, [人类与可靠性](/ch2#id31) - 重要性, [人类与可靠性](/ch2#id31) - 通讯系统, [消息传递系统](/ch12#sec_stream_messaging) - 软件故障, [软件故障](/ch2#software-faults) - Remote Method Invocation (Java RMI), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - remote procedure calls (RPCs), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc)-[RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - (另见 services) - 数据编码和演化, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 问题, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - 使用 Avro, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 对信件经纪人, [事件驱动的架构](/ch5#sec_encoding_dataflow_msg) - 可再生能源, [分布式与单节点系统](/ch1#sec_introduction_distributed) - 可重复读(切换隔离), [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - 复制品, [单主复制](/ch6#sec_replication_leader) - 复制, [复制](/ch6#ch_replication)-[总结](/ch6#summary), [术语表](/glossary) - 持久性, [持久性](/ch8#durability) - 解决冲突, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 一致性属性, [复制延迟的问题](/ch6#sec_replication_lag)-[复制延迟的解决方案](/ch6#id131) - 一致前缀读, [一致前缀读](/ch6#sec_replication_consistent_prefix) - 单调读, [单调读](/ch6#sec_replication_monotonic_reads) - 读取您的写作, [读己之写](/ch6#sec_replication_ryw) - 在分布式文件系统中, [分布式文件系统](/ch11#sec_batch_dfs) - 无主(无领导者), [无主复制](/ch6#sec_replication_leaderless)-[版本向量](/ch6#version-vectors) - 检测并行写作, [检测并发写入](/ch6#sec_replication_concurrent)-[版本向量](/ch6#version-vectors) - 法定人数一致性的限制, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations)-[监控陈旧性](/ch6#monitoring-staleness), [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 监测停滞情况, [监控陈旧性](/ch6#monitoring-staleness) - 多领导者, [多主复制](/ch6#sec_replication_multi_leader)-[处理写入冲突](/ch6#sec_replication_write_conflicts) - 跨多个区域, [跨地域运行](/ch6#sec_replication_multi_dc), [线性一致性的代价](/ch10#sec_linearizability_cost) - 解决冲突, [处理写入冲突](/ch6#sec_replication_write_conflicts)-[处理写入冲突](/ch6#sec_replication_write_conflicts) - 复制地形, [多主复制拓扑](/ch6#sec_replication_topologies)-[不同拓扑的问题](/ch6#problems-with-different-topologies) - 使用原因, [分布式与单节点系统](/ch1#sec_introduction_distributed), [复制](/ch6#ch_replication) - 硬化和, [分片](/ch7#ch_sharding) - 单人领导, [单主复制](/ch6#sec_replication_leader)-[逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 故障切换, [领导者故障:故障转移](/ch6#leader-failure-failover) - 实施复制日志, [复制日志的实现](/ch6#sec_replication_implementation)-[逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 与协商一致的关系, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus), [共识的利弊](/ch10#pros-and-cons-of-consensus) - 设立新的追随者, [设置新的副本](/ch6#sec_replication_new_replica) - 同步对同步, [同步复制与异步复制](/ch6#sec_replication_sync_async)-[同步复制与异步复制](/ch6#sec_replication_sync_async) - 状态机复制, [基于语句的复制](/ch6#statement-based-replication), [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs), [使用共享日志](/ch10#sec_consistency_smr), [数据库与流](/ch12#sec_stream_databases) - 事件溯源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 利用协商一致, [共识的利弊](/ch10#pros-and-cons-of-consensus) - 使用擦除编码, [分布式文件系统](/ch11#sec_batch_dfs) - 使用对象存储, [设置新的副本](/ch6#sec_replication_new_replica) - 相对备份, [复制](/ch6#ch_replication) - 具有多样化数据系统, [保持系统同步](/ch12#sec_stream_sync) - replication logs(见 logs) - representations of data(见 data models) - 后处理数据, [应用演化后重新处理数据](/ch13#sec_future_reprocessing), [统一批处理和流处理](/ch13#id338) - (另见 可演化性) - 从基于日志的信件, [重播旧消息](/ch12#sec_stream_replay) - 请求套期, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 请求标识符, [操作标识符](/ch13#id355), [多分区请求处理](/ch13#id360) - 请求路由, [请求路由](/ch7#sec_sharding_routing)-[请求路由](/ch7#sec_sharding_routing) - 方法, [请求路由](/ch7#sec_sharding_routing) - 数据居住法, [分布式与单节点系统](/ch1#sec_introduction_distributed), [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 弹性系统, [可靠性与容错](/ch2#sec_introduction_reliability) - (另见 fault tolerance) - 资源隔离, [云计算与超级计算](/ch1#id17), [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 资源限制, [云时代的运维](/ch1#sec_introduction_operations) - 响应时间 - 作为业绩计量, [描述性能](/ch2#sec_introduction_percentiles), [批处理](/ch11#ch_batch) - 保证, [响应时间保证](/ch9#sec_distributed_clocks_realtime) - 对用户的影响, [平均值、中位数与百分位点](/ch2#id24) - 在复制系统中, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 暂时性与, [延迟与响应时间](/ch2#id23) - 平均值和百分位数, [平均值、中位数与百分位点](/ch2#id24) - 用户体验, [平均值、中位数与百分位点](/ch2#id24) - 责任和问责制, [责任与问责](/ch14#id371) - 表述性状态传递, [Web 服务](/ch5#sec_web_services) - (另见 services) - 重报(工作流程引擎), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - RethinkDB(数据库) - 加入支持, [文档和关系数据库的融合](/ch3#convergence-of-document-and-relational-databases) - 键程硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 重试风暴, [描述性能](/ch2#sec_introduction_percentiles), [软件故障](/ch2#software-faults) - reverse ETL, [超越数据湖](/ch1#beyond-the-data-lake) - Riak(数据库) - CRDT support, [CRDT 与操作变换](/ch6#sec_replication_crdts), [检测并发写入](/ch6#sec_replication_concurrent) - 点版向量, [版本向量](/ch6#version-vectors) - 流言协议, [请求路由](/ch7#sec_sharding_routing) - 散列变硬, [固定数量的分片](/ch7#fixed-number-of-shards) - 无领导复制, [无主复制](/ch6#sec_replication_leaderless) - 线性,缺少, [线性一致性与仲裁](/ch10#sec_consistency_quorum_linearizable) - 多区域支助, [多地区操作](/ch6#multi-region-operation) - 再平衡, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 二级指数, [本地二级索引](/ch7#id166) - 草率法定人数, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 节点(硬化), [分片](/ch7#ch_sharding) - 环缓冲器, [磁盘空间使用](/ch12#sec_stream_disk_usage) - RisingWave(数据库) - 增量视图维护, [维护物化视图](/ch12#sec_stream_mat_view) - 火箭弹, [拜占庭故障](/ch9#sec_distributed_byzantine) - RocksDB (storage engine), [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 作为嵌入式存储引擎, [压实策略](/ch4#sec_storage_lsm_compaction) - 平面压缩, [压实策略](/ch4#sec_storage_lsm_compaction) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - 退缩(事务), [事务](/ch8#ch_transactions) - 滚动升级, [通过冗余容忍硬件故障](/ch2#tolerating-hardware-faults-through-redundancy), [编码与演化](/ch5#ch_encoding), [故障与部分失效](/ch9#sec_distributed_partial_failure) - 在多种租户系统中, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - routing(见 request routing) - 基于行的复制, [逻辑(基于行)日志复制](/ch6#logical-row-based-log-replication) - 面向行存储, [列式存储](/ch4#sec_storage_column) - 抢劫犯(贪污), [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - RPCs(见 remote procedure calls) - 规则(数据), [Datalog:递归关系查询](/ch3#id62) - Rust(编程语言) - 内存管理, [限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) ### S - S3(对象存储), [云服务的分层](/ch1#layering-of-cloud-services), [设置新的副本](/ch6#sec_replication_new_replica), [批处理](/ch11#ch_batch), [分布式文件系统](/ch11#sec_batch_dfs), [对象存储](/ch11#id277) - 检查数据完整性, [不要盲目信任承诺](/ch13#id364) - 有条件写入, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - 对象大小, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - S3 Express One Zone, [对象存储](/ch11#id277), [对象存储](/ch11#id277) - use in MapReduce, [MapReduce](/ch11#sec_batch_mapreduce) - 工作流程示例, [工作流调度](/ch11#sec_batch_workflows) - SaaS(见 软件即服务(SaaS)) - 安全和生活特性, [安全性与活性](/ch9#sec_distributed_safety_liveness) - 在共识算法中, [单值共识](/ch10#single-value-consensus) - 事务中, [事务](/ch8#ch_transactions) - sagas(见 compensating transactions) - Samza (流处理器), [流分析](/ch12#id318) - SAP HANA(数据库), [分析型数据存储](/ch4#sec_storage_analytics) - 可伸缩性, [可伸缩性](/ch2#sec_introduction_scalability)-[可伸缩性原则](/ch2#id35), [流式系统的哲学](/ch13#ch_philosophy) - 自动缩放, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 通过磨损, [分片的利与弊](/ch7#sec_sharding_reasons) - 描述负载, [描述负载](/ch2#id33) - 描述性能, [描述性能](/ch2#sec_introduction_percentiles) - 线性, [描述负载](/ch2#id33) - 原则, [可伸缩性原则](/ch2#id35) - 复制和, [复制延迟的问题](/ch6#sec_replication_lag) - 扩大规模与扩大规模, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing) - 缩放, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing) - (另见 shared-nothing architecture) - 通过磨损, [分片的利与弊](/ch7#sec_sharding_reasons) - 扩大规模, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing) - 缓慢变化的维度, [连接的时间依赖性](/ch12#sec_stream_join_time) - 调度 - 算法, [资源分配](/ch11#id279) - 批量任务, [分布式作业编排](/ch11#id278)-[工作流调度](/ch11#sec_batch_workflows) - 帮派列表, [资源分配](/ch11#id279) - 阅读时的图谋, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - 与可变方案比较, [模式的优点](/ch5#sec_encoding_schemas) - 拼写图, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - schemaless databases(见 schema-on-read) - 计划, [术语表](/glossary) - Avro, [Avro](/ch5#sec_encoding_avro)-[动态生成的模式](/ch5#dynamically-generated-schemas) - 读者决定作家的计划, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 计划演变, [写入者模式与读取者模式](/ch5#the-writers-schema-and-the-readers-schema) - 动态生成, [动态生成的模式](/ch5#dynamically-generated-schemas) - 变化, [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - 影响应用程序代码, [编码与演化](/ch5#ch_encoding) - 兼容性检查, [但什么是写入者模式?](/ch5#but-what-is-the-writers-schema) - 数据库中, [流经数据库的数据流](/ch5#sec_encoding_dataflow_db)-[归档存储](/ch5#archival-storage) - 服务电话, [RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 文件模式的灵活性, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - 用于分析, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics)-[星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - for JSON and XML, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json), [JSON 模式](/ch5#json-schema) - generation and migration using ORMs, [对象关系映射(ORM)](/ch3#object-relational-mapping-orm) - 案情, [模式的优点](/ch5#sec_encoding_schemas) - 迁移, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - Protocol Buffers, [Protocol Buffers](/ch5#sec_encoding_protobuf)-[字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 计划演变, [字段标签与模式演化](/ch5#field-tags-and-schema-evolution) - 铁路移民计划, [应用演化后重新处理数据](/ch13#sec_future_reprocessing) - 传统的设计方法,谬误, [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views) - 科学计算, [云计算与超级计算](/ch1#id17) - scikit-learn (Python 图书馆), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - ScyllaDB(数据库) - 集群元数据, [请求路由](/ch7#sec_sharding_routing) - consistency level ANY, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 散列变硬, [按键的哈希分片](/ch7#sec_sharding_hash), [按哈希范围分片](/ch7#sharding-by-hash-range) - 最后写成的解决冲突, [检测并发写入](/ch6#sec_replication_concurrent) - 无领导复制, [无主复制](/ch6#sec_replication_leaderless) - 轻量事务, [单对象写入](/ch8#sec_transactions_single_object) - 线性,缺少, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 日志结构存储, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 多区域支助, [多地区操作](/ch6#multi-region-operation) - 使用时钟, [仲裁一致性的局限](/ch6#sec_replication_quorum_limitations), [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 节点(硬化), [分片](/ch7#ch_sharding) - search engines(见 全文检索) - 搜索流, [在流上搜索](/ch12#id320) - 备库(见 基于领导者的复制) - 二级指数, [多列索引与二级索引](/ch4#sec_storage_index_multicolumn), [术语表](/glossary) - 多对多关系, [多对一与多对多关系](/ch3#sec_datamodels_many_to_many) - 双写问题, [保持系统同步](/ch12#sec_stream_sync), [理解数据流](/ch13#id443) - 分片, [分片与二级索引](/ch7#sec_sharding_secondary_indexes)-[全局二级索引](/ch7#id167), [总结](/ch7#summary) - 全球, [全局二级索引](/ch7#id167) - 指数维护, [维护派生状态](/ch13#id446) - 当地, [本地二级索引](/ch7#id166) - 更新、事务隔离和, [多对象事务的需求](/ch8#sec_transactions_need) - 二次排序, [JOIN 与 GROUP BY](/ch11#sec_batch_join) - sed (Unix 工具) (英语)., [简单日志分析](/ch11#sec_batch_log_analysis) - 自我托管, [云服务与自托管](/ch1#sec_introduction_cloud) - 数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses) - 自我欢乐, [本章小结](/ch12#id332) - 自动验证系统, [不要盲目信任承诺](/ch13#id364) - 语义搜索, [向量嵌入](/ch4#id92) - 语义相似性, [向量嵌入](/ch4#id92) - 语义网, [三元组存储与 SPARQL](/ch3#id59) - 半同步复制, [同步复制与异步复制](/ch6#sec_replication_sync_async) - 顺序写(访问模式), [顺序与随机写入](/ch4#sidebar_sequential) - 可串行化, [隔离性](/ch8#sec_transactions_acid_isolation), [弱隔离级别](/ch8#sec_transactions_isolation_levels), [可串行化](/ch8#sec_transactions_serializability)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation), [术语表](/glossary) - 线性比对, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 悲观与乐观的并发控制, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 序列执行, [实际串行执行](/ch8#sec_transactions_serial)-[串行执行总结](/ch8#summary-of-serial-execution) - 分片, [分片](/ch8#sharding) - 使用存储程序, [将事务封装在存储过程中](/ch8#encapsulating-transactions-in-stored-procedures), [使用共享日志](/ch10#sec_consistency_smr) - 可串行化快照隔离, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - detecting stale MVCC reads, [检测陈旧的 MVCC 读取](/ch8#detecting-stale-mvcc-reads) - 检测影响先前读取的写入, [检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 分布式执行, [可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - performance of SSI, [可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 防止写入skew, [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise)-[检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 严格的序列性, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 及时性与完整性, [及时性与完整性](/ch13#sec_future_integrity) - 两阶段锁定, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl)-[索引范围锁](/ch8#sec_transactions_2pl_range) - 索引范围锁定, [索引范围锁](/ch8#sec_transactions_2pl_range) - 性能, [两阶段锁定的性能](/ch8#performance-of-two-phase-locking) - 可串行化, [特定语言的格式](/ch5#id96) - 序列化, [编码数据的格式](/ch5#sec_encoding_formats) - (另见 编码) - 无服务器, [微服务与无服务器](/ch1#sec_introduction_microservices) - 服务发现, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery), [请求路由](/ch7#sec_sharding_routing), [服务发现](/ch10#service-discovery) - 登记, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - using DNS, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery), [请求路由](/ch7#sec_sharding_routing), [服务发现](/ch10#service-discovery) - 服务级别协议(SLA), [响应时间指标的应用](/ch2#sec_introduction_slo_sla), [描述负载](/ch2#id33) - 服务网格, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery) - Service Organization Control (SOC), [数据系统、法律与社会](/ch1#sec_introduction_compliance) - 服务时间, [延迟与响应时间](/ch2#id23) - 面向服务的体系结构, [微服务与无服务器](/ch1#sec_introduction_microservices) - (另见 services) - 服务, [流经服务的数据流:REST 与 RPC](/ch5#sec_encoding_dataflow_rpc)-[RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 微服务, [微服务与无服务器](/ch1#sec_introduction_microservices) - 各种服务的因果关系, [全序的限制](/ch13#id335) - 松耦合, [开展分拆工作](/ch13#sec_future_unbundling_favor) - 与批量/流程处理器的关系, [批处理](/ch11#ch_batch), [流处理器和服务](/ch13#id345) - remote procedure calls (RPCs), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc)-[RPC 的数据编码与演化](/ch5#data-encoding-and-evolution-for-rpc) - 问题, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - 与数据库相似, [流经服务的数据流:REST 与 RPC](/ch5#sec_encoding_dataflow_rpc) - 网络服务, [Web 服务](/ch5#sec_web_services) - 会话窗口(流处理), [窗口的类型](/ch12#id324) - (另见 windows) - 分片, [分片](/ch7#ch_sharding)-[总结](/ch7#summary), [术语表](/glossary) - 和共识, [使用共享日志](/ch10#sec_consistency_smr) - 复制, [分片](/ch7#ch_sharding) - 分散事务, [分布式事务](/ch8#sec_transactions_distributed) - 热的软糖, [键值数据的分片](/ch7#sec_sharding_key_value) - 分批处理, [批处理](/ch11#ch_batch) - 键程分割, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data) - 多硬性操作, [多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 执行限制, [多分区请求处理](/ch13#id360) - 二级指数维护, [维护派生状态](/ch13#id446) - 关键值数据, [键值数据的分片](/ch7#sec_sharding_key_value)-[偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 按密钥范围, [按键的范围分片](/ch7#sec_sharding_key_range) - 摇摆和热点, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 词源, [分片](/ch7#ch_sharding) - 分区键, [分片的利与弊](/ch7#sec_sharding_reasons), [键值数据的分片](/ch7#sec_sharding_key_value) - 再平衡 - 密钥范围压缩数据, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data) - 重新平衡困难, [重新平衡键范围分片数据](/ch7#rebalancing-key-range-sharded-data)-[运维:自动/手动再平衡](/ch7#sec_sharding_operations) - 自动或人工重新平衡, [运维:自动/手动再平衡](/ch7#sec_sharding_operations) - Hash mod N的问题, [哈希取模节点数](/ch7#hash-modulo-number-of-nodes) - 使用固定的碎片数, [固定数量的分片](/ch7#fixed-number-of-shards) - 使用 N 个节点, [按哈希范围分片](/ch7#sharding-by-hash-range) - 请求路由, [请求路由](/ch7#sec_sharding_routing)-[请求路由](/ch7#sec_sharding_routing) - 二级指数, [分片与二级索引](/ch7#sec_sharding_secondary_indexes)-[全局二级索引](/ch7#id167) - 全球, [全局二级索引](/ch7#id167) - 当地, [本地二级索引](/ch7#id166) - 连续执行事务和, [分片](/ch8#sharding) - 正在排序硬化数据, [混洗数据](/ch11#sec_shuffle) - 共享日志, [共识的实践](/ch10#sec_consistency_total_order)-[共识的利弊](/ch10#pros-and-cons-of-consensus), [全序的限制](/ch13#id335), [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 算法, [共识的实践](/ch10#sec_consistency_total_order) - 用于事件源代码, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 用于通讯, [基于日志的消息代理](/ch12#sec_stream_log)-[重播旧消息](/ch12#sec_stream_replay) - 与协商一致的关系, [共享日志作为共识](/ch10#sec_consistency_shared_logs) - 使用, [使用共享日志](/ch10#sec_consistency_smr) - 共享模式, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 共享磁盘架构, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing), [分布式文件系统](/ch11#sec_batch_dfs) - 共享内存架构, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing) - 共享- 无结构, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing), [术语表](/glossary) - 分布式文件系统, [分布式文件系统](/ch11#sec_batch_dfs) - (另见 distributed filesystems) - 网络的使用, [不可靠的网络](/ch9#sec_distributed_networks) - 鲨鱼 - 咬海底电缆, [实践中的网络故障](/ch9#sec_distributed_network_faults) - 计数(例), [文档的查询语言](/ch3#query-languages-for-documents) - shredding (deletion)(见 crypto-shredding) - 粉碎(专栏编码), [列式存储](/ch4#sec_storage_column) - 粉碎(相关模型), [何时使用哪种模型](/ch3#sec_datamodels_document_summary) - 混洗, [混洗数据](/ch11#sec_shuffle)-[混洗数据](/ch11#sec_shuffle) - 兄弟, [手动冲突解决](/ch6#manual-conflict-resolution), [捕获先发生关系](/ch6#capturing-the-happens-before-relationship), [冲突解决与复制](/ch8#conflict-resolution-and-replication) - (另见 conflicts) - 仓, [数据仓库](/ch1#sec_introduction_dwh) - 相似性搜索 - 编辑距离, [全文检索](/ch4#sec_storage_full_text) - 基因组数据, [总结](/ch3#summary) - 简单, [简单性:管理复杂度](/ch2#id38) - 歌手, [数据仓库](/ch1#sec_introduction_dwh) - single-instruction-multi-data (SIMD) instructions, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - single-leader replication(见 基于领导者的复制) - 单条执行, [原子写操作](/ch8#atomic-write-operations), [实际串行执行](/ch8#sec_transactions_serial) - 在溪流处理中, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [并发控制](/ch12#sec_stream_concurrency), [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - SingleStore(数据库) - 内存储, [全内存存储](/ch4#sec_storage_inmemory) - 工地可靠性工程师, [云时代的运维](/ch1#sec_introduction_operations) - 大小级紧凑, [压实策略](/ch4#sec_storage_lsm_compaction), [磁盘空间使用](/ch4#disk-space-usage) - 偏斜, [术语表](/glossary) - 时钟摇摆, [对同步时钟的依赖](/ch9#sec_distributed_clocks_relying)-[带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval), [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 事务隔离 - 读取偏差, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation), [总结](/ch8#summary) - 写偏差, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts), [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise)-[检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - (另见 写偏差) - 含义, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 不平衡的工作量, [键值数据的分片](/ch7#sec_sharding_key_value) - 补偿, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 由于名人, [偏斜的工作负载与缓解热点](/ch7#sec_sharding_skew) - 时间序列数据, [按键的范围分片](/ch7#sec_sharding_key_range) - 跳过列表, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 服务级别协议(见 服务级别协议) - Slack(分组聊天) - GraphQL example, [GraphQL](/ch3#id63) - SlateDB(数据库), [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [设置新的副本](/ch6#sec_replication_new_replica) - 滑动窗口(流处理), [窗口的类型](/ch12#id324) - (另见 windows) - 草率法定人数, [单主与无主复制的性能](/ch6#sec_replication_leaderless_perf) - 缓慢变化的维度, [连接的时间依赖性](/ch12#sec_stream_join_time) - 涂抹(倾斜秒调整), [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 快照(数据库) - 作为备份, [复制](/ch6#ch_replication) - 计算衍生数据, [创建索引](/ch13#id340) - 变化数据捕获中, [初始快照](/ch12#sec_stream_cdc_snapshot) - 可串行化快照隔离, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 新建复制品, [设置新的副本](/ch6#sec_replication_new_replica) - 快速隔离和可重复读取, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation)-[快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - implementing with MVCC, [多版本并发控制(MVCC)](/ch8#sec_transactions_snapshot_impl) - indexes and MVCC, [索引与快照隔离](/ch8#indexes-and-snapshot-isolation) - 可见度规则, [观察一致快照的可见性规则](/ch8#sec_transactions_mvcc_visibility) - 全球快照同步时钟, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - Snowflake(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native), [云服务的分层](/ch1#layering-of-cloud-services), [云数据仓库](/ch4#sec_cloud_data_warehouses), [批处理](/ch11#ch_batch) - 面向列的存储, [列式存储](/ch4#sec_storage_column) - 处理写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - 硬化和集群, [按哈希范围分片](/ch7#sharding-by-hash-range) - 雪园, [查询语言](/ch11#sec_batch_query_lanauges) - Snowflake (ID generator), [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - 雪花计划, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - SOAP (web services), [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - SOC2(见 Service Organization Control (SOC)) - 社会图表, [图数据模型](/ch3#sec_datamodels_graph) - 社会 - 的责任, [数据系统、法律与社会](/ch1#sec_introduction_compliance), [立法与自律](/ch14#sec_future_legislation) - 社会技术系统, [人类与可靠性](/ch2#id31) - 软件即服务(SaaS), [数据系统架构中的权衡](/ch1#ch_tradeoffs), [云服务与自托管](/ch1#sec_introduction_cloud) - ETL from, [数据仓库](/ch1#sec_introduction_dwh) - 多重租赁, [面向多租户的分片](/ch7#sec_sharding_multitenancy) - 软件错误, [软件故障](/ch2#software-faults) - 维护诚信, [维护完整性,尽管软件有Bug](/ch13#id455) - 太阳风暴, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - solid state drives (SSDs) - 访问模式, [顺序与随机写入](/ch4#sidebar_sequential) - 比较对象存储, [设置新的副本](/ch6#sec_replication_new_replica) - 侦查腐败, [端到端原则](/ch13#sec_future_e2e_argument), [不要盲目信任承诺](/ch13#id364) - 失败率, [硬件与软件故障](/ch2#sec_introduction_hardware_faults) - 错误在, [持久性](/ch8#durability) - 固件错误, [软件故障](/ch2#software-faults) - 读取吞吐量, [读取性能](/ch4#read-performance) - 顺序对随机写入, [顺序与随机写入](/ch4#sidebar_sequential) - Solr (搜索服务器) - 本地二级指数, [本地二级索引](/ch7#id166) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 使用 Lucene, [全文检索](/ch4#sec_storage_full_text) - 排序(Unix 工具), [简单日志分析](/ch11#sec_batch_log_analysis), [简单日志分析](/ch11#sec_batch_log_analysis), [排序与内存聚合](/ch11#id275), [分布式作业编排](/ch11#id278) - 排序归并连接(MapReduce), [JOIN 与 GROUP BY](/ch11#sec_batch_join) - Sorted String Tables(见 SSTables) - 排序 - 列存储中的排序顺序, [列存储中的排序顺序](/ch4#sort-order-in-column-storage) - 真相来源(权威数据源)(见 systems of record) - Spanner(数据库) - 一致性模式, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 数据位置, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 在云层中, [云原生系统架构](/ch1#sec_introduction_cloud_native) - 使用时钟快照隔离, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 事务, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - TrueTime API, [带置信区间的时钟读数](/ch9#clock-readings-with-a-confidence-interval) - Spark(处理框架), [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake), [云原生系统架构](/ch1#sec_introduction_cloud_native), [批处理](/ch11#ch_batch), [数据流引擎](/ch11#sec_batch_dataflow) - 成本效率, [查询语言](/ch11#sec_batch_query_lanauges) - DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes), [DataFrames](/ch11#id287) - 过失容忍, [故障处理](/ch11#id281) - 数据仓库, [云数据仓库](/ch4#sec_cloud_data_warehouses) - high availability using ZooKeeper, [协调服务](/ch10#sec_consistency_coordination) - MLlib, [机器学习](/ch11#id290) - 查询优化器, [查询语言](/ch11#sec_batch_query_lanauges) - 移动数据, [混洗数据](/ch11#sec_shuffle) - Spark Streaming, [流分析](/ch12#id318) - 微批次, [微批次与存档点](/ch12#id329) - streaming SQL support, [复合事件处理](/ch12#id317) - 用于 ETL, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - SPARQL(查询语言), [SPARQL 查询语言](/ch3#the-sparql-query-language) - 零星指数, [SSTable 文件格式](/ch4#the-sstable-file-format) - 稀疏矩阵, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 脑裂, [领导者故障:故障转移](/ch6#leader-failure-failover), [请求路由](/ch7#sec_sharding_routing), [术语表](/glossary) - 执行限制, [唯一性约束需要达成共识](/ch13#id452) - 在共识算法中, [共识](/ch10#sec_consistency_consensus), [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 预防, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 使用栅栏标志来避免, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens)-[多副本隔离](/ch9#fencing-with-multiple-replicas) - 现场实例, [故障处理](/ch11#id281) - 电子表格, [数据系统架构中的权衡](/ch1#ch_tradeoffs), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 数据流编程, [围绕数据流设计应用](/ch13#sec_future_dataflow) - 枢轴表, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - SQL (Structured Query Language), [简单性:管理复杂度](/ch2#id38), [关系模型与文档模型](/ch3#sec_datamodels_history), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 用于分析, [数据仓库](/ch1#sec_introduction_dwh), [列式存储](/ch4#sec_storage_column) - 图表查询, [SQL 中的图查询](/ch3#id58) - 隔离级别标准,问题, [快照隔离、可重复读和命名混淆](/ch8#snapshot-isolation-repeatable-read-and-naming-confusion) - 加入, [规范化、反规范化与连接](/ch3#sec_datamodels_normalization) - 简历(例), [用于一对多关系的文档数据模型](/ch3#the-document-data-model-for-one-to-many-relationships) - 社会网络家庭时间表(例), [表示用户、帖子与关注关系](/ch2#id20) - SQL injection vulnerability, [拜占庭故障](/ch9#sec_distributed_byzantine) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) - 存储程序, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 批次处理框架中的支持, [批处理](/ch11#ch_batch) - 视图, [Datalog:递归关系查询](/ch3#id62) - SQL Server(数据库) - archiving WAL to object stores, [设置新的副本](/ch6#sec_replication_new_replica) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307) - 数据存储支持, [分析型数据存储](/ch4#sec_storage_analytics) - 分布式事务支持, [XA 事务](/ch8#xa-transactions) - 基于领导者的复制, [单主复制](/ch6#sec_replication_leader) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 防止丢失更新, [自动检测丢失的更新](/ch8#automatically-detecting-lost-updates) - 防止写入skew, [写偏差的特征](/ch8#characterizing-write-skew), [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 读作承诺隔离, [实现读已提交](/ch8#sec_transactions_read_committed_impl) - 可序列隔离, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - T-SQL language, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - SQLite(数据库), [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems), [压实策略](/ch4#sec_storage_lsm_compaction) - archiving WAL to object stores, [设置新的副本](/ch6#sec_replication_new_replica) - SRE (site reliability engineer), [云时代的运维](/ch1#sec_introduction_operations) - SSDs(见 solid state drives) - SSTables (storage format), [SSTable 文件格式](/ch4#the-sstable-file-format)-[压实策略](/ch4#sec_storage_lsm_compaction) - 建造和维护, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - making LSM-Tree from, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 阶段发布(见 rolling upgrades) - 停滞(旧数据), [读己之写](/ch6#sec_replication_ryw) - 跨渠道时间依赖性, [跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - 无头数据库中, [当节点故障时写入数据库](/ch6#id287) - 多转换并发控制, [检测陈旧的 MVCC 读取](/ch8#detecting-stale-mvcc-reads) - 监测, [监控陈旧性](/ch6#monitoring-staleness) - 客户端状态, [将状态变更推送给客户端](/ch13#id348) - 相对线性, [线性一致性](/ch10#sec_consistency_linearizability) - 相对于及时性, [及时性与完整性](/ch13#sec_future_integrity) - standbys(见 基于领导者的复制) - 恒星复制地形, [多主复制拓扑](/ch6#sec_replication_topologies) - 恒星计划, [星型与雪花型:分析模式](/ch3#sec_datamodels_analytics)-[星型与雪花型:分析模式](/ch3#sec_datamodels_analytics) - 星球大战类比(事件时间与处理时间), [事件时间与处理时间](/ch12#id322) - 饥饿(时间安排), [资源分配](/ch11#id279) - 国家 - 从不可改变事件日志中得出, [状态、流和不变性](/ch12#sec_stream_immutability) - 状态变化与应用程序代码之间的相互作用, [数据流:应用代码与状态变化的交互](/ch13#id450) - 保持衍生状态, [维护派生状态](/ch13#id446) - 由流处理器在流-流连接中维护, [流流连接(窗口连接)](/ch12#id440) - 观察导出状态, [观察派生数据状态](/ch13#sec_future_observing)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 流处理器失败后重建, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 应用代码和, [应用代码和状态的分离](/ch13#id344) - 状态机复制, [基于语句的复制](/ch6#statement-based-replication), [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs), [使用共享日志](/ch10#sec_consistency_smr), [数据库与流](/ch12#sec_stream_databases) - 事件溯源, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 无国籍人制度, [数据系统架构中的权衡](/ch1#ch_tradeoffs) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - 静态输入语言 - 类比于图案, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - 统计和数字算法, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - StatsD (metrics aggregator), [直接从生产者传递给消费者](/ch12#id296) - 股票市场饲料, [直接从生产者传递给消费者](/ch12#id296) - 爆彼之头, [领导者故障:故障转移](/ch6#leader-failure-failover) - 问题, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - 停止所有处理(见 garbage collection) - 存储 - 构建数据存储技术, [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - 存储区网络, [共享内存、共享磁盘与无共享架构](/ch2#sec_introduction_shared_nothing), [分布式文件系统](/ch11#sec_batch_dfs) - 存储引擎, [存储与检索](/ch4#ch_storage)-[总结](/ch4#summary) - 面向列, [列式存储](/ch4#sec_storage_column)-[查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 列压缩, [列压缩](/ch4#sec_storage_column_compression)-[列压缩](/ch4#sec_storage_column_compression) - 定义, [列式存储](/ch4#sec_storage_column) - 公园, [云数据仓库](/ch4#sec_cloud_data_warehouses), [列式存储](/ch4#sec_storage_column), [归档存储](/ch5#archival-storage) - 排序在, [列存储中的排序顺序](/ch4#sort-order-in-column-storage)-[列存储中的排序顺序](/ch4#sort-order-in-column-storage) - 宽柱型, [列压缩](/ch4#sec_storage_column_compression) - 写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - 内存储, [全内存存储](/ch4#sec_storage_inmemory) - 持久性, [持久性](/ch8#durability) - 面向行, [OLTP 系统的存储与索引](/ch4#sec_storage_oltp)-[全内存存储](/ch4#sec_storage_inmemory) - B树, [B 树](/ch4#sec_storage_b_trees)-[B 树变体](/ch4#b-tree-variants) - comparing B-trees and LSM-trees, [比较 B 树与 LSM 树](/ch4#sec_storage_btree_lsm_comparison)-[磁盘空间使用](/ch4#disk-space-usage) - 定义, [列式存储](/ch4#sec_storage_column) - 日志结构, [日志结构存储](/ch4#sec_storage_log_structured)-[压实策略](/ch4#sec_storage_lsm_compaction) - 存储程序, [将事务封装在存储过程中](/ch8#encapsulating-transactions-in-stored-procedures)-[存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs), [术语表](/glossary) - 和共享日志, [使用共享日志](/ch10#sec_consistency_smr) - 利弊因素, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 类似于流处理器, [应用代码作为派生函数](/ch13#sec_future_dataflow_derivation) - 风暴(流处理器), [流分析](/ch12#id318) - distributed RPC, [事件驱动架构与 RPC](/ch12#sec_stream_actors_drpc), [多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 三叉戟状态处理, [幂等性](/ch12#sec_stream_idempotence) - 斜拉机事件, [处理滞留事件](/ch12#id323) - Stream Control Transmission Protocol (SCTP), [TCP 的局限性](/ch9#sec_distributed_tcp) - 流处理, [流处理](/ch12#sec_stream_processing)-[本章小结](/ch12#id332), [术语表](/glossary) - 在工作范围内获得外部服务, [流表连接(流扩充)](/ch12#sec_stream_table_joins), [微批次与存档点](/ch12#id329), [幂等性](/ch12#sec_stream_idempotence), [恰好执行一次操作](/ch13#id353) - 与批量处理相结合, [统一批处理和流处理](/ch13#id338) - 与批量处理的比较, [流处理](/ch12#sec_stream_processing) - 复合事件处理, [复合事件处理](/ch12#id317) - 过失容忍, [容错](/ch12#sec_stream_fault_tolerance)-[失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 原子提交, [原子提交再现](/ch12#sec_stream_atomic_commit) - 幂等性, [幂等性](/ch12#sec_stream_idempotence) - 微打斗和检查站, [微批次与存档点](/ch12#id329) - 失败后重建状态, [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 数据整合, [批处理与流处理](/ch13#sec_future_batch_streaming)-[统一批处理和流处理](/ch13#id338) - 用于事件源代码, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 保持衍生状态, [维护派生状态](/ch13#id446) - 维持实际意见, [维护物化视图](/ch12#sec_stream_mat_view) - messaging systems(见 messaging systems) - 关于时间的推理, [时间推理](/ch12#sec_stream_time)-[窗口的类型](/ch12#id324) - 事件时间与处理时间, [事件时间与处理时间](/ch12#id322), [微批次与存档点](/ch12#id329), [统一批处理和流处理](/ch13#id338) - 知道窗口何时准备好, [处理滞留事件](/ch12#id323) - 窗口类型, [窗口的类型](/ch12#id324) - relation to databases(见 streams) - 与服务的关系, [流处理器和服务](/ch13#id345) - 与批次处理的关系, [批处理](/ch11#ch_batch) - 在流中搜索, [在流上搜索](/ch12#id320) - 单条执行, [日志与传统的消息传递相比](/ch12#sec_stream_logs_vs_messaging), [并发控制](/ch12#sec_stream_concurrency) - 流式分析, [流分析](/ch12#id318) - 串流连接, [流连接](/ch12#sec_stream_joins)-[连接的时间依赖性](/ch12#sec_stream_join_time) - 串流流连接, [流流连接(窗口连接)](/ch12#id440) - 串行表连接, [流表连接(流扩充)](/ch12#sec_stream_table_joins) - 表格连接, [表表连接(维护物化视图)](/ch12#id326) - 时间的依赖性, [连接的时间依赖性](/ch12#sec_stream_join_time) - 流程, [流处理](/ch12#ch_stream)-[重播旧消息](/ch12#sec_stream_replay) - 端对端,向客户推进事件, [端到端的事件流](/ch13#id349) - messaging systems(见 messaging systems) - processing(见 流处理) - 与数据库的关系, [数据库与流](/ch12#sec_stream_databases)-[不变性的局限性](/ch12#sec_stream_immutability_limitations) - (另见 changelogs) - 变更流的 API 支持, [变更流的 API 支持](/ch12#sec_stream_change_api) - 数据变更捕获, [数据变更捕获](/ch12#sec_stream_cdc)-[变更流的 API 支持](/ch12#sec_stream_change_api) - 按时间分列的状态衍生物, [状态、流和不变性](/ch12#sec_stream_immutability) - 事件溯源, [数据变更捕获与事件溯源](/ch12#sec_stream_event_sourcing) - 保持系统同步, [保持系统同步](/ch12#sec_stream_sync)-[保持系统同步](/ch12#sec_stream_sync) - 不可改变事件哲学, [状态、流和不变性](/ch12#sec_stream_immutability)-[不变性的局限性](/ch12#sec_stream_immutability_limitations) - 专题, [传递事件流](/ch12#sec_stream_transmit) - 严格的序列性, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 及时性与完整性, [及时性与完整性](/ch13#sec_future_integrity) - 条纹(列编码), [列式存储](/ch4#sec_storage_column) - 强一致性(见 线性一致性) - 最终的一致性, [自动冲突解决](/ch6#automatic-conflict-resolution) - 强烈的单份序列性, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 主题、上游和物体(三层), [三元组存储与 SPARQL](/ch3#id59) - 订阅者, [传递事件流](/ch12#sec_stream_transmit) - (另见 consumers) - 超级计算机, [云计算与超级计算](/ch1#id17) - Superset(数据可视化软件), [分析(Analytics)](/ch11#sec_batch_olap) - 监视, [监视](/ch14#id374) - (另见 隐私) - 寿司原则, [从数据仓库到数据湖](/ch1#from-data-warehouse-to-data-lake) - 可持续性, [分布式与单节点系统](/ch1#sec_introduction_distributed) - Swagger(服务定义格式), [Web 服务](/ch5#sec_web_services) - swapping to disk(见 virtual memory) - Swift(编程语言) - 内存管理, [限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - 同步引擎, [同步引擎与本地优先软件](/ch6#sec_replication_offline_clients)-[同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 实例, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 用于本地第一软件, [实时协作、离线优先和本地优先应用](/ch6#real-time-collaboration-offline-first-and-local-first-apps) - 同步网络, [同步与异步网络](/ch9#sec_distributed_sync_networks), [术语表](/glossary) - 比较同步网络, [同步与异步网络](/ch9#sec_distributed_sync_networks) - 系统模型, [系统模型与现实](/ch9#sec_distributed_system_model) - 同步复制, [同步复制与异步复制](/ch6#sec_replication_sync_async), [术语表](/glossary) - 有多个领导, [多主复制](/ch6#sec_replication_multi_leader) - 系统管理员, [云时代的运维](/ch1#sec_introduction_operations) - 系统模型, [知识、真相和谎言](/ch9#sec_distributed_truth), [系统模型与现实](/ch9#sec_distributed_system_model)-[确定性模拟测试](/ch9#deterministic-simulation-testing) - 假设, [信任但验证](/ch13#sec_future_verification) - 算法的正确性, [定义算法的正确性](/ch9#defining-the-correctness-of-an-algorithm) - 绘制真实世界的地图, [将系统模型映射到现实世界](/ch9#mapping-system-models-to-the-real-world) - 安全和生活, [安全性与活性](/ch9#sec_distributed_safety_liveness) - 记录系统, [记录系统与派生数据](/ch1#sec_introduction_derived), [术语表](/glossary) - 数据变更捕获, [数据变更捕获的实现](/ch12#id307), [理解数据流](/ch13#id443) - 事件日志, [事件溯源与 CQRS](/ch3#sec_datamodels_events) - 事件日志处理为, [状态、流和不变性](/ch12#sec_stream_immutability) - 系统思维, [反馈回路](/ch14#id372) ### T - t- digest(算法), [响应时间指标的应用](/ch2#sec_introduction_slo_sla) - 表格连接, [表表连接(维护物化视图)](/ch12#id326) - Tableau(数据可视化软件), [事务处理与分析的特征](/ch1#sec_introduction_oltp), [分析(Analytics)](/ch11#sec_batch_olap) - 尾巴 (Unix 工具), [使用日志进行消息存储](/ch12#id300) - tail latency(见 延迟) - 尾顶(财产图), [属性图](/ch3#id56) - task (workflows)(见 workflow engines) - TCP (Transmission Control Protocol), [TCP 的局限性](/ch9#sec_distributed_tcp) - 比较电路切换, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - comparison to UDP, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 连接失败, [检测故障](/ch9#id307) - 流量控制, [网络拥塞和排队](/ch9#network-congestion-and-queueing), [消息传递系统](/ch12#sec_stream_messaging) - 包检查和, [弱形式的谎言](/ch9#weak-forms-of-lying), [端到端原则](/ch13#sec_future_e2e_argument), [信任但验证](/ch13#sec_future_verification) - 可靠性和重复压制, [抑制重复](/ch13#id354) - 转发超时, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 用于事务会话, [单对象与多对象操作](/ch8#sec_transactions_multi_object) - 时间(工作流程引擎), [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - Tensorflow (机器学习图书馆), [机器学习](/ch11#id290) - Teradata(数据库), [云原生系统架构](/ch1#sec_introduction_cloud_native), [云数据仓库](/ch4#sec_cloud_data_warehouses) - term-partitioned indexes(见 global secondary indexes) - 终止(协商一致), [单值共识](/ch10#single-value-consensus), [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - 测试, [人类与可靠性](/ch2#id31) - 击打(内存断), [进程暂停](/ch9#sec_distributed_clocks_pauses) - 线程(并发) - Actor 模型, [分布式 actor 框架](/ch5#distributed-actor-frameworks), [事件驱动架构与 RPC](/ch12#sec_stream_actors_drpc) - (另见 event-driven architecture) - 原子操作, [原子性](/ch8#sec_transactions_acid_atomicity) - 背景线程, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables) - 执行暂停, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable), [进程暂停](/ch9#sec_distributed_clocks_pauses)-[进程暂停](/ch9#sec_distributed_clocks_pauses) - 内存障碍, [线性一致性与网络延迟](/ch10#linearizability-and-network-delays) - 预设, [进程暂停](/ch9#sec_distributed_clocks_pauses) - single(见 single-threaded execution) - 三阶段承诺, [三阶段提交](/ch8#three-phase-commit) - 三方关系, [属性图](/ch3#id56) - Thrift(数据格式), [Protocol Buffers](/ch5#sec_encoding_protobuf) - 吞吐量, [描述性能](/ch2#sec_introduction_percentiles), [描述负载](/ch2#id33), [批处理](/ch11#ch_batch) - TIBCO, [消息代理](/ch5#message-brokers) - Enterprise Message Service, [消息代理与数据库的对比](/ch12#id297) - StreamBase (stream analytics), [复合事件处理](/ch12#id317) - TiDB(数据库) - 基于共识的复制, [单主复制](/ch6#sec_replication_leader) - 区域(硬化), [分片](/ch7#ch_sharding) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 服务衍生数据, [对外提供派生数据](/ch11#sec_batch_serving_derived) - 硬化二级指数, [全局二级索引](/ch7#id167) - 快速隔离支持, [快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 时间戳, [实现线性一致的 ID 生成器](/ch10#implementing-a-linearizable-id-generator) - 事务, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - 使用模型检查, [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 分层存储, [设置新的副本](/ch6#sec_replication_new_replica), [磁盘空间使用](/ch12#sec_stream_disk_usage) - TigerBeetle(数据库), [总结](/ch3#summary) - 确定性模拟测试, [确定性模拟测试](/ch9#deterministic-simulation-testing) - TigerGraph(数据库) - GSQL language, [SQL 中的图查询](/ch3#id58) - Tigris(对象存储), [分布式文件系统](/ch11#sec_batch_dfs) - TileDB(数据库), [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 时间 - 并发与, ["先发生"关系与并发](/ch6#sec_replication_happens_before) - 跨渠道时间依赖性, [跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - 在分布式系统中, [不可靠的时钟](/ch9#sec_distributed_clocks)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - (另见 clocks) - 时钟同步和准确性, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 依赖同步时钟, [对同步时钟的依赖](/ch9#sec_distributed_clocks_relying)-[用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 进程暂停, [进程暂停](/ch9#sec_distributed_clocks_pauses)-[限制垃圾回收的影响](/ch9#sec_distributed_gc_impact) - 流程处理器中的推理, [时间推理](/ch12#sec_stream_time)-[窗口的类型](/ch12#id324) - 事件时间与处理时间, [事件时间与处理时间](/ch12#id322), [微批次与存档点](/ch12#id329), [统一批处理和流处理](/ch13#id338) - 知道窗口何时准备好, [处理滞留事件](/ch12#id323) - 事件的时间戳, [你用的是谁的时钟?](/ch12#id438) - 窗口类型, [窗口的类型](/ch12#id324) - 分布式系统的系统模型, [系统模型与现实](/ch9#sec_distributed_system_model) - 串流中的时间依赖, [连接的时间依赖性](/ch12#sec_stream_join_time) - 时间序列数据 - as DataFrames, [数据框、矩阵与数组](/ch3#sec_datamodels_dataframes) - 面向列的存储, [列式存储](/ch4#sec_storage_column) - 每日时钟, [日历时钟](/ch9#time-of-day-clocks) - 混合逻辑时钟, [混合逻辑时钟](/ch10#hybrid-logical-clocks) - 及时性, [及时性与完整性](/ch13#sec_future_integrity) - 协调-避免数据系统, [无协调数据系统](/ch13#id454) - 数据流系统的正确性, [数据流系统的正确性](/ch13#id453) - 超时, [不可靠的网络](/ch9#sec_distributed_networks), [术语表](/glossary) - 动态配置, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 失败, [领导者故障:故障转移](/ch6#leader-failure-failover) - 长度, [超时和无界延迟](/ch9#sec_distributed_queueing) - TimescaleDB(数据库), [列式存储](/ch4#sec_storage_column) - 时间戳, [逻辑时钟](/ch10#sec_consistency_timestamps) - 指定流处理中的事件, [你用的是谁的时钟?](/ch12#id438) - 读后写入一致性, [读己之写](/ch6#sec_replication_ryw) - 用于事务命令, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) - 执行制约因素不足, [使用逻辑时钟强制约束](/ch10#enforcing-constraints-using-logical-clocks) - 密钥范围, [按键的范围分片](/ch7#sec_sharding_key_range) - 兰波特, [Lamport 时间戳](/ch10#lamport-timestamps) - 逻辑, [排序事件以捕获因果关系](/ch13#sec_future_capture_causality) - 命令事件, [用于事件排序的时间戳](/ch9#sec_distributed_lww) - 时间戳, [实现线性一致的 ID 生成器](/ch10#implementing-a-linearizable-id-generator) - TLA+ (specification language), [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 符号桶(限制重试), [描述性能](/ch2#sec_introduction_percentiles) - 墓碑, [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [磁盘空间使用](/ch4#disk-space-usage), [日志压缩](/ch12#sec_stream_log_compaction) - 专题(信息), [消息代理](/ch5#message-brokers), [传递事件流](/ch12#sec_stream_transmit) - 撕裂的页面(B- 树), [使 B 树可靠](/ch4#sec_storage_btree_wal) - 全序, [术语表](/glossary) - broadcast(见 shared logs) - 限制, [全序的限制](/ch13#id335) - 在逻辑时间戳上, [逻辑时钟](/ch10#sec_consistency_timestamps) - 追踪, [分布式系统的问题](/ch1#sec_introduction_dist_sys_problems) - 跟踪行为数据, [隐私与追踪](/ch14#id373) - (另见 隐私) - 权衡, [数据系统架构中的权衡](/ch1#ch_tradeoffs)-[数据系统、法律与社会](/ch1#sec_introduction_compliance) - transaction coordinator(见 协调者) - transaction manager(见 协调者) - 事务处理, [事务处理与分析的特征](/ch1#sec_introduction_oltp)-[事务处理与分析的特征](/ch1#sec_introduction_oltp) - 与分析的比较, [事务处理与分析的特征](/ch1#sec_introduction_oltp) - 与数据存储的比较, [分析型数据存储](/ch4#sec_storage_analytics) - 事务, [事务](/ch8#ch_transactions)-[总结](/ch8#summary), [术语表](/glossary) - ACID properties of, [ACID 的含义](/ch8#sec_transactions_acid) - 原子性, [原子性](/ch8#sec_transactions_acid_atomicity) - 一致性, [一致性](/ch8#sec_transactions_acid_consistency) - 持久性, [使 B 树可靠](/ch4#sec_storage_btree_wal), [持久性](/ch8#durability) - 隔离性, [隔离性](/ch8#sec_transactions_acid_isolation) - 数据完整性, [及时性与完整性](/ch13#sec_future_integrity) - 复制, [复制延迟的解决方案](/ch6#id131) - compensating(见 compensating transactions) - 概念, [事务到底是什么?](/ch8#sec_transactions_overview) - 分布式事务, [分布式事务](/ch8#sec_transactions_distributed)-[再谈恰好一次消息处理](/ch8#exactly-once-message-processing-revisited) - 避开, [派生数据与分布式事务](/ch13#sec_future_derived_vs_transactions), [开展分拆工作](/ch13#sec_future_unbundling_favor), [强制约束](/ch13#sec_future_constraints)-[无协调数据系统](/ch13#id454) - 失败放大, [维护派生状态](/ch13#id446) - 已磨损的系统, [分片的利与弊](/ch7#sec_sharding_reasons) - 可疑/不确定状况, [协调器故障](/ch8#coordinator-failure), [存疑时持有锁](/ch8#holding-locks-while-in-doubt) - 两阶段提交, [两阶段提交(2PC)](/ch8#sec_transactions_2pc)-[三阶段提交](/ch8#three-phase-commit) - 使用, [跨不同系统的分布式事务](/ch8#sec_transactions_xa)-[恰好一次消息处理](/ch8#sec_transactions_exactly_once) - XA 事务, [XA 事务](/ch8#xa-transactions)-[XA 事务的问题](/ch8#problems-with-xa-transactions) - OLTP versus analytics queries, [分析(Analytics)](/ch11#sec_batch_olap) - 目标, [事务](/ch8#ch_transactions) - 可串行化, [可串行化](/ch8#sec_transactions_serializability)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 实际执行, [实际串行执行](/ch8#sec_transactions_serial)-[串行执行总结](/ch8#summary-of-serial-execution) - 悲观与乐观的并发控制, [悲观并发控制与乐观并发控制](/ch8#pessimistic-versus-optimistic-concurrency-control) - 可串行化快照隔离, [可串行化快照隔离(SSI)](/ch8#sec_transactions_ssi)-[可串行化快照隔离的性能](/ch8#performance-of-serializable-snapshot-isolation) - 两阶段锁定, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl)-[索引范围锁](/ch8#sec_transactions_2pl_range) - 单对象和多对象, [单对象与多对象操作](/ch8#sec_transactions_multi_object)-[处理错误和中止](/ch8#handling-errors-and-aborts) - 处理错误和中止, [处理错误和中止](/ch8#handling-errors-and-aborts) - 多对象事务的需要, [多对象事务的需求](/ch8#sec_transactions_need) - 单对象写入, [单对象写入](/ch8#sec_transactions_single_object) - 快照隔离(见 snapshots) - 严格的序列性, [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition) - 薄弱的隔离水平, [弱隔离级别](/ch8#sec_transactions_isolation_levels)-[物化冲突](/ch8#materializing-conflicts) - 防止丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update)-[冲突解决与复制](/ch8#conflict-resolution-and-replication) - 读已提交, [读已提交](/ch8#sec_transactions_read_committed)-[快照隔离与可重复读](/ch8#sec_transactions_snapshot_isolation) - 曲线(图), [属性图](/ch3#id56) - 三(数据结构), [构建和合并 SSTable](/ch4#constructing-and-merging-sstables), [全文检索](/ch4#sec_storage_full_text) - as SSTable index, [SSTable 文件格式](/ch4#the-sstable-file-format) - 触发器(数据库), [传递事件流](/ch12#sec_stream_transmit) - Trino(数据仓库), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 联邦数据库, [一切的元数据库](/ch13#id341) - 查询优化器, [查询语言](/ch11#sec_batch_query_lanauges) - 用于 ETL, [提取-转换-加载(ETL)](/ch11#sec_batch_etl_usage) - 工作流程示例, [工作流调度](/ch11#sec_batch_workflows) - 三层, [三元组存储与 SPARQL](/ch3#id59)-[SPARQL 查询语言](/ch3#the-sparql-query-language) - SPARQL 查询语言, [SPARQL 查询语言](/ch3#the-sparql-query-language) - 翻转窗口(流处理), [窗口的类型](/ch12#id324) - (另见 windows) - 在微战斗中, [微批次与存档点](/ch12#id329) - Turbopuffer(种子搜索) Name, [设置新的副本](/ch6#sec_replication_new_replica) - Turtle (RDF data format), [三元组存储与 SPARQL](/ch3#id59) - Twitter(见 X (social network)) - 两阶段提交, [两阶段提交(2PC)](/ch8#sec_transactions_2pc)-[协调器故障](/ch8#coordinator-failure), [术语表](/glossary) - 与双相锁定混淆, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl) - 协调员失败, [协调器故障](/ch8#coordinator-failure) - 协调员恢复, [从协调器故障中恢复](/ch8#recovering-from-coordinator-failure) - 如何运作, [系统性的承诺](/ch8#a-system-of-promises) - 绩效成本, [跨不同系统的分布式事务](/ch8#sec_transactions_xa) - problems with XA transactions, [XA 事务的问题](/ch8#problems-with-xa-transactions) - 持有锁定的事务, [存疑时持有锁](/ch8#holding-locks-while-in-doubt) - 两阶段锁定, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl)-[索引范围锁](/ch8#sec_transactions_2pl_range), [什么使系统具有线性一致性?](/ch10#sec_consistency_lin_definition), [术语表](/glossary) - 与两阶段提交混淆, [两阶段锁定(2PL)](/ch8#sec_transactions_2pl) - 增长和缩小阶段, [两阶段锁定的实现](/ch8#implementation-of-two-phase-locking) - 索引范围锁定, [索引范围锁](/ch8#sec_transactions_2pl_range) - 业绩, [两阶段锁定的性能](/ch8#performance-of-two-phase-locking) - 类型检查,动态对静态, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) ### U - UDP (User Datagram Protocol) - comparison to TCP, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 多广播, [直接从生产者传递给消费者](/ch12#id296) - 终极在线(游戏), [分片](/ch7#ch_sharding) - 未绑定的数据集, [流处理](/ch12#ch_stream), [术语表](/glossary) - (另见 streams) - 无限制的延误, [术语表](/glossary) - 在网络中, [超时和无界延迟](/ch9#sec_distributed_queueing) - 进程暂停, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 解析数据库, [分拆数据库](/ch13#sec_future_unbundling)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 构建数据存储技术, [组合使用数据存储技术](/ch13#id447)-[分拆系统与集成系统](/ch13#id448) - 联邦制与拆分制, [一切的元数据库](/ch13#id341) - 围绕数据流设计应用程序, [围绕数据流设计应用](/ch13#sec_future_dataflow)-[流处理器和服务](/ch13#id345) - 观察导出状态, [观察派生数据状态](/ch13#sec_future_observing)-[多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 实现视图和缓存, [物化视图和缓存](/ch13#id451) - 多硬数据处理, [多分区数据处理](/ch13#sec_future_unbundled_multi_shard) - 推动客户端更改状态, [将状态变更推送给客户端](/ch13#id348) - uncertain (transaction status)(见 存疑) - 联盟类型(在 Avro), [模式演化规则](/ch5#schema-evolution-rules) - uniq(Unix 工具), [简单日志分析](/ch11#sec_batch_log_analysis), [简单日志分析](/ch11#sec_batch_log_analysis), [分布式作业编排](/ch11#id278) - 独特性限制 - 同步检查, [宽松地解释约束](/ch13#id362) - 需要协商一致, [唯一性约束需要达成共识](/ch13#id452) - 需要线性, [约束与唯一性保证](/ch10#sec_consistency_uniqueness) - 以日志为基础的信件中的独特性, [基于日志消息传递中的唯一性](/ch13#sec_future_uniqueness_log) - 团结(数据目录), [云数据仓库](/ch4#sec_cloud_data_warehouses) - universally unique identifiers(见 UUIDs) - unix 哲学 - 比较关系数据库, [分拆数据库](/ch13#sec_future_unbundling), [一切的元数据库](/ch13#id341) - 与流处理的比较, [流处理](/ch12#sec_stream_processing) - unix 管道, [简单日志分析](/ch11#sec_batch_log_analysis) - 与分布式批量处理相比, [工作流调度](/ch11#sec_batch_workflows) - UPDATE statement (SQL), [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - 更新 - 防止丢失更新, [防止丢失更新](/ch8#sec_transactions_lost_update)-[冲突解决与复制](/ch8#conflict-resolution-and-replication) - 原子写入操作, [原子写操作](/ch8#atomic-write-operations) - 自动检测丢失的更新, [自动检测丢失的更新](/ch8#automatically-detecting-lost-updates) - 比较和设置, [条件写入(比较并设置)](/ch8#sec_transactions_compare_and_set) - 冲突解决和推广, [冲突解决与复制](/ch8#conflict-resolution-and-replication) - 使用明确的锁定, [显式锁定](/ch8#explicit-locking) - 防止写入skew, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts) - 使用量 - 批量过程调度, [资源分配](/ch11#id279) - 通过预设增加, [故障处理](/ch11#id281) - 与暂时取舍, [我们不能简单地使网络延迟可预测吗?](/ch9#can-we-not-simply-make-network-delays-predictable) - uTP protocol (BitTorrent), [TCP 的局限性](/ch9#sec_distributed_tcp) - UUIDs, [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) ### V - 有效性(协商一致), [单值共识](/ch10#single-value-consensus), [原子提交作为共识](/ch10#atomic-commitment-as-consensus) - vBuckets(硬化), [分片](/ch7#ch_sharding) - 矢量时钟, [版本向量](/ch6#version-vectors) - (另见 版本向量) - 和 Lamport/hybrid 逻辑钟, [Lamport/混合逻辑时钟 vs. 向量时钟](/ch10#lamporthybrid-logical-clocks-vs-vector-clocks) - 和版本向量, [版本向量](/ch6#version-vectors) - 向量嵌入, [向量嵌入](/ch4#id92) - 矢量处理, [查询执行:编译与向量化](/ch4#sec_storage_vectorized) - 供应商锁定, [云服务的利弊](/ch1#sec_introduction_cloud_tradeoffs) - Venice(数据库), [对外提供派生数据](/ch11#sec_batch_serving_derived) - 核查, [信任但验证](/ch13#sec_future_verification)-[用于可审计数据系统的工具](/ch13#id366) - 避免盲目信任, [不要盲目信任承诺](/ch13#id364) - 设计可审计性, [为可审计性而设计](/ch13#id365) - 端对端完整性检查, [端到端原则重现](/ch13#id456) - 可审计数据系统工具, [用于可审计数据系统的工具](/ch13#id366) - 版本控制系统 - 合并冲突, [手动冲突解决](/ch6#manual-conflict-resolution) - 依赖不可改变的数据, [并发控制](/ch12#sec_stream_concurrency) - 版本向量, [不同拓扑的问题](/ch6#problems-with-different-topologies), [版本向量](/ch6#version-vectors) - 点数, [版本向量](/ch6#version-vectors) - 对向量时钟, [版本向量](/ch6#version-vectors) - Vertica(数据库), [云数据仓库](/ch4#sec_cloud_data_warehouses) - 处理写入, [写入列式存储](/ch4#writing-to-column-oriented-storage) - vertical scaling(见 scaling up) - 顶点(图), [图数据模型](/ch3#sec_datamodels_graph) - 属性图模型, [属性图](/ch3#id56) - 电子游戏, [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - 视频转码(例如), [跨通道时序依赖](/ch10#cross-channel-timing-dependencies) - views (SQL queries), [Datalog:递归关系查询](/ch3#id62) - materialized views(见 物化) - 视图戳复制, [共识](/ch10#sec_consistency_consensus), [共识的实践](/ch10#sec_consistency_total_order) - 使用模型检查, [模型检查与规范语言](/ch9#model-checking-and-specification-languages) - 视图编号, [从单主复制到共识](/ch10#from-single-leader-replication-to-consensus) - 虚拟块设备, [存储与计算的分离](/ch1#sec_introduction_storage_compute) - 虚拟文件系统, [分布式文件系统](/ch11#sec_batch_dfs) - 比较分布式文件系统, [分布式文件系统](/ch11#sec_batch_dfs) - 虚拟机, [云服务的分层](/ch1#layering-of-cloud-services) - 上下文开关, [进程暂停](/ch9#sec_distributed_clocks_pauses) - 网络性能, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 吵闹的邻居, [网络拥塞和排队](/ch9#network-congestion-and-queueing) - 虚拟时钟在, [时钟同步和准确性](/ch9#sec_distributed_clock_accuracy) - 虚拟内存 - 因页面错误造成的进程暂停, [延迟与响应时间](/ch2#id23), [进程暂停](/ch9#sec_distributed_clocks_pauses) - Virtuoso(数据库), [SPARQL 查询语言](/ch3#the-sparql-query-language) - VisiCalc (spreadsheets), [围绕数据流设计应用](/ch13#sec_future_dataflow) - Vitess(数据库) - 键程硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 节点(硬化), [分片](/ch7#ch_sharding) - 词汇, [三元组存储与 SPARQL](/ch3#id59) - Voice over IP (VoIP), [网络拥塞和排队](/ch9#network-congestion-and-queueing) - VoltDB(数据库) - 交叉硬度序列化, [分片](/ch8#sharding) - 确定性储存程序, [存储过程的利弊](/ch8#sec_transactions_stored_proc_tradeoffs) - 内存储, [全内存存储](/ch4#sec_storage_inmemory) - 进程/核心模式, [分片的利与弊](/ch7#sec_sharding_reasons) - 二级指数, [本地二级索引](/ch7#id166) - 事务的序列执行, [实际串行执行](/ch8#sec_transactions_serial) - 基于语句的复制, [基于语句的复制](/ch6#statement-based-replication), [失败后重建状态](/ch12#sec_stream_state_fault_tolerance) - 流程处理中的事务, [原子提交再现](/ch12#sec_stream_atomic_commit) ### W - 预写式日志, [使 B 树可靠](/ch4#sec_storage_btree_wal) - WAL-G (backup tool), [设置新的副本](/ch6#sec_replication_new_replica) - WarpStream(消息系统), [磁盘空间使用](/ch12#sec_stream_disk_usage) - web services(见 services) - 网络用户, [直接从生产者传递给消费者](/ch12#id296) - 网络方法(通讯), [消息代理](/ch5#message-brokers) - WebSocket (protocol), [将状态变更推送给客户端](/ch13#id348) - 宽柱数据模型, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - 相对于面向列的存储, [列压缩](/ch4#sec_storage_column_compression) - 窗口(流程处理), [流分析](/ch12#id318), [时间推理](/ch12#sec_stream_time)-[窗口的类型](/ch12#id324) - 更改日志的无限窗口, [维护物化视图](/ch12#sec_stream_mat_view), [流表连接(流扩充)](/ch12#sec_stream_table_joins) - 知道所有事件何时到来, [处理滞留事件](/ch12#id323) - 串流在窗口内连接, [流流连接(窗口连接)](/ch12#id440) - 窗口类型, [窗口的类型](/ch12#id324) - WITH RECURSIVE syntax (SQL), [SQL 中的图查询](/ch3#id58) - Word2Vec (language model), [向量嵌入](/ch4#id92) - 工作流程引擎, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - Airflow(见 Airflow(工作流调度器)) - 批处理, [工作流调度](/ch11#sec_batch_workflows) - Camunda(见 Camunda (workflow engine)) - Dagster(见 Dagster(工作流调度器)) - 持久执行, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 提取-转换-加载(ETL)(见 ETL) - 执行器, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows) - 乐团, [持久化执行与工作流](/ch5#sec_encoding_dataflow_workflows), [批处理](/ch11#ch_batch) - Orkes(见 Orkes (workflow engine)) - Prefect(见 Prefect(工作流调度器)) - 依赖决定性因素, [确定性模拟测试](/ch9#deterministic-simulation-testing) - Restate(见 Restate (workflow engine)) - Temporal(见 Temporal (workflow engine)) - 工作设置, [排序与内存聚合](/ch11#id275) - 写入放大, [写放大](/ch4#write-amplification) - 写路径, [观察派生数据状态](/ch13#sec_future_observing) - 写偏差, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[物化冲突](/ch8#materializing-conflicts) - 特性, [写偏差与幻读](/ch8#sec_transactions_write_skew)-[导致写偏差的幻读](/ch8#sec_transactions_phantom), [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise) - 实例, [写偏差与幻读](/ch8#sec_transactions_write_skew), [写偏差的更多例子](/ch8#more-examples-of-write-skew) - 物化冲突, [物化冲突](/ch8#materializing-conflicts) - 实际发生情况, [维护完整性,尽管软件有Bug](/ch13#id455) - 幻读, [导致写偏差的幻读](/ch8#sec_transactions_phantom) - 预防 - 在快照隔离中, [基于过时前提的决策](/ch8#decisions-based-on-an-outdated-premise)-[检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 双相锁定, [谓词锁](/ch8#predicate-locks)-[索引范围锁](/ch8#sec_transactions_2pl_range) - 选项, [写偏差的特征](/ch8#characterizing-write-skew) - 预写式日志, [使 B 树可靠](/ch4#sec_storage_btree_wal), [预写日志(WAL)传输](/ch6#write-ahead-log-wal-shipping) - 持久执行, [持久化执行](/ch5#durable-execution) - 写入(数据库) - 原子写入操作, [原子写操作](/ch8#atomic-write-operations) - 检测影响前读的写入, [检测影响先前读取的写入](/ch8#sec_detecting_writes_affect_reads) - 防止污秽的写作,, [没有脏写](/ch8#sec_transactions_dirty_write) - WS-\* framework, [远程过程调用(RPC)的问题](/ch5#sec_problems_with_rpc) - WS-AtomicTransaction (2PC), [两阶段提交(2PC)](/ch8#sec_transactions_2pc) ### X - X (社会网络) - 建造住房时间表(例如), [案例研究:社交网络首页时间线](/ch2#sec_introduction_twitter), [从同一事件日志中派生多个视图](/ch12#sec_stream_deriving_views), [表表连接(维护物化视图)](/ch12#id326), [物化视图和缓存](/ch13#id451) - 加入费用, [社交网络案例研究中的反规范化](/ch3#denormalization-in-the-social-networking-case-study) - 描述负载, [描述负载](/ch2#id33) - 过失容忍, [容错](/ch2#id27) - 业绩计量, [描述性能](/ch2#sec_introduction_percentiles) - DistributedLog (event log), [使用日志进行消息存储](/ch12#id300) - Snowflake (ID generator), [ID 生成器和逻辑时钟](/ch10#sec_consistency_logical) - XA 事务, [两阶段提交(2PC)](/ch8#sec_transactions_2pc), [XA 事务](/ch8#xa-transactions)-[XA 事务的问题](/ch8#problems-with-xa-transactions) - 启发式决策, [从协调器故障中恢复](/ch8#recovering-from-coordinator-failure) - 问题, [XA 事务的问题](/ch8#problems-with-xa-transactions) - xargs (Unix 工具) (英语)., [简单日志分析](/ch11#sec_batch_log_analysis) - XFS (file system), [分布式文件系统](/ch11#sec_batch_dfs) - XGBoost (machine learning library), [机器学习](/ch11#id290) - XML - 二进制变体, [二进制编码](/ch5#binary-encoding) - 数据位置, [读写的数据局部性](/ch3#sec_datamodels_document_locality) - encoding RDF data, [RDF 数据模型](/ch3#the-rdf-data-model) - 应用数据的问题, [JSON、XML 及其二进制变体](/ch5#sec_encoding_json) - 关系数据库, [文档模型中的模式灵活性](/ch3#sec_datamodels_schema_flexibility) - XML databases, [关系模型与文档模型](/ch3#sec_datamodels_history), [文档的查询语言](/ch3#query-languages-for-documents) - Xorq(查询引擎), [一切的元数据库](/ch13#id341) - XPath, [文档的查询语言](/ch3#query-languages-for-documents) - XQuery, [文档的查询语言](/ch3#query-languages-for-documents) ### Y - 亚虎 - 响应时间研究, [平均值、中位数与百分位点](/ch2#id24) - YARN (job scheduler), [分布式作业编排](/ch11#id278), [应用代码和状态的分离](/ch13#id344) - ApplicationMaster, [分布式作业编排](/ch11#id278) - Yjs (CRDT library), [同步引擎的利弊](/ch6#pros-and-cons-of-sync-engines) - YugabyteDB(数据库) - 散列变硬, [按哈希范围分片](/ch7#sharding-by-hash-range) - 键程硬化, [按键的范围分片](/ch7#sec_sharding_key_range) - 多领导复制, [跨地域运行](/ch6#sec_replication_multi_dc) - 请求路由, [请求路由](/ch7#sec_sharding_routing) - 硬化二级指数, [全局二级索引](/ch7#id167) - 平板(硬化), [分片](/ch7#ch_sharding) - 事务, [事务到底是什么?](/ch8#sec_transactions_overview), [数据库内部的分布式事务](/ch8#sec_transactions_internal) - 使用时钟同步, [用于全局快照的同步时钟](/ch9#sec_distributed_spanner) ### Z - Zab(协商一致算法), [共识](/ch10#sec_consistency_consensus), [共识的实践](/ch10#sec_consistency_total_order) - use in ZooKeeper, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 零拷贝, [编码数据的格式](/ch5#sec_encoding_formats) - zero-disk architecture (ZDA), [设置新的副本](/ch6#sec_replication_new_replica) - ZeroMQ (messaging library), [直接从生产者传递给消费者](/ch12#id296) - 僵尸(分裂的大脑), [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens) - zones (cloud computing)(见 availability zones) - ZooKeeper (coordination service), [协调服务](/ch10#sec_consistency_coordination)-[服务发现](/ch10#service-discovery) - 生成栅栏标志, [隔离僵尸进程和延迟请求](/ch9#sec_distributed_fencing_tokens), [使用共享日志](/ch10#sec_consistency_smr), [协调服务](/ch10#sec_consistency_coordination) - 线性操作, [实现线性一致性系统](/ch10#sec_consistency_implementing_linearizable) - 锁和领袖选举, [锁定与领导者选举](/ch10#locking-and-leader-election) - 观察员, [服务发现](/ch10#service-discovery) - 用于服务发现, [负载均衡器、服务发现和服务网格](/ch5#sec_encoding_service_discovery), [服务发现](/ch10#service-discovery) - 用于硬性转让, [请求路由](/ch7#sec_sharding_routing) - 使用 Zab 算法, [共识](/ch10#sec_consistency_consensus)