- 概述- 索引选择率的估算
- 访问计划的搜索过程
 
概述
当查询的集合有多个索引时,SequoiaDB 需要选取合适的索引,或者全表扫描来执行查询。数据节点上的查询优化器会基于代价对候选的访问计划进行评估,选取合适的访问计划来完成查询。
估算出每个候选访问计划执行的以下指标:
- 基于规则的估算选取候选访问计划 - 索引的选择率 < 0.1(即索引过滤剩下的记录个数为集合记录个数的 10%)
- 索引完全匹配排序字段及排序方向
- 全表扫描
 
- 符合指标 1 的候选访问计划,再基于代价的进行估算,最终选出总代价最小的访问计划执行查询。
示例
集合 foo.bar 上的有索引:
- "index_a" : { a : 1 }
- "index_b" : { b : 1 }
- "index_c" : - { c : 1 }查询- db.foo.bar.find( { a : 1, b : 2 } ).sort( { c : 1 } )可以有以下的访问计划:
- IXSCAN( "index_a" ) ==> SORT( { c : 1 } ) 
- IXSCAN( "index_b" ) ==> SORT( { c : 1 } )
- IXSCAN( "index_c" )
- TBSCAN() ==> SORT( { c : 1 } )根据指标 1 可以确定 4 个都是候选的访问计划,其中访问计划 1 和 2 满足指标 1.1,访问计划 3 满足指标 1.2,访问计划 4 满足指标 1.3。
然后通过代价估算确定总代价最小的访问计划,并选取执行查询。假设估算出 4 个候选访问计划的总代价分别为 1000,800,12000 和 1000,则最终选择访问计划 2 执行查询。
索引选择率的估算
索引选择率的估算有两种方式:
- 使用统计信息进行估算
- 使用默认值进行估算使用默认值进行估算: 
- 数值 - 在 [ -99999999.9, 99999999.9 ]的区间中选取
- 如 { $lt : 0 }的选择率为:( 0 - ( -99999999.9 ) ) / ( 99999999.9 - ( -99999999.9 ) ) = 0.5
 
- 在 
- 字符串 - 逐个字符计算在 ' ' (空格 ASCII 码:32)至 ASCII 码 127 之间的比例
- 计算前 20 个字符
 
- 其他数据类型 - 相等比较:0.005
- 大于、小于比较:0.333333
- 范围比较:0.05
 
Note:
参考使用统计信息进行估算
访问计划的搜索过程
使用 SdbQuery.explain() 可以查看查询的访问计划。
当 SdbQuery.explain() 的 Search 选项为 true 时,将会展示查询优化器搜索过的访问计划,并查看查询优化器选择的结果。当 SdbQuery.explain() 的 Evaluate 选项为 true 时,将会展示查询优化器估算访问计划的总代价的演算过程。
- 访问计划的搜索过程
- TBSCAN的推演公式
- IXSCAN的推演公式
- SORT的推演公式
Note:
- 搜索过的访问计划不在访问计划缓存中,因此 Search 选项不使用缓存,重新估算
- 搜索过程将嵌套展示在数据节点每个集合的访问计划中
 我的书签
 我的书签
                                 添加书签
 添加书签 移除书签
 移除书签