游客:
注册
|
登录
|
帮助
网友俱乐部
»
数据库操作
»
MSSQL教程
» sql优化器探讨
网友生活网
|
网友学堂
如何获得金币?
诚招斑竹
IP归属地查询 PR查询 收录查询 whois查询
免费超短2级域名,your.jpy.cc
火狐浏览器,网上冲浪更快更爽更惬意
注册亚洲交友中心,找个人来同居吧!
7CODE查杀恶意代码,守护您的电脑
‹‹ 上一主题
|
下一主题 ››
投票
交易
悬赏
活动
打印
|
推荐
|
订阅
|
收藏
标题: sql优化器探讨
ljjk5
元帅
UID 46706
精华
1
积分 99426
帖子 49691
威望 554
金币 48489
热心 505
阅读权限 100
注册 2007-2-25
状态 离线
#1
使用道具
发表于 2007-6-18 07:19
资料
个人空间
主页
短消息
加为好友
sql优化器探讨
多年以来,商业数据库生产商一直致力于提高数据库的查询性能。尽管他们持续地付出努力和辛勤地工作,我们还是无法看到关系型数据库系统(rdbms)在性能上有显著的提高。用户继续忍受性能低下的sql语句,数据库专家们继续在sql语句优化的泥潭中痛苦挣扎。
本文将介绍数据库查询优化器是如何工作的、为什么问题持续存在,并深入探讨数据库查询优化器将来的发展方向。
数据库查询优化器
数据库查询优化器是rdbms服务器的一个组成部分。对于基于成本的优化,数据库查询优化器的任务是,通过产生可供选择的执行计划,找到最低估算成本的执行计划,来优化一条sql语句。它在sql语句性能表现上扮演了至关重要的角色。
当一条sql语句被送入rdbms服务器,它将会被解析并提交给数据库查询优化器。查询优化器将会进行查询重写和表达式评估,以产生可供选择的执行计划。产生可供选择的执行计划的数量,取决于在rdbms中定义的计划空间(plan space)大小。对于每个待选的执行计划,成本估计将被计算,带有最小成本的执行计划将被选取用来执行sql语句。这种方法存在着两个无法解决的问题:无法产生全部可能的可选执行计划和成本估计的不准确。
新的sql优化概念——外部sql重写器
一个有经验的程序员,把有问题的sql语句的速度提高数千倍是很常见的。凭着对具体数据库特征的了解,对sql语句进行语法的重新构造。一个开发人员能够帮助查询优化器获得更好的执行计划,而这执行计划是查询优化器无法靠自身独立工作产生的。这给予我们一个启示,我们是否能通过计算机模拟人的行为,来实现同样的目的呢?
显示了外部sql重写器(external sql rewriter--esr)的概念,它能够基于现有数据库的特性,产生语义相等但语法不同的sql语句。重写产生的sql语句,将取代程序源代码中的源sql语句。这样,当程序运行时(使用新的sql语句),查询优化器将会被影响,而产生性能更好的执行计划。事实上,有经验的程序员和数据库管理员,一直在期盼着这个概念的出现。这个概念的新颖之处在于,将人类的知识和智能合并到一个计算机算法中,它能够打破计划空间(plan space)限制的障碍,避免在寻找最佳sql语句时不准确的成本估算。
esr的优点是,它的优化并非一个基于实时,可用于重写和优化sql语句的时间,在理论上是无限的。它可以比数据库的查询优化器尝试更多的待选sql语句。用户花费多达一天的时间来处理关键sql语句的性能问题,而esr可以彻底寻找可能的待选执行计划。esr的另外一个优点是,能够达到sql性能提高的目的,而无需进行额外的统计,使数据库查询优化器的负载过重。因此,esr使得提升整个数据库性能变得简单且安全。最后,esr相对于数据库内部的查询优化器更加灵活:sql重写的知识库可以很容易扩展,搜索空间可以通过硬件的升级来扩展,而毫无限制和缺点。
esr是如何工作的?
为了让esr能够优化sql语句,必须避免数据库内部查询优化器限制所产生的障碍。另外,esr必须拥有重写sql语句的智能,并知道你数据库的特性,来提供待选的sql语句。尽管达到上面的要求是困难的,但是开发一个这样的算法也不是不可能的。国内市场上已经由盈动华建公司代理推出了一个相当成熟的产品——lecco technology 的lecco sql expert。
sql语句可以被直接输入,或通过检查源代码来捕获有问题的sql语句。当esr收到sql语句,一个递归的转换算法被应用来重写源sql语句,产生每一个可能的语义等价的待选sql语句。递归的sql转换引擎,拥有内建的人工智能和sql转换规则,它依照具体数据库的特性来重新构造sql语句。
可扩展的计划空间
用户可自定义的限额让用户能够控制搜索空间。如果用户对在定义的限额内产生的结果不满意,或无法找到性能更好的待选sql语句,用户可以提高限额来增加搜索空间,直到更多的待选sql语句被找到。因此,esr的计划空间的扩展,要比数据库查询优化器有弹性得多。另一个考虑周到的特性是,esr可以在内部把具有重复执行计划的sql语句给排除掉。这样不仅减少了人工反复尝试的成本,还保证了重写产生的每条sql语句,都具有不同的执行计划和性能。
尽管esr能够扩大它的计划空间和产生更多的待选sql语句,它还是和数据库内部查询优化器一样,面对着不准确的成本估算的问题。没有实际地执行过每一条重写后的sql语句,是根本无法知道,在所有待选sql语句中到底哪一条的性能最好。因此,实际的途径是,测试运行所有的待选sql语句。图2中的esr例子使用了这一方法并附加提供了测试选项来找到性能最好的sql语句。用户可以选择,什么时候来开始测试和允许进行多长时间的测试。此外,esr的重要性还在于,整个优化过程不需要使用者具有数据库专家的经验。正如我们所知道的,不同的sql语法可以引起数据库查询优化器产生不同的执行计划,因此esr也必须具有模拟人工重写sql语句的能力。递归式sql语法转换技术,正是用来模拟人的sql转换方法。它合并一系列有用的转换规则,并使用一次触发一条的方法来转换sql语句。所有的转换规则是不互相依赖的,就像一个个密封的小门,只有在所有必需的条件都满足的情况下,某个密封门才会被打开。这保证了重写后的sql语句与原sql语句在语义上是等效的。
esr技术的展望
随着硬件的升级,esr能够合并更多的sql转换规则,来处理数据库的新特性和更复杂的sql语句,理论上,规则的数量是没有限制的。将来,随着数据库生产商在让用户影响数据库优化器方面更加开放,esr将会在优化策略方面得到更多的控制。毫无疑问,esr将会在分担数据库查询优化器的工作负荷上,扮演越来越重要的角色。
网友
ljjk5
签名 - 网友社区
===
[广告]
免费域名(Free Subdomain)
免费空间(Free hosting)
PR查询(Google Pagerank)
投票
交易
悬赏
活动
控制面板首页
编辑个人资料
积分交易
公众用户组
好友列表
个人空间管理
基本概况
流量统计
客户软件
发帖量记录
论坛排行
主题排行
发帖排行
积分排行
在线时间
管理团队
管理统计
当前时区 GMT+8, 现在时间是 2008-8-29 04:19
信产部ICP备案:
京ICP备05066424号
北京市公安局网监备案:1101050648号
Powered by
Discuz!
5.5.0
TOP
清除 Cookies
-
联系我们
-
网友俱乐部
-
Archiver
-
WAP