用python去除SQL中的注释,其实是最近在做一个项


我的博客
在看到这个标题时候肯定有人会想,我写SQL直接在数据库工具上执行就行了啊,工具会自动识别注释的,就是不用工具,把SQL写到存储过程里,数据库也会识别注释不执行的,干嘛非要去掉,费力不讨好。


其实是最近在做一个项目,需要在行云库里执行SQL,并且SQL是写在脚本上的,通过JDBC调用,众所周知,SQL的注释很随意,甚至有什么保佑不出bug这种,那么执行的时候就很有可能因为注释里的特殊字符导致一堆莫名其妙的bug出现,并且行云数据库是一个国产的不太完善的数据库,所以本身对特殊字符的支持也不是很好,所以去除注释势在必行。

好了,废话说的够多了,现在上代码,因为行注释和段落注释使用的注释方法不同,所以这里分成两个功能来写

# 去除行注释
# 说明:因为行注释是从--开始一直到结尾都算行注释,所以一个正则就可以搞定了
def rehint_line(sql_values):
  rev = re.compile('--.*\\n?')
  sql_values = re.sub(rev,'\n',sql_values)
  return sql_values

行注释看起来还是比较简单的,其实我也没想到会这么简单,哈哈哈哈哈

# 去除段注释
'''
说明:
  1、在读取SQL的时候需要一次全部读出来,然后赋值给变量
  2、迭代读取SQL中的每一个字符,并且把字符写到新的变量里
  3、如果遇到/或*就记录下,例如给变量v
  4、当遇到/之后,紧跟着下一个字符是*,那就停止把字符写到变量,直到遇到*之后紧跟着下一个字符是/
'''
def rehint_limit(sql_values):
  write_tag = 0 # 用来控制是否写入新变量
  write_limit = '' # 记录/或者*
  sql_result = '' # 记录去除注释后的结果
  for case in sql_values:
    if (write_limit + case) == '/*':
      sql_result = sql_result.strip('/') # 去除最后一个/
      write_tag += 1
    if write_tag == 0:
      sql_result += case
    if (write_limit + case) == '*/':
      write_tag -= 1
    write_limit = ''
    if '/' == case or '*' == case:
      write_limit = case
  return sql_result

恩,段注释有一些麻烦,不过还好,我写说明了,如果大家有更好更有效率的办法欢迎提供

下面试下效果,把下面代码存成rehint.py,或者你想存成别的也行,名字随意啦

#!/usr/bin/python
# coding: utf-8

import re

def rehint_limit(sql_values):
  write_tag = 0 # 用来控制是否写入新变量
  write_limit = '' # 记录/或者*
  sql_result = '' # 记录去除注释后的结果
  for case in sql_values:
    if (write_limit + case) == '/*':
      sql_result = sql_result.strip('/') # 去除最后一个/
      write_tag += 1
    if write_tag == 0:
      sql_result += case
    if (write_limit + case) == '*/':
      write_tag -= 1
    write_limit = ''
    if '/' == case or '*' == case:
      write_limit = case
  return sql_result

def rehint_line(sql_values):
  rev = re.compile('--.*\\n?')
  sql_values = re.sub(rev,'\n',sql_values)
  return sql_values

if __name__ == '__main__':
  sql = '''
--这是个sql
select '1' v1,'2' v2 from dual union all
select '2' v1,'3' v2 from dual union all
/* 这段select 1 v1,2 v2 from dual union all
select 2 v1,3 v2 from dual 写错了
*/
select /* 这个是select语句 */ 'a' v1, --v1列
       'b' v2 --v2列
from dual --dual是个伪表
'''
  print(sql)
  # 先去除段注释
  sql = rehint_limit(sql)
  print('rehint_limit: ' + sql)
  # 去除行注释
  sql = rehint_line(sql)
  print('rehint_line: ' + sql)

执行结果见截图

效果和预想的结果一样,注释去除的干干净净

 

评论关闭