项目里面有一个需求,要对sql进行简单的语法分析
为了避免sql里面的字符串和注释对语法分析做干扰,我写了一个java函数,对sql进行修剪,删除里面字符串和注释,用空格代替
周末闲着没事,我用go重新实现了这个功能,感觉应该会有后来人可以用上
说明:
sql里面的注释有两种单行注释和多行注释,其中单行注释以--开头,以\n结尾,多行注释以/开头,以/结尾
sql字符串是以'开头,'结尾,但特别的地方是连续两个单引号是代表一个单引号而不是字符串结束标志
关键函数如下:
` /** 将字节数组里面注释和字符串,用空格替换 rangeBeg和rangeEnd是数组元素起始位置 左闭右开 */ func TrimSqlByteArray(sql []byte, rangeBeg int, rangeEnd int) []byte { sqlLength := rangeEnd - rangeBeg - 1; //删除注释或者字符串后 用空格填充 必免因删除导致粘连改变sql语义 const chPad = ' ' //结果切片,预分配空间为入参sql长度一半 result := make([] byte, 0, sqlLength / 2) //本字符类型 var charType int = NORMAL; for i := rangeBeg; i < rangeEnd; i++ { /* *utf8编码不影响判断 //跳过非英文字符 if sql[i] & 0x80 != 0 { //utf8编码:UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0; //如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。 //UTF-8最多可用到6个字节。 这里不考虑异常,因为go的字符串基本都是标准utf8编码 i += getPreNotZeroCount(sql[i]) - 1 continue; } */
//本字符类型 预设为普通字符 charType = NORMAL ch := sql[i] //下一个字符 var chNext byte; chNext = getCharSafe(sql, rangeEnd, i + 1) //非有效sql内容结束位置 endPos := 0 if ch == '-' && chNext == '-' { //单行注释 charType = LINE //下标移到非有效字符的最后 endPos = seekToNext(sql, i + 2, rangeEnd, charType) } else if ch == '/' && chNext == '*' { //多行注释 charType = MULTI //下标移到非有效字符的最后 endPos = seekToNext(sql, i + 2, rangeEnd, charType) } else if ch == '\'' { //字符串 charType = STRING //下标移到非有效字符的最后 endPos = seekToNext(sql, i + 1, rangeEnd, charType) } //如果字符是非有效字符 则用空格代替 否则保持原样 if charType == NORMAL { result = append(result, ch) } else { result = append(result, chPad) i = endPos - 1 }
} return result; } /**
获取字符串或者注释的右边界位置(不包含)
rangeEnd是数组边界 */ func seekToNext(sql []byte, begPos int, rangeEnd int, charType int) int { result := begPos; switch charType { case MULTI: for ; result < rangeEnd; result++ { ch := sql[result] chNext := getCharSafe(sql, rangeEnd, result+ 1)
if ch == '*' && chNext == '/' { result = result + 1; break; } } break
case LINE: for ; result < rangeEnd; result++ { ch := sql[result]
if ch == '\n' { break; } } break
case STRING: for ; result < rangeEnd; result++ { ch := sql[result] chNext := getCharSafe(sql, rangeEnd, result + 1)
//sql字符串里面连续的单引号被认为是' 则不是字符串结束标志 if ch == '\'' && chNext == '\'' { result = result + 1; continue; } else if ch == '\'' { break; } } break
default: break; } result++; return result; }
完整代码及单元测试已上传 https://github.com/kingstarer/kingstarer.git
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
暂无评论...
更新日志
2024年11月25日
2024年11月25日
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]