当前位置:首页 » 《休闲阅读》 » 正文

【JSqlParser】Java使用JSqlParser解析SQL语句总结

8 人参与  2024年10月15日 15:21  分类 : 《休闲阅读》  评论

点击全文阅读


简述

Java解析SQL语句有很多工具都可以做到,比如Mybatis、Druid、目前用来用去最全面的仍然是Jsqlparser,它是一个Github上的开源项目,JSqlParser是一个用于解析SQL语句的Java库,它可以帮助开发者分析和操作SQL语句的结构。无论是从事数据库开发、SQL性能优化,还是需要解析SQL语句以进行其他操作,JSqlParser都能提供强大的支持

特点

支持多种SQL方言:JSqlParser支持多种数据库的SQL方言,包括MySQL、Oracle、PostgreSQL等,这使得在不同数据库之间进行SQL语句解析变得更加方便。

灵活的操作:JSqlParser以多种方式操作SQL语句,例如修改查询条件、提取表名、列名等,甚至整个SQL语句中使用到的函数,从而满足各种需求。

易于集成:JSqlParser可以轻松集成到您的Java项目中,只需将其作为依赖项添加到项目中即可。

社区支持:JSqlParser拥有一个活跃的社区,许多开发者为其提供贡献,使得这个工具不断得到改进和优化,它的主要操刀人manticore-projects (github.com) 也非常负责并愿意解答各种问题和参与讨论

环境准备

将Jsqlparser直接添加到项目中

Maven:

<dependency>    <groupId>com.github.jsqlparser</groupId>    <artifactId>jsqlparser</artifactId>    <version>4.9</version></dependency>

Gradle:

implementation("com.github.jsqlparser:jsqlparser:4.9")

快速使用

使用原则

假设现在有一条简单的SQL语句需要拿来解析,首先应该保证这个SQL在结构上是没有问题的,最好是放在数据库中可以直接运行的,不夹杂不应该的标点符号,那样解析起来才不会出错

使用案例:

以下是一个简单的SQL语句,并且这句SQL没有违反原则,是一条基本可以正常运行的SQL语句

SELECT id,name,nickname,age,job,department FROM staff_member WHERE nickname= "刘"

解析SQL语句

接下来使用Jsqlparser去解析语句,其中第二行则是最基本的,将SQL语句字符串拿来解析,如果这句SQL语句违反了原则,例如存在特殊标点符号或者不符合SQL语句,那么在第二行就会产生异常

String sql = "SELECT id,name,nickname,age,job,department FROM staff_member WHERE nickname= '刘'";// Parse SQLStatement statement = CCJSqlParserUtil.parse(sql);Select selectStatement = (Select) statement;log.info("==> JsqlParser SQL: {}", selectStatement.toString());

正常情况下,将得到一个包含各种属性的statement,这意味着一条SQL成功被解析,并被赋予到一个对象的各个属性中

认识Statement

熟悉JDBC的程序员一般都知道Statement,其实就是语句的意思,不过在Jsqlparser中Statement已经面向对象,被设计成了一个interface,之所以设计成interface大概都可以猜到,因为Jsqlparser既然要去解析SQL,那必然要对SQL语句做区分,到底是Select、还是Insert、还是Delete、甚至是Create,而Jsqlparser对每种语句都做了一个封装,它们都继承了Statement

所以一条SQL语句,根据不同情况,都有适配的对象,例如Select语句对应着 net.sf.jsqlparser.statement.select.Select对象,而Insert也有自己的对象,所以我们都可以通过将Statement强转为它所对应的对象来获取或改变其中的属性,这也是解析SQL的一大目的

其实在Jsqlparser成功解析SQL语句之后,statement就已经有了它的类型

String sql = "SELECT id,name,nickname,age,job,department FROM staff_member WHERE nickname= '刘'";        // Parse SQL Statement statement = CCJSqlParserUtil.parse(sql); if(statement instanceof Select){       Select selectStatement = (Select) statement;      log.info("==> JsqlParser SQL: {}", selectStatement.toString());}if(statement instanceof Insert){       Insert insertStatement = (Insert) statement;       log.info("==> JsqlParser SQL: {}", insertStatement.toString());}if(statement instanceof Update){      Update updateStatement = (Update) statement;      log.info("==> JsqlParser SQL: {}", updateStatement.toString());}if (statement instanceof Delete) {      Delete deleteStatement = (Delete) statement;      log.info("==> JsqlParser SQL: {}", statement.toString());}

分析语句

查询语句

在statement成功解析SQL语句之后,通过PlainSelect就可以拿到SQL语句中的各个元素

String sql = "SELECT id,name,nickname,age,job,department FROM staff_member WHERE nickname= '刘'";// Parse SQLStatement statement = CCJSqlParserUtil.parse(sql);if(statement instanceof Select){    Select selectStatement = (Select) statement;    log.info("==> JsqlParser SQL: {}", selectStatement.toString());    PlainSelect plainSelect = selectStatement.getPlainSelect();    log.info("==> FromItem: {}", plainSelect.getFromItem());    log.info("==> SelectItem: {}",plainSelect.getSelectItems());    log.info("==> Where: {}",plainSelect.getWhere());}

运行结果:

==> JsqlParser SQL: SELECT id, name, nickname, age, job, department FROM staff_member WHERE nickname = '刘'==> FromItem: staff_member==> SelectItem: [id, name, nickname, age, job, department]==> Where: nickname = '刘'

PlainSelect常用方法:

获取和设置表(From子句):

FromItem getFromItem(): 获取FROM子句中的表或子查询。void setFromItem(FromItem fromItem): 设置FROM子句中的表或子查询。

获取和设置选择项(SelectItems):

List<SelectItem> getSelectItems(): 获取SELECT子句中的选择项列表。void setSelectItems(List<SelectItem> selectItems): 设置SELECT子句中的选择项列表。

获取和设置WHERE子句:

Expression getWhere(): 获取WHERE子句的条件表达式。void setWhere(Expression where): 设置WHERE子句的条件表达式。

获取和设置GROUP BY子句:

List<Expression> getGroupByColumnReferences(): 获取GROUP BY子句中的列引用列表。void setGroupByColumnReferences(List<Expression> groupByColumnReferences): 设置GROUP BY子句中的列引用列表。

获取和设置ORDER BY子句:

List<OrderByElement> getOrderByElements(): 获取ORDER BY子句中的排序元素列表。void setOrderByElements(List<OrderByElement> orderByElements): 设置ORDER BY子句中的排序元素列表。

获取和设置LIMIT子句:

Limit getLimit(): 获取LIMIT子句。void setLimit(Limit limit): 设置LIMIT子句。

获取和设置DISTINCT关键字:

boolean isDistinct(): 检查SELECT语句是否使用了DISTINCT关键字。void setDistinct(boolean distinct): 设置SELECT语句是否使用DISTINCT关键字。

获取和设置INTO子句(用于SELECT INTO语句):

SubSelect getIntoTables(): 获取INTO子句中的表。void setIntoTables(SubSelect intoTables): 设置INTO子句中的表。

获取和设置HAVING子句:

Expression getHaving(): 获取HAVING子句的条件表达式。void setHaving(Expression having): 设置HAVING子句的条件表达式。

获取和设置别名:

String getAlias(): 获取SELECT语句的别名。void setAlias(String alias): 设置SELECT语句的别名。

获取和设置子查询(SubSelect):

SubSelect getSubSelect(): 获取子查询。void setSubSelect(SubSelect subSelect): 设置子查询。

获取和设置联合查询(Union):

List<PlainSelect> getUnion(): 获取联合查询的SELECT语句列表。void setUnion(List<PlainSelect> union): 设置联合查询的SELECT语句列表。

新增语句

新增语句和查询语句一样,只不过由于Insert没有Select语句那么复杂,所以Jsqlparsert并没有专门设计一个类似PlainSelect extend Select这样一个类,而是直接通过Insert对象就可以获取和操作,Insert语句中的内容

String sql = "INSERT INTO employees (employee_id, employee_name, department) VALUES (1, 'John Doe', 'Human Resources')";// Parse SQLStatement statement = CCJSqlParserUtil.parse(sql);if (statement instanceof Insert) {    Insert insertStatement = (Insert) statement;    log.info("==> JsqlParser SQL: {}", insertStatement.toString());    log.info("==> Table: {}", insertStatement.getTable());    log.info("==> Columns: {}", insertStatement.getColumns());    log.info("==> ItemsList: {}", insertStatement.getValues());}

运行结果:

 ==> JsqlParser SQL: INSERT INTO employees (employee_id, employee_name, department) VALUES (1, 'John Doe', 'Human Resources') ==> Table: employees ==> Columns: employee_id, employee_name, department ==> ItemsList: VALUES (1, 'John Doe', 'Human Resources')

Insert常用方法

Table getTable(): 获取插入语句中的目标表。List<Column> getColumns(): 获取插入语句中要插入的列的列表。ItemsList getValues(): 获取插入语句中的值列表,可以是单个值或者子查询。String getPrefix(): 获取INSERT关键字前的前缀,如INSERT INTO或者INSERT IGNOREvoid setTable(Table table): 设置插入语句中的目标表。void setColumns(List<Column> columns): 设置插入语句中要插入的列的列表。void setValues(ItemsList values): 设置插入语句中的值列表。void setPrefix(String prefix): 设置INSERT关键字前的前缀。

更新语句

Update和Insert是一样的,内容相对于Select较为简单,通过Update对象即可获得相关内容

String sql = "UPDATE employees SET department = 'Human Resources' WHERE employee_id = 1";// Parse SQLStatement statement = CCJSqlParserUtil.parse(sql);if (statement instanceof Update) {    Update updateStatement = (Update) statement;    log.info("==> JsqlParser SQL: {}", updateStatement.toString());    Table table = updateStatement.getTable();    log.info("Table Name: {}", table.getName());    log.info("==> Columns: {}", updateStatement.getColumns());    // 获取更新项    List<UpdateSet> updateSets = updateStatement.getUpdateSets();    for (UpdateSet updateSet : updateSets) {        for (Expression expression : updateSet.getColumns()) {            log.info("==> Expression: {}", expression.toString());        }    }    log.info("==> ItemsList: {}", updateStatement.getExpressions());    Expression where = updateStatement.getWhere();    log.info("==> Where: {}", where.toString());}

运行结果

==> JsqlParser SQL: UPDATE employees SET department = 'Human Resources' WHERE employee_id = 1Table Name: employees==> Columns: department==> Expression: department==> ItemsList: 'Human Resources'==> Where: employee_id = 1

删除语句

        String sql = "DELETE FROM table_name WHERE condition";        Statement statement = CCJSqlParserUtil.parse(sql);        if (statement instanceof Delete) {            Delete deleteStatement = (Delete) statement;            // 获取要删除的表            Table table = deleteStatement.getTable();            System.out.println("Table Name: " + table.getName());            // 获取WHERE条件            Expression where = deleteStatement.getWhere();            System.out.println("Where Condition: " + where.toString());        }

运行结果:

Table Name: table_nameWhere Condition: condition

从SQL语句中提取表名

Statement statement = CCJSqlParserUtil.parse("SELECT * FROM MY_TABLE1");Select selectStatement = (Select) statement;TablesNamesFinder tablesNamesFinder = new TablesNamesFinder();List<String> tableList = tablesNamesFinder.getTableList(selectStatement);

最终tableList里将存入所有给出的SQL语句中的表名,以上案例只有一个表名

为SQL语句各个字段表达式添加别名

String sql = "SELECT id,name,nickname,age,job,department FROM staff_member WHERE nickname= '刘'";// Parse SQLStatement statement = CCJSqlParserUtil.parse(sql);if(statement instanceof Select ){    Select selectStatement = (Select) statement;    final AddAliasesVisitor instance = new AddAliasesVisitor();    instance.setPrefix("t");    selectStatement.accept(instance);    log.info("==> JSqlParser finalSQL: {}", selectStatement);}

动态加字段加表达式加条件

使用SelectUtils,为一个Select语句,增加查询的字段

Select select = (Select) CCJSqlParserUtil.parse("select mydate from mytable");SelectUtils.addExpression(select, new Column("mylocation"));

增加一个表达式

Select select = (Select) CCJSqlParserUtil.parse("select a from mytable");SelectUtils.addExpression(select, new Column("b"));assertEquals("SELECT a, b FROM mytable", select.toString());Addition add = new Addition();add.setLeftExpression(new LongValue(5));add.setRightExpression(new LongValue(6));SelectUtils.addExpression(select, add);assertEquals("SELECT a, b, 5 + 6 FROM mytable", select.toString());

增加一个Join

动态添加Join,可以为Join增加表达式,以及设置Join的表,并且通过setLeft()、setRight()、setInner()可以设置join的方向,最终它会生成对应的SQL语句

Select select = (Select) CCJSqlParserUtil.parse("select a from mytable");final EqualsTo equalsTo = new EqualsTo();equalsTo.setLeftExpression(new Column("a"));equalsTo.setRightExpression(new Column("b"));Join addJoin = SelectUtils.addJoin(select, new Table("mytable2"), equalsTo);addJoin.setLeft(true);assertEquals("SELECT a FROM mytable LEFT JOIN mytable2 ON a = b", select.toString());

用SelectUtils构建一个SQL语句

下面是SelectUtils里面的一些方法,可以看到不光是为查询语句增加表达式、Join和分组,其次还可以使用build等方法去构建一个SQL语句

这里是一个案例,构建了一个查询语句,其中也使用到了addGroupBy

Select select = SelectUtils.buildSelectFromTableAndExpressions(new Table("mytable"),                new Column("a"), new Column("b"));SelectUtils.addExpression(select, new Column("c"));final EqualsTo equalsTo = new EqualsTo();equalsTo.setLeftExpression(new Column("id"));equalsTo.setRightExpression(new Column("1"));SelectUtils.addGroupBy(select, new Column("d"));log.info("==> JsqlParser Build SQL: {}", select.toString());

输出结果:

==> JsqlParser Build SQL: SELECT a, b, c FROM mytable GROUP BY d

简短的总结

上面的代码虽然不少,但实际上真正需要熟悉的只有一个,就是直接调用CCJSqlParserUtil.parse(sql);去获得Statement,然后通过Statement去操作和获取解析后的SQL中的内容,非常简单方便

实际应用场景

说了那么多JSQLPARSER的使用,或许很多朋友并不能联想到有哪些具体可以用到它的地方,实际上想要开发一个优秀的软件产品,那么细节是少不了的,SQL是BS软件的本质之一,那么针对SQL,我们能做的还有很多,以下列举几个常见的场景

SQL审计和分析:

审计SQL语句,检查是否包含潜在的安全漏洞,如SQL注入。分析SQL语句的性能,检查是否存在可以优化的查询条件。

数据库迁移和同步:

在迁移数据库时,使用JSqlParser解析源数据库的SQL语句,并生成目标数据库的相应语句。数据库同步工具可以使用JSqlParser来解析和生成SQL语句,以实现数据的同步。

动态SQL生成:

应用程序需要生成动态SQL语句以执行不同的操作,JSqlParser可以用来解析这些动态生成的SQL语句。

SQL测试和验证:

在开发过程中,使用JSqlParser来验证SQL语句的正确性。单元测试中,使用JSqlParser来解析和执行测试用例中的SQL语句。

SQL注入防护:

在应用程序中,使用JSqlParser来解析和分析用户输入的SQL查询,以防止SQL注入攻击。

数据库管理工具:

数据库管理工具可以使用JSqlParser来解析和显示SQL语句的结构,帮助开发者理解查询的逻辑。

代码生成:

在生成数据库访问层代码时,使用JSqlParser来解析SQL语句,并生成相应的数据访问对象(DAO)或查询对象(DTO)。

SQL格式化:

使用JSqlParser来格式化SQL语句,使其更易于阅读和理解。

SQL优化:

通过分析SQL语句的结构,可以提出性能优化建议。

数据处理工具:

在数据处理和转换工具中,使用JSqlParser来解析和生成SQL语句,以实现数据的导入和导出。

在Springboot+Mybaits中使用

如果使用纯原生Mybatis那么我们需要手动在maven中加入Jsqlparser的支持,但如果使用Mybatis plus,那么就无需自己再引用,Mybaits plus自带Jsqlparser

上面举的很多例子都很简单,拿一个SQL语句解析而已,这种情况是手动化的,通常见于单元测试等情况,但如果在项目中想要通过被动的方式,让项目自己去解析SQL语句,就需要分析项目的具体情况,例如在Mybatis中通过Interceptor就可以获得到项目中真正去执行的SQL语句,详见:Mybatis 的 Interceptor(拦截器) 与 JSqlparser 结合解析SQL 使SpringBoot项目多数据库兼容的尝试_mybatis设置jsqlparser-CSDN博客

通过Mybatis的拦截器,我们拿到了项目执行的SQL语句,再通过Jsqlparser去解析,并做一定的处理,例如以上提到的那些实际应用场景

高级特性(很实用)

Jsqlparser在解析SQL语句的过程中,每一个节点都会被解析成一个叫SimpleNode的对象,它包含着各个节点的属性,这仿佛就像Dom4j解析XML的时候所有的元素都视为Node一样,解析之后的内容都是节点,而循环这些节点,Jsqlparser给出了相应的方法,提供了用于遍历节点的接口CCJSqlParserVisitor,而它的默认实现则是CCJSqlParserDefaultVisitor,在这里创建一个自己的类,并通过继承 CCJSqlParserDefaultVisitor 重写它的 visit 方法,便可以实现自己的策略,更加方便的去操作解析内容

public class SQLModifier extends CCJSqlParserDefaultVisitor {    @Override    public Object visit(SimpleNode node, Object data) {        Object value = node.jjtGetValue();        switch (node.getId()) {            case CCJSqlParserTreeConstants.JJTTABLENAME:                break;            case CCJSqlParserTreeConstants.JJTCOLUMN:                break;            case CCJSqlParserTreeConstants.JJTFUNCTION:                break;            default:                break;        }        return super.visit(node, data);    }}

调用自定义的Visitor

String originalSql = "select * from user where id = 1";CCJSqlParser parser = CCJSqlParserUtil.newParser(originalSql);Statement statement = parser.Statement();parser.getASTRoot().jjtAccept(sqlTestModifier, null);

以上代码做了一个自定义的visitor,重写的visit方法中可以看到形参SimpleNode,而调用这个自定义的Visitor之后,语句则会被拆解,依次进入到visit方法中,通过node.jjtGetValue可以获得节点信息,而node.getId()实则是获取节点的类型,而Switch-case中的常量分别代表了在解析SQL语句时,生成的抽象语法树AST (abstract syntax tree)中不同类型的节点,每个节点对应一个特定的SQL构造,如SELECT、FROM、WHERE等。下面是对这些常量代表的SQL构造的简要说明:

JJTSTATEMENT: 代表一个SQL语句。JJTVOID: 可能代表一个空语句或者不返回结果的语句。JJTBLOCK: 代表一个语句块,可能包含多个语句。JJTSTATEMENTS: 代表一个包含多个语句的列表。JJTCOLUMN: 代表一个列名。JJTTABLENAME: 代表一个表名。JJTSELECT: 代表一个SELECT查询。JJTPARENTHESEDSELECT: 代表被括号包围的SELECT查询。JJTLATERALVIEW: 代表LATERAL VIEW子句,常用于Hive SQL。JJTFORCLAUSE: 代表FOR子句。JJTLATERALSUBSELECT: 代表LATERAL子查询。JJTPLAINSELECT: 代表一个简单的SELECT查询(不包含UNION等)。JJTSETOPERATIONLIST: 代表一个集合操作列表,比如UNION, EXCEPT, INTERSECT。JJTWITHITEM: 代表WITH子句中的单个项。JJTSELECTITEM: 代表SELECT子句中的一个项,可能是列名、表达式等。JJTJOINEREXPRESSION: 代表JOIN操作的表达式。JJTLIMITWITHOFFSET: 代表LIMIT和OFFSET子句。JJTPLAINLIMIT: 代表一个简单的LIMIT子句。JJTEXPRESSION: 代表一个表达式。JJTREGULARCONDITION: 代表一个常规条件(如WHERE子句中的条件)。JJTINEXPRESSION: 代表IN表达式。JJTLIKEEXPRESSION: 代表LIKE表达式。JJTSIMILARTOEXPRESSION: 代表SIMILAR TO表达式。JJTISDISTINCTEXPRESSION: 代表IS DISTINCT FROM表达式。JJTEXPRESSIONLIST: 代表一个表达式列表。JJTPRIMARYEXPRESSION: 代表一个主要表达式。JJTCONNECTBYROOTOPERATOR: 代表CONNECT BY ROOT操作符。JJTCASEWHENEXPRESSION: 代表CASE WHEN表达式。JJTFUNCTION: 代表一个函数调用。JJTSEQUENCE: 代表一个序列。JJTSYNONYM: 代表一个同义词。

Visit常见应用场景

目前我们知道,通过Mybatis 的 interceptor可以拦截到所有执行的SQL语句,而在 自定义的interceptor中调用自定义的visit,就可以对项目中所有运行的SQL做一个拦截并处理,那么具体可以做哪些骚操作呢

SQL语句重写: 在某些数据库系统中,为了优化性能或满足特定的需求,可能需要重写SQL语句。通过自定义访问者,可以在AST(abstract syntax tree)层面进行这些操作

元数据提取: 自定义访问者可以用来提取SQL语句中的元数据,比如查询涉及的所有表名、列名、函数等,这些信息可以用于构建数据库的概要图或进行数据治理。

数据屏蔽: 在需要对敏感数据进行屏蔽的应用中,可以通过自定义访问者来识别并修改涉及敏感数据的查询,以确保在查询结果中不会暴露敏感信息。

动态查询构建: 在需要动态构建SQL查询的应用中,可以通过自定义访问者来解析模板SQL语句,并根据实际参数动态替换模板中的占位符,从而构建出完整的SQL语句。

缓存策略决策: 根据SQL查询的特征,可以通过自定义访问者来判断查询结果是否适合缓存,以及应该使用什么样的缓存策略。

总结

Jsqlparser非常容易上手使用,而它也解决了解析SQL语句的问题,结合Springboot 和 mybatis,可以设计自定义插件,就像Mybatis plus的分页插件那样,可以开发自己系统需求的业务处理功能,方便项目业务的时间,甚至可以拿来提高效率,毕竟总有一些时候,对SQL的解析是绕不开的。


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/172187.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1