分类 sparksql 下的文章

sparksql 2.3.2开启全阶段生成代码后limit执行很慢

背景最近在查Hive metastore的mysql主从同步延迟的问题,需要分析mysql的binlog,所以写了一个binlog datasource大概是这么使用的:spark.sql( ...