最近从在学习MySQL数据库,遇到一些问题,有些解决了,有些还未找到答案,本篇作为学习笔记,未解决的问题等后续有答案再补充,也请走过路过的大牛们指点一二;
问题一:Java程序查询MySQL表数据,由于MySQL默认将查询结果全部加载到内存中,数据量比较大时,会报OOM,以下是解决这个问题过程中在网上找到的三种常见解决方案:
方案1)
1 setFetchSize(Integer.MIN_VALUE);
方案2)
1 conn = DriverManager.getConnection("jdbc:mysql://localhost/?useCursorFetch=true", "user", "password"); 2 stmt = conn.createStatement(); 3 stmt.setFetchSize(100);
方案3)分页查询,由于某些比较囧的原因,我最终选取了这个方案;
1 --分页查询语句示例 2 select * from tablename order by col limit offset, pagesize;
当offset比较大的时候,查询效率很低,以下是网上查到的两种解决办法
1 --1 2 select * from tablename where col1 > (select col1 from tablename order by col1 limit (&page-1)*&pagesize,1) order by col1 limit &pagesize; 3 4 --2 5 select t1.* from tablename as t1 join (select col1 from tablename order by col1 limit (&page-1)*&pagesize,1) as t2 where t1.col1 >= t2.col1 order by t1.col1 limit &pagesize; 6 7 --语句2对于当表的主键是复合字段的时候比较容易扩展,可以写成 8 select t1.* from tablename as t1 join (select col1, col2 from tablename order by col1, col2 limit (&page-1)*&pagesize,1) as t2 where t1.col1 > t2.col1 or (t1.col1 = t2.col1 and t1.col2 >= t2.col2) order by t1.col1, t1.col2 limit &pagesize;
用来排序的col1, col2字段是查询的表的主键字段,一般来说,使用分页查询,表最好是有一个自增的数值型的主键会比较好,查询效率比较高,如果主键是多个字段,可以看出来查询的SQL会写得非常复杂,效率也很低。
我的测试数据是500w,pagesize是50,当表里面的主键是两个字段时,翻第二页的时间用了50+秒,可见效率有多低……只能看看还有没有优化办法,其实我的需求是扫全表,因此只要每次翻页的时候把上一页查到的最后一条记录
主键值传给下一个查询语句就可以优化不少时间,最终的方案如下:
1 String sqltext = "select col1, col2 from tablename where col1 > ? or (col1 = ? and col2 > ?) order by col1, col2 limit &pagesize"; 2 3 PreparedStatement prepStmt = null; 4 ResultSet rs = null; 5 prepStmt = conn.prepareStatement(sqltext); 6 7 String iCol1 = ""; 8 String iCol2 = ""; 9 10 while(true) 11 { 12 prepStmt.setString(1,iCol1); 13 prepStmt.setString(2,iCol1); 14 prepStmt.setString(3,iCol2); 15 rs = prepStmt.executeQuery(); 16 int rsCnt = 0; 17 while(rs.next()) 18 { 19 rsCnt++; 20 if(rsCnt == PAGESIZE) 21 { 22 iCol1 = rs.getString("col1"); 23 iCol2 = rs.getString("col2"); 24 } 25 } 26 if(rsCnt == PAGESIZE) break; 27 }
问题二(未解决),MySQL 存储过程,使用insert ignore 语句新增表记录,程序中断重提没有新增成功(实际表里面没有该记录),去掉ignore就成功新增了,不清楚中间发生了什么事?单独调研存储过程insert ignore没问题。在Java程序中调用出现这种情况。
问题三(未解决),向MySQL中新增10G左右的数据(执行好几次),MySQL生成150G左右的二进制日志,我需要继续学下MySQL二进制日志文件的相关内容,じゃ~また