1 类型转换异常场景
多线程环境
单线程环境
2 Jedis类型转换异常案例
2.1 案例介绍
2.2 Jedis原理介绍
2.3 类型转换异常的原因
3 Jedis类型转换异常的解决办法
4 问题深思
问题1:jedis为什么要暴漏这么个危险的API给用户使用
问题2:请求和响应的不匹配问题
同步通信:
异步通信:
1 类型转换异常场景我们在使用Jedis的时候,经常会出现类型转换异常,有如下情况:
多线程环境Jedis是线程不安全的,如果存在多线程使用同一个Jedis,就会出现类型转换异常网上也流传着很多错误的解释,下面我们以一个案例来复现下这个问题,这个很好理解。
单线程环境即使在单线程的情况下,也是会出现类型转换异常的,下面就针对此做一个案例分析
2 Jedis类型转换异常案例 2.1 案例介绍案例是从这里来的Jedis returnResource使用注意事项
代码如下:
public static void main(String[] args) throws Exception{
Jedis jedis = new Jedis("192.168.126.131", 6379);
System.out.println("get name=" + jedis.get("name"));
System.out.println("Make SocketTimeoutException");
System.in.read(); //等待制造SocketTimeoutException
try {
System.out.println(jedis.get("name"));
} catch (Exception e) {
e.printStackTrace();
}
System.out.println("Recover from SocketTimeoutException");
Thread.sleep(50000); // 继续休眠一段时间 等待网络完全恢复
boolean isMember = jedis.sismember("urls", "baidu");
System.out.println("isMember " + isMember);
jedis.close();
}
以及包含2个阻断和解除网络通信的命令
阻断网络通信
sudo iptables -A INPUT -p tcp --dport 6379 -j DROP
解除网络阻塞
sudo iptables -F
案例运行过程描述:
1 创建Jedis,发送get命令,启动与redis的连接,连接成功后获取到响应数据
2 程序阻塞在System.in.read(),等待输入,此时我们需要将网络连接阻塞,执行上述阻断网络命令
3 输入任意数据,让程序不再阻塞,继续走下去,执行get命令,此时由于网络不通,导致出现SocketTimeoutException异常
4 打印出异常,继续往下走,sleep 50s,此时我们需要解除网络阻塞,执行上述对应命令
5 50s过完,就会执行jedis的sismember方法,此时就会出现类型转换异常
2.2 Jedis原理介绍Jedis内部有一个Socket与redis服务器建立连接。在创建Jedis对象的时候,并没有去建立连接,而是在执行命令的时候才会先检查是否已连接,未连接的话,才建立连接。
Socket一旦连接建立,就会获取到Socket的OutputStream,并用RedisOutputStream进行包装,获取到Socket的InputStream,并用RedisInputStream进行包装。RedisOutputStream内部含有一个byte buf[]数组。
也就是说在jedis在向OutputStream写入命令的时候,会先写入到上述buf数组中,然后在读取的时候,才会flush上述数据,将数据写入到Socket的OutputStream中,并调用flush,以Jedis的get方法为例
public String get(final String key) {
checkIsInMulti();
client.sendCommand(Protocol.Command.GET, key);
return client.getBulkReply();
}
client.sendCommand方法会将数据写入到RedisOutputStream内部的buf中 client.getBulkReply方法会首先执行一次flush,即将buf中数据写入到Socket的OutputStream中,并调用Socket的OutputStream的flush。
2.3 类型转换异常的原因网上很多人说造成上述场景的类型转换异常是因为:
出现SocketTimeoutException异常后,RedisOutputStream的buf中残留上次命令,没做清理处理,导致再执行其他命令时连同之前的命令一起发送过去了。
经过查看RedisOutputStream的源码,buf中确实不会去主动清除原有数据,而是每次都是直接覆盖,有count指针来标记,但是这也不会造成上述所说的影响,RedisOutputStream是OK的。
首先我们要明白什么是SocketTimeoutException异常: 上述Jedis的Socket在发送完成数据后,就会去执行读取数据,即读取Socket的InputStream中的数据,并且又一定的阻塞时间,如果redis服务器迟迟不返回数据,一旦超过SO_TIMEOUT(即Socket的读取超时时间),客户端就会抛出一个SocketTimeoutException异常。
造成这种异常的原因有很多:
网络闪断(会TCP重传):上述案例情景就是网络断开,数据包发送失败,会TCP重传
网络没有断,但是传输比较慢,或者redis服务器处理很慢
上述原因都会造成客户端读取超时。一旦超时,我们的Jedis程序抛出异常,继续往下走,如果此时再次执行其他命令的话,仍然会读取服务器端响应,此时读到的响应就是上次请求的响应了,所以会导致类型转换异常。如果与上次请求的类型一致,那就更可怕了,错误就会被深深的掩盖过去了。
3 Jedis类型转换异常的解决办法上述问题就是:我们没有正确对待这个SocketTimeoutException异常,即一旦出现SocketTimeoutException异常,我们是必须要废弃掉这个Jedis的。所以对于单线程环境下的Jedis来说,一旦出现这种异常,我们需要重新new一个新的Jedis来使用。
Jedis在内部执行出现异常,如SocketTimeoutException异常的时候,会标记一个boolean broken=true,即意味着该连接已经废弃了。
重要的大坑在这里,我们通常使用JedisPool来应对多线程环境下Jedis的使用,一般使用方式如下:
Jedis jedis = null;//从pool中获取资源
try{
jedis = pool.getResource();
jedis.set("k1", "v1");
}catch(Exception e){
e.printStackTrace();
}finally{
if(jedis != null){
pool.returnResource(jedis);//向连接池“归还”资源,千万不要忘记。
}
}
而对于JedisPool,我们会使用returnResource方法来向pool中释放回Jedis,而这个returnResource却忽视了上述boolean broken属性,直接将一个标记废弃的连接放回到了pool中,下次别人取的时候,必然出问题。
所以针对JedisPool这种情况,解决办法如下:
1 在上述catch中捕获SocketTimeoutException异常,调用pool的returnBrokenResource方法来释放Jedis(该方法会将Jedis实例标记为下线,无法被他人获取到了),但是不推荐这种,还要考虑其他异常等等
2 另一个就是直接调用Jedis的close方法,最新版2.9.0(其他版本没验证)中close方法对上述boolean broken标记进行了处理,并且将returnResource标记成废弃了,处理如下
public void close() {
if (dataSource != null) {
if (client.isBroken()) {
this.dataSource.returnBrokenResource(this);
} else {
this.dataSource.returnResource(this);
}
} else {
client.close();
}
}
上述this.dataSource可以理解为JedisPool。 即一旦是broken,则调用pool的returnBrokenResource方法,否则调用pool的returnResource方法。
所以最终写法应该如下:
Jedis jedis = null;//从pool中获取资源
try{
jedis = pool.getResource();
jedis.set("k1", "v1");
}finally{
if(jedis != null){
jedis.close();
}
}
4 问题深思
可以想到2方面的问题:
问题1:jedis为什么要暴漏这么个危险的API给用户使用即要求用户自觉的close,不自觉后果自负
如果是我们在开发框架给被人使用,那就要尽量避免这种API的设计,把close自动隐藏在框架内部,避免了使用人员的误使用,同时减少了代码的复杂度,即使是上述最终的写法也是很丑陋的,要完成一个set功能,要关注太多地方了,这部分完全可以框架底层包装起来,只给用户一个set方法即可。
问题2:请求和响应的不匹配问题这种不匹配的问题在同步和异步的时候分别怎么处理?
同步通信:在设计的时候,必须发送一次请求就要读取一次响应,通过这种方式来匹配。然而在某些情况下,读取响应有一定的超时时间,一旦超时,就抛出SocketTimeoutException异常,从而结束本次读取,而响应可能后来又到达了,这种情况就会造成不匹配的现象。要避免这种情况,就必须要废弃掉这个Socket了,所以如果客户端设计成同步通信的时候,一旦遇到这种异常,则就需要废弃了,重新建立连接了。
异步通信:在设计的时候一般会为每个请求分配一个请求id,服务器端在处理请求后,会把这个请求id返回给客户端,客户端根据返回的请求id来匹配是那一次的请求对应的响应,就不会出现上述那种匹配错乱的问题。异步通信在读取数据的时候也通常是有数据可读才会去执行读操作,可以减少同步通信中因网络拥堵或其他原因造成的SocketTimeoutException问题。异步通信好处的代价就是比同步通信复杂。
所以如果我们在设计的时候,就需要去考虑这样的问题,避免造出一个大坑来。
以上就是redis分布式Jedis类型转换的异常深入研究的详细内容,更多关于redis分布式Jedis类型转换异常的资料请关注易知道(ezd.cc)其它相关文章!