2016年7月20日星期三

Redis 内存容量优化

在上一篇blog中(http://wadeling.blogspot.com/2016/07/redis.html),提到接手的一个redis服务,这个redis服务一开始是完全用string类型来存储key值,导致需要的内存容量非常的大。而且咨询使用方,有可能业务量还要几倍的上涨,而我们现在的机器只有16G内存,就算加内存,内存压力也太大了。于是有了内存优化的想法。
查询了网络上的一些优化文章,通过实验,发现还是有不少优化效果。具体思路就是把string类型的数据转成hash来存,同时保证每个hashkey里面的filed个数在一定范围内,这样redis会把hash的内存做优化处理,减小了内存的使用量。经过实验,100万个key,采用string类型存储,需要88M的内存,如果用hash来存,只需要45M内存。
优化方案如下:
1.查看redis的hash设置
通过cli方式查看:config get hash-max-ziplist-entries,值是512.
config get hash-max-ziplist-value,值是64.
即每个hashkey里面的field数目为512一下,value长度是64字节以内时,redis会对内存做优化。
2.对10万个key做分hash存储

//把md5字符串转成整数,具体方法是取前面8个字符,用base_convert转成10进制
$md5int = $this->md5str_to_int($md5str);

//3000为估算,即最后会有3000个hashkey,每个hashkey里面大概有300多个field,满足要求
$key = $md5int % 3000;

//hset来存入
$ret = $this->redis->hSet($key,$md5str,$value);


参考:
redis内存容量优化
Redis内存优化案例
instagram使用redis内存优化
redis官方内存优化方案

2016年7月12日星期二

redis内存容量估算

最近刚接手一个redis服务,由于是内部使用,所以在redis前端封装了一层代理,用于内部协议和redis协议的转化,并不复杂。但是使用方刚使用两天,就发现内存爆量了。具体现象是redis返回的错误:OOM command not allowed when used memory > 'maxmemory',使用方给出的请求量是:5000万key,每个key40字节(string类型),每个value8字节,这样算下来只要2.4G内存啊,怎么一下内存就爆了。
我也是刚接触redis,只好研究了一番,还好网上有一篇文章,详细说明了redis的容量估算问题,简单的说就是redis占用的内存除了业务数据之外,还有redis自己的数据结构也会占用一部分内存,所以实际占用内存会大于业务数据的。链接在此:http://www.searchdatabase.com.cn/showcontent_55189.htm
根据文章提供的公式,结合使用方提供的数据,估算的容量如下:
1.首先是计算公式:
string类型的内存大小 = 键值个数 * (dictEntry大小 + redisObject大小 + 包含key的sds大小 + 包含value的sds大小) + bucket个数 * 4

2.根据使用方提供的数据,占用的redis内存容量如下:
dictEntry大小: 16 字节
redisObject大小:16字节
key:40字节, sds对象:9 字节。总共是49字节,按jemalloc分配机制会占用到64字节。
value:8字节,sds对象:9字节,总共是17字节,按jemalloc分配机制会占用到32字节。
以上的内存占用量为:
 (16 + 16 + 64 + 32)* 5000*1000*10 = 6.4G

bucket个数大概为6000万(5000万向上取整到2的n次方,即2的26次方,6000多万)
bucket大小:6000万*4 = 240M左右。

所以总容量为6.4G左右,而redis的配置里面maxmemeroy只配置了4G,难怪要报错了。修改配置后,运行正常了。
从redis里面也可以看到峰值使用内存为6.44G, 和计算出来的容量是吻合的.











2016年6月29日星期三

PHP SSH2 的各种问题

最近两天,不断碰到php ssh2的问题,总结下来有几个:
1.PHP Warning: ssh2_scp_send(): Failed copying file
 此问题出现在传大文件的时候
2.PHP Warning: ssh2_exec(): Unable to request a channel from remote host
 连接某台机器的时候,执行shell命令的时候。其他机器没问题。

对于第一个问题,测试机上没问题(php ssh2 扩展版本为0.11.3),生产环境有问题(php ssh2 版本为 0.11.0),所以更新生产环境为0.11.3。但是测试还是有问题,百思不得其解。
后面再更新为0.13 stabel版本,ssh2_scp_send 不再报错了,但是传文件后发现文件md5结果不一样!又再google一番,在ssh2_scp_send之后增加一句:ssh2_exec($con, 'exit');这样才ok了。
但是在测试的时候,发现另外一个新的问题:
php: symbol lookup error: /usr/local/php/lib/php/extensions/no-debug-zts-20100525/ssh2.so: undefined symbol: libssh2_session_set_timeout
然后 nm ssh2.so |grep libssh2_session_set_timeout,发现这个函数是引用的外部实现。那这个函数在哪个so里面呢?找了一下,在libssh2.so.1里面,但是为啥没找到呢。
和运维同学想了半天,最后发现/etc/ld.so.conf.d/libssh2.conf 这个文件里面没有把 libssh2.so.1的路径包含进去,最后修改libssh2.conf文件,增加 /usr/local/libssh2/lib,这下ok了。

总结:碰到过两次php扩展版本的问题,之前碰到过memcache的问题,也是用的beta版本导致很多问题。这次也是一样。所以以后任何的扩展,都要仔细检查是否是stable版本的。

2016年3月31日星期四

php foreach reference 导致的问题

今天碰到一个奇怪的问题,在一个php脚本中写了一个foreache循环,遍历一个数组,同时修改数组里面的元素。大致就是这样:
foreach ($a as $key => &$value) {
   $value['ttt'] = '123';
}
forearch ($a as $key => $value) {

}
结果第二次循环的时候,数组最后一行数据居然没有了。
第一次循环完dump出来的数组又是对的,但是其中一行有点奇怪,大概是这样:
 &array(1) {
    [0]=>
    &array(20) {
      ["sampleID"]=>'aaa'
    }
 }
和这个有没有关系呢?搜了一圈,找到原因了。
这篇解释得很清楚:
php foreach reference
解决方法就是在使用引用完后要unset一下。php manual也有说明
php:foreach

2016年2月23日星期二

“Illegal double … value found during parsing” 错误

刚刚碰到的一个问题,数据提交时报"Illegal double '20160221E0259700' value found during parsing"错误。但是程序运行了一段时间,怎么会报错呢?查了一下,带"E"的串会被PHP认为是double变量,而要更新的这个字段是一个varchar类型,所以导致错误。
之前为啥没报错呢,因为代码太搓:update strid=2016123456,这样就没报错,实际上应该是update strrid='201612345'。坑啊!

2016年1月15日星期五

GCC 4.4.6 const char* to char* compiler error

今天在编译一个同事的代码发现一个小问题,就是报编译错误: error: invalid conversion from ‘const char*’ to ‘char*’,报错出在strstr这个函数,但是他原来编译又是ok的。猜测是GCC版本不一致导致的问题,一看果然是,他用的gcc 4.1.2,我用的gcc 4.4.6。但是为啥gcc 4.4.6编译会报错呢,查了一下gcc 手册:

Strict null-terminated sequence utilities

Some of the standard C++ library include files have been edited to use replacement overloads for some common C library functions (if available), with the goal of improving const-correctness: functions passed a const char* return const char*.
The table below shows the functions and files that have been changed.
HeaderFunctions
<cstring>strchrstrpbrkstrrchrstrstrmemchr
<cwchar>wcschr wcspbrkwcsrchrwcsstrwmemchr
An example.
#include <cstring>

const char* str1;
char* str2 = strchr(str1, 'a');
Gives the following compiler error:
error: invalid conversion from ‘const char*’ to ‘char*’
Fixing this is easy, as demonstrated below.
#include <cstring>

const char* str1;
const char* str2 = strchr(str1, 'a');
More information about the C++ standard requirements can be found in chapter 21, section "Null-terminated sequence utilities."

链接:https://gcc.gnu.org/gcc-4.4/porting_to.html
=====

原来是C++的标准库头文件有变化,目标是“improving const-correctness”,其中就有strstr这个函数。好吧,在原来的代码修改了加了强制转化就ok了。