您当前的位置:首页 > 分类 > 技术资讯 > face > 正文

php一致性哈希算法

发布时间:2017-06-07 11:01:37      来源:51推一把
【摘要】一致性哈希算法 优点:在分布式的cache缓存中,其中一台宕机,迁移key效率最高 将服务器列表进行排序,根据mHash($key) 匹配相邻服务器
/**
 * 分布式缓存部署方案
 * 当有1台cache服务器不能满足我们的需求,我们需要布置多台来做分布式服务器,但是
 * 有个问题,怎么确定一个数据应该保存到哪台服务器上呢?
 * 有两种方案,第一种普通hash分布,第二种一致性哈希分布
 *
 * 普通hash分布
 * 首先将key处理为一个32位字符串,取前8位,在经过hash计算处理成整数并返回,然后映射到其中一台服务器
 * $servers[mhash($key) % 2] 这样得到其中一台服务器的配置,利用这个配置完成分布式部署
 * 在服务器数量不发生变化的情况下,普通hash分布可以很好的运作,当服务器的数量发生变化,问题就来了
 * 试想,增加一台服务器,同一个key经过hash之后,与服务器取模的结果和没增加之前的结果肯定不一样,这就导致了,之前保存的数据丢失
 *
 * 一致性哈希算法
 * 优点:在分布式的cache缓存中,其中一台宕机,迁移key效率最高
 * 将服务器列表进行排序,根据mHash($key) 匹配相邻服务器
 */

/**
 * hash算法
 * @param string $key
 * @return int
 */
function mHash($key)
{
    $md5 = substr(md5($key), 0, 8);
    $seed = 31;
    $hash = 0;
    
    for($i = 0; $i < 8; $i++){
        $hash = $hash * $seed + ord($md5{$i});
        $i++;
    }
    return $hash & 0x7FFFFFFF;
}

class FlexiHash
{
    // 服务器列表
    private $serverList = array();
    // 服务器列表key数组
     private $serverKeys = array();
    // 是否排序
    private $isSorted = false;
    
    /**
     * 添加服务器
     * @param string $server
     * @return boolean
     */
    function addServer($server)
    {
        $hash = mHash($server);
        if (!isset($this->serverList[$hash])) {
            $this->serverList[$hash] = $server;
        }
        $this->isSorted = false;
        return true;
    }
    
    /**
     * 移除服务器
     * @param string $server
     * @return boolean
     */
    function removeServer($server)
    {
        $hash = mHash($server);
        if (isset($this->serverList[$hash])) {
            unset($this->serverList[$hash]);
        }
        $this->isSorted = false;
        return true;
    }
    
    /**
     * 根据$key逆时针查找相邻的服务器
     * @param string $key
     * @return string
     */
    function lookup($key)
    {
        $hash = mHash($key);
        // 对服务器列表逆排序
        if (!$this->isSorted) {
            krsort($this->serverList, SORT_NUMERIC);
            $this->isSorted = true;
              $this->serverKeys = array_keys($this->serverList);
        }
        // 查找相邻的数据
        foreach ($this->serverList as $pos => $server) {
            if ($hash >=  $pos) return $server;
        }
        // 找不到,返回最后一个
        return $this->serverList[$this->serverKeys[count($this->serverList) - 1]];
    }
}

##测试
//将不同IP,做映射后,将关系存到serverList数组
$hserver = new FlexiHash();
$hserver->addServer(192.168.1.1);
$hserver->addServer(192.168.1.2);
$hserver->addServer(192.168.1.3);
$hserver->addServer(192.168.1.4);
$hserver->addServer(192.168.1.5);
$hserver->addServer(192.168.1.6);

//测试不同的key,hash后,查找对应的server
for($i=0; $i < 10000; $i++) {
    $t = $this->lookup(key.$i);
    $arr[] = $t;
}
print_r($arr);

##虚拟节点
如果实际使用中,机器不是很多,可以通过增加虚拟节点,来增加ip的分布

$hserver->addServer(192.168.1.1#1); //node1-1
$hserver->addServer(192.168.1.1#2); //node1-2
$hserver->addServer(192.168.1.1#3); //node1-3
$hserver->addServer(192.168.1.1#4); //node1-4
...
$hserver->addServer(192.168.1.2#1); //node1-1
$hserver->addServer(192.168.1.2#2); //node1-2
$hserver->addServer(192.168.1.2#3); //node1-3
$hserver->addServer(192.168.1.2#4); //node1-4
...



转自https://my.oschina.net/wangdk/blog/133040