ADT基础（三）—

ADT基础（三）—— HashMap

iterationjia 2021-02-28 原文

HashMap的概述与原理

ADT基础（三）—— HashMap

1 哈希表

哈希表（hash table），也叫散列表，是一种非常重要的数据结构，应用场景及其丰富，许多缓存技术（比如memcached）的核心其实就是在内存中维护一张大的哈希表。
在哈希表中进行添加，删除，查找等操作，性能十分之高，不考虑哈希冲突的情况下（后面会探讨下哈希冲突的情况），仅需一次定位即可完成，时间复杂度为O(1)。
存储位置 = f(关键字) ，这个函数f一般称为哈希函数，这个函数的设计好坏会直接影响到哈希表的优劣。好的哈希函数会尽可能地保证计算简单和散列地址分布均匀。
- 插入操作，利用哈希函数计算存储位置存入。
- 查找同理，通过哈希函数计算实际存储地址，然后从数组对应地址取出即可。

2 哈希冲突

如果两个不同的元素，通过哈希函数得出的实际存储地址相同怎么办
- 当我们对某个元素进行哈希运算，得到一个存储地址，然后要进行插入的时候，发现已经被其他元素占用了，其实这就是所谓的哈希冲突，也叫哈希碰撞。
哈希冲突的解决方案有多种:
- 开放定址法（发生冲突，继续寻找下一块未被占用的存储地址）
- 再散列函数法
- 链地址法(HashMap采用)，也就是数组+链表的方式。

3 HashMap的实现原理

HashMap的主干是一个Entry数组。Entry是HashMap的基本组成单元，每一个Entry包含一个key-value键值对。
```
static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;//存储指向下一个Entry的引用，单链表结构
    int hash;//对key的hashcode值进行hash运算后得到的值，存储在Entry，避免重复计算
}
```
- 简单来说，HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了解决哈希冲突而存在的。
  - 如果定位到的数组位置不含链表（当前entry的next指向null）,那么查找，添加等操作很快，仅需一次寻址即可
  - 如果定位到的数组包含链表。
    - 对于添加操作，其时间复杂度为O(n)，首先遍历链表，存在即覆盖，否则新增；
    - 对于查找操作来讲，仍需遍历链表，然后通过key对象的equals方法逐一比对查找。所以，性能考虑，HashMap中的链表出现越少，性能才会越好。
- 其他内容，如put，get原理下次补充，参考博文

4 HashMap使用

Map< String, String> map = new HashMap<>();
map.put("aa", "@sohu.com");
map.put("bb","@163.com");  //map.put(k,v);
value = map.get("bb");  //map.get(key);
//通过Map.keySet遍历
for (String key : map.keySet()) value = map.get(key);
//通过Map.entrySet遍历
for(Map.Entry<String, String> entry : map.entrySet()){
    entry.getKey();
    entry.getValue());
}
//通过Map.values()遍历所有的value
for(String v : map.values())  v；