面试HashMap你都扛不住,还想拿到offer?
HashMap面试题、Java面试题、2021年Java面试
当我们面试Java开发岗位时,面试官问的频率出现最多的问题,就是这个HashMap,不管是传统型公司还是互联公司,HashMap是必问的,所以作者爆肝整理了HashMap的23个问题以及答案,请查收!
1、你知道HashMap的数据结构吗?
- 判断当前数组是否需要初始化。
- 如果 key 为空,则 put 一个空值进去。
- 根据 key 计算出 hashcode。
- 根据计算出的 hashcode 定位出所在桶。
- 如果桶是一个链表则需要遍历判断里面的 hashcode、key 是否和传入 key 相等,如果相等则进行覆盖,并返回原来的值。
- 如果桶是空的,说明当前位置没有数据存入;新增一个 Entry 对象写入当前位置
- 当调用 addEntry 写入 Entry 时需要判断是否需要扩容。
- 如果需要就进行两倍扩充,并将当前的 key 重新 hash 并定位。
- 而在 createEntry 中会将当前位置的桶传入到新建的桶中,如果当前桶有值就会在位置形成链表。
- 首先也是根据 key 计算出 hashcode,然后定位到具体的桶中。
- 判断该位置是否为链表。
- 不是链表就根据 key、key 的 hashcode 是否相等来返回值。
- 为链表则需要遍历直到 key 及 hashcode 相等时候就返回值。
- 啥都没取到就直接返回 null
- 当前链表的大小是否大于预设的阈值,大于时就要转换为红黑树;
- 如果当前桶已经为红黑树,那就要按照红黑树的方式写入数据;
-
首先将 key hash 之后取得所定位的桶。
-
如果桶为空则直接返回 null 。
-
否则判断桶的第一个位置(有可能是链表、红黑树)的 key 是否为查询的 key,是就直接返回 value。
-
如果第一个不匹配,则判断它的下一个是红黑树还是链表。
-
红黑树就按照树的查找方式返回值。
-
不然就按照链表的方式遍历匹配返回值。
- 由数组+链表的结构改为数组+链表+红黑树。
- 优化了高位运算的hash算法:h^(h>>>16)
- 扩容后,元素要么是在原位置,要么是在原位置再移动2次幂的位置,且链表顺序不变。
- 因为红黑树需要进行左旋,右旋,变色这些操作来保持平衡,而单链表不需要;
- 当元素小于8个当时候,此时做查询操作,链表结构已经能保证查询性能;
- 当元素大于8个的时候,此时需要红黑树来加快查询速度,但是新增节点的效率变慢了;
- 如果一开始就用红黑树结构,元素太少,新增效率又比较慢,无疑这是浪费性能的;
- 扩容 resize()时,红黑树拆分成的树的结点数小于等于临界值6个,则退化成链表。
- 移除元素 remove()时,在removeTreeNode()方法会检查红黑树是否满足退化条件,与结点数无关。如果红黑树根root为空,或者root的左子树/右子树为空,root.left.left根的左子树的左子树为空,都会发生红黑树退化成链表。
- 多线程扩容,引起的死循环问题
- 多线程put的时候可能导致元素丢失
- put非null元素后get出来的却是null
- 因为字符串是不可变的,所以在它创建的时候hashcode就被缓存了,不需要重新计算。这就使得字符串很适合作为Map中的键,字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。
- 因为获取对象的时候要用到equals()和hashCode()方法,那么键对象正确的重写这两个方法是非常重要的,这些类已经很规范的覆写了hashCode()以及equals()方法。
输出值如下:
19、HashMap是线程安全的吗?如何实现线程安全?
- 通过Collections.synchronizedMap()来封装所有不安全的HashMap的方法,就连toString, hashCode都进行了封装,就是为每一个方法添加了synchronized关键字进行修饰。使用的是的synchronized方法,是一种悲观锁.在进入之前需要获得锁,确保独享当前对象,然后做相应的修改/读取。方式简单粗暴,但是效率低。
- 使用ConcurrentHashMap。只有在需要修改对象时,比较和之前的值是否被人修改了,如果被其他线程修改了,那么就会返回失败,是一种无锁的实现。基于CAS实现,类似于乐观锁机制。ConcurrentHashMap采用了”锁分段”策略,ConcurrentHashMap的主干是一个一个Segment组,在ConcurrentHashMap中,一个Segment就是一个子哈希表,Segment里维护了一个HashEntry数组,并发环境下,对于不同Segment的数据进行操作是不用考虑锁竞争的,对于同一个Segment的操作才需考虑线程同步。理论上就允许16个线程并发执行。
- 要统计整个ConcurrentHashMap的元素个数,可以将每个Segment的count相加,count是volatile变量,可以保证读到的是最新值,但count可能会在累加过程中发生改变,导致结果不正确。
- ConcurrentHashMap采用HashMap中的“快速失败”机制,即设置一个modCount变量,在put,remove,clean方法中都让modCount++,先尝试两次通过不对Segment加锁的方式统计Size,若发现前后的modCount不一致,则说明容器大小发生了变化,此时再通过锁住所有Segment的put,remove,clean方法计算count。
22、ConcurrentHashMap中put过程?
因为volatile不保证原子性,所以在put操作中需要对Segment加锁。
put操作分为两步:
- 是否需要扩容
- 在插入元素前先判断Segment里的HashEntry数组是否超过容量(cap*loadFactor),如果超过阈值,就进行扩容。值得一提的是,在HashMap中,是先插入元素后再检查是否达到容量,有可能造成扩容之后再也没有新元素插入,造成空间浪费。
- 举个例子,在ConcurrentHashMap中,现有元素正好等于容量,那么就先判断是否超过容量(没有超过),那么添加新元素(此时超出容量一个元素,但没有扩容)。而如果是HashMap,则先插入这个元素,发现超出容量,于是扩容,可再也没有新的元素添加进来了,于是造成了浪费。
- 定位元素位置
- 遍历HashEntry链表,找到对应元素位置并更新
23、HashMap和HashTable的区别?
- HashMap基于数组和链表实现。不考虑Hash冲突的情况下,仅需一次定位就能找到元素。比如在新增元素的时候,通过Hash函数将元素定位Hash表中某个位置,直接将数据存入到该地址上,当我们查找或者删除元素,可以直接通过Hash函数定位到该数据。但是没有什么事情都是完美的,如果两个不同的元素,通过哈希函数得出的实际存储地址相同怎么办?也就是说,当我们对某个元素进行哈希运算,得到一个存储地址,然后要进行插入的时候,发现已经被其他元素占用了,其实这就是所谓的哈希冲突,也叫哈希碰撞。HashMap采用了链地址法,也就是数组+链表的方式。把相同Hash值的数据放在了链表上。当HashMap中的链表出现越少,性能才会越好。当发生哈希冲突并且size大于阈值的时候,需要进行数组扩容,扩容时,需要新建一个长度为之前数组2倍的新的数组,然后将当前的Entry数组中的元素全部传输过去,扩容后的新数组长度为之前的2倍,所以扩容相对来说是个耗资源的操作。HashMap继承自AbstractMap,HashMap允许key、value为空。HashMap默认容量是16,且负载因子是0.75。HashMap是线程不安全的,效率高。
- HashTable和HashMap的实现原理几乎一样,HashTable不允许key和value为null;HashTable是线程安全的。但是HashTable线程安全的策略实现代价却太大了,简单粗暴,get/put所有相关操作都是synchronized的,这相当于给整个哈希表加了一把大锁,多线程访问时候,只要有一个线程访问或操作该对象,那其他线程只能阻塞,相当于将所有的操作串行化,在竞争激烈的并发场景中性能就会非常差。
以上是整理的比较全面的HashMap面试题,大家记住答案的同时,最好还是理解其原理,往期精彩面试题解析回顾:
- JAVA面试题 String s = new String(“xyz”);产生了几个对象?
- Java面试题 从源码角度分析HashSet实现原理?
- JAVA面试题 请谈谈你对Sychronized关键字的理解?
- JAVA面试题 线程的生命周期包括哪几个阶段? – Java蚂蚁 – 博客园 (cnblogs.com)
- JAVA面试题 StringBuffer和StringBuilder的区别,从源码角度分析?
- JAVA面试题 手写ArrayList的实现,在笔试中过关斩将?
- JAVA面试题 浅析Java中的static关键字?
- JAVA面试题 启动线程是start()还是run()?为什么?
- Java面试题 equals()与”==”的区别?