Java 集合框架 Collection List Map

Q1 Collection

java的集合以及集合之间的继承关系?

数组和链表的区别?

固定长度,连续内存,不能扩展,随机访问快,插入删除慢。链表相反

 

List, Set, Map的区别?

List,Set继承Collection接口

List可以放重复数据,Set不能,Map是k-v对

 

List和Map的实现方式以及存储方式?

ArrayList: 底层动态数组。随机访问快,增删慢,线程不安全。

扩容导致数组复制,批量删除会导致找两个集合交集,效率低。

LinkedList: 底层链表(双向列表)。增删快,查找慢,线程不安全。

遍历: 1.普通for循环,元素越多后面越慢 2.迭代器:每次访问,用游标记录当前位置

根据下标获取node,会根据index处于前半段还是后半段进行折半,提升效率。

HashMap: 散列表, 数组+链表+红黑树(JDK1.8) 默认16, 扩容2的幂

 

Q2 List

ArrayList实现原理?

动态数组,默认10,扩容grow(minCapacity),增加到1.5倍

ArrayList和LinkedList的区别,以及应用场景?

1.动态数组和双向队列链表。

2.ArrayList(实现了RandomAccess接口)用for循环遍历优于迭代器,LinkedList则相反。

3.ArrayList在数组任意位置插入,或导致该位置后面元素重新排列,效率相对低。

LinkedList增删只需移动指针,时间效率高。不需扩容,空间效率也高。但随机访问元素时间效率低。

 

链表翻转? 手写链表逆序代码?

方法1:递归: 从最后一个Node开始,在弹栈的过程中将指针顺序置换。

 1 public class Node {
 2 
 3     private String data;
 4 
 5     private Node next;
 6 
 7               // Getter() & Setter()
 8 
 9 }
10 
11     public Node reverse(Node head) {
12 
13         if (head == null || head.getNext() == null) {
14 
15             return head;
16 
17         }
18 
19         Node temp = head.getNext();
20 
21         Node newHead = reverse(head.getNext());
22 
23         temp.setNext(head);
24 
25         head.setNext(null);
26 
27         return newHead;
28 
29 }

View Code

解析:递归本质是系统压栈,压栈时保留现场。

例子:A->B->C->D

程序先压栈,到达倒数第2个节点时(C),C的next为D, reverse(D)返回D。

接着就是弹栈过程,执行temp.setNext(head); 此时temp是D, head是C,temp的next设置为C, 就是D->C, 不过head是C,还有next是D,这句会形成环(D->C->D)。需要下一句head.setNext(null);把C的next指针断开,形成D->C(C.next->null)的反转最后2个节点。返回新链表的头结点newHead,也就是D。后面进行相同操作,最终完成整个链表的反转。

方法2:遍历: 在链表遍历的过程中将指针顺序置换。

 1 public Node traverseReverse(Node head) {
 2 
 3               Node pre = null;
 4 
 5               Node next;
 6 
 7               while(head != null) {
 8 
 9                              next = head.getNext();
10 
11                              head.setNext(pre);
12 
13                              pre = head;
14 
15                              head = next;
16 
17               }
18 
19               return pre;
20 
21 }

View Code

解析:在head点遍历, 第一次时为A节点,next为B节点,head(A)节点的next设置为前一个节点pre(当前为null),把head节点赋给pre,pre为A节点,再把next节点(B)赋给head。

进行下一次循环,head为B节点,pre为A节点,head(B)节点的next设置为前一个节点pre(A),形成B->A,再复制给pre。Head移动到下一个节点。依次继续循环。。。

 

判断一个单链表是否有环?如果有环找出环的起点,以及环的长度?

方法一,穷举遍历。用新节点ID和此节点之前所有节点ID依次比较,如发现存在相同ID,则有环。时间复杂度O(N*N), 没有额外空间,空间复杂度O(1)

方法二,哈希表HashSet缓存。如发现存在相同节点,则说明有环。时间复杂度O(N),空间复杂度O(N)。

方法三,快慢指针。快指针移动2个节点,慢指针移动1个节点。然后比较2个指针节点是否相同。相同有环。

 

Q3 Map

HashMap数据结构,实现原理?put, get, resize等工作原理?

HashMap存储key-value键值对。Key和value都允许为null。Key重复会被覆盖,value可以重复。无序。非线程安全。

JDK1.7 数组+链表,JDK1.8 数组+链表+红黑树。

默认集合容量16,默认填充因子0.75,数组长度为2的幂次方,链表长度>8,集合容量>64,链表转红黑树,当红黑树节点个数小于6,又会转化为链表。新增红黑树作为底层数据结构,在数据量较大且哈希碰撞较多时,提高索引效率。

HashMap实现原理:

底层table,是一个Node<K,V>的数组,当添加一个元素时,先计算key的hash值,以此确定插入table的位置。如果同一个hash的元素已经放入在table的同一位置,则添加到该元素的后面,形成链表。当链表过长时,转化为红黑树,提高查询效率。

计算数组table索引的方法:(算hash是1,2步,第3步算table索引)

1. 取 hashCode 值: h = key.hashCode()

2. 高位参与运算:h ^ (h>>>16)

     好处:右位移16位,正好是32bit的一半,高半区和低半区做异或,就是为了混合原始哈希码的高位和低位,以此来加大低位的随机性。

3. 取模运算:(table.length – 1) & hash

    为什么用&,不用%? 因为lenth = 2n 时,X % length = X & (length – 1), & 的效率比 % 高很多。

Put()方法工作原理:

① 判断键值对数组 table 是否为空或为null,否则执行resize()进行扩容;

② 根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③;

③ 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals;

④ 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤;

⑤ 遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树(treeifyBin),在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;

⑥ 插入成功后,判断实际存在的键值对数量size是否超过了最大容量threshold,如果超过,进行扩容resize()。

⑦ 如果新插入的key不存在,则返回null,如果新插入的key存在,则返回原key对应的value值(注意新插入的value会覆盖原value值)

 

 

 

 

Resize扩容的工作原理:

1.计算新桶数组的容量 newCap

2.新阀值 newThr

3. 将原集合的元素重新映射到新集合中

3.1 既不是链表又不是红黑树,直接插入

3.2 红黑树,调用split方法重新分配

3.3.链表,不用像JDK1.7重新计算hash,只看原hash值新增的bit是1还是0,是0则索引不变,是1则索引变为”原索引+oldCap”

Get工作原理:

1. 通过key的hash计算table索引位置:hash & (length – 1)。

2. 检查数组该位置节点是否刚好是要找的元素,如果是则返回,如果不是则第3步。

3. 判断该元素时否TreeNode, 如果是则用红黑树TreeNode的方法find查找元素。如果不是则第4步。

4.遍历链表,找到相等(==或equals)的key。

HashMap线程不安全实际会如何体现?

1. 多线程同时Put元素,假设key发生碰撞(hash相同),这个两个key会添加到数组同一个位置,其中一个线程的数据被覆盖。

2. 多线程同时检查到需要扩容,都在重新计算元素位置及复制数据,最终只有一个线程扩容后的数组会赋值给table,其他线程会丢失。

 

HashMap如何变成线程安全?

1. Collections.synchronizeMap();

2. ConcurrentHashMap(java.util.concurrent). JDK1.5+

 

为什么String, Integer这样的wrapper类适合作为键?

String是不可变的,所以他创建的时候hashcode就被缓存了,不需要重新计算。还有字符串的处理速度要快过其他的键对象。

Integer的hashcode返回本身的值,也是不变的。

 

重新调整HashMap的大小存在什么问题?

JDK1.7多线程会产生竞争条件(race condition)。

两个线程同时尝试调整大小。调整过程,存储链表中元素次序会反过来,放在头部不是尾部,是为了避免尾部遍历(tail traversing)。如果竞争条件发生,就产生死循环。

HashMap中如何解决碰撞问题?如何减少碰撞?

在调用Put和get方法时,首先通过key的hashcode方法计算哈希桶的位置在存储对象。当获取对象时,通过键对象的equals()方法找到正确的键值对。

HashMap使用链表来解决碰撞问题,当碰撞发生了,对象将会存储在链表的下一个节点。

减少碰撞:1. 使用不可变,声明为final的对象,比如String 作为Key。

2.采用合适的equals()和hashCode()方法,将会减少碰撞发生,提高效率。String已经重写了equals和hashcode方法,很适合作为HashMap的Key。

 

LinkedHashMap和TreeMap是如何保证它的顺序的?

LinkedHashMap继承HashMap.Node的属性,额外增加了before, after用于指向前一个Entry和后一个Entry,在哈希表继承上构成双向链表。可以按照插入的顺序排序的Map。

TreeMap是按照Key的自然顺序或者Comparator的顺序进行排序。

LinkedHashMap是双向链表,TreeMap是红黑树。

它们两个哪个的有序实现比较好?

如果要按自然顺序或自定义顺序遍历键,那么TreeMap实现更好。如果需要输出的顺序和输入的相同,那么用LinkedHashMap实现更好。

 

 

Collection思维导图Github地址:

https://github.com/channingy/JavaSummary/

参考资料:

https://www.cnblogs.com/ysocean/p/8657850.html

https://www.cnblogs.com/ysocean/p/8711071.html

https://www.cnblogs.com/litexy/p/9744241.html

版权声明:本文为fyql原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/fyql/p/11027148.html