[Java复习] 集合框架 Collection

Java 集合框架 Collection List Map

Q1 Collection

java的集合以及集合之间的继承关系?

数组和链表的区别?

固定长度，连续内存，不能扩展，随机访问快，插入删除慢。链表相反

List, Set, Map的区别?

List，Set继承Collection接口

List可以放重复数据，Set不能，Map是k-v对

List和Map的实现方式以及存储方式?

ArrayList: 底层动态数组。随机访问快，增删慢，线程不安全。

扩容导致数组复制，批量删除会导致找两个集合交集，效率低。

LinkedList: 底层链表(双向列表)。增删快，查找慢，线程不安全。

遍历: 1.普通for循环,元素越多后面越慢 2.迭代器：每次访问，用游标记录当前位置

根据下标获取node，会根据index处于前半段还是后半段进行折半，提升效率。

HashMap: 散列表, 数组+链表+红黑树(JDK1.8) 默认16，扩容2的幂

Q2 List

ArrayList实现原理？

动态数组，默认10，扩容grow(minCapacity)，增加到1.5倍

ArrayList和LinkedList的区别，以及应用场景?

1.动态数组和双向队列链表。

2.ArrayList(实现了RandomAccess接口)用for循环遍历优于迭代器，LinkedList则相反。

3.ArrayList在数组任意位置插入，或导致该位置后面元素重新排列，效率相对低。

LinkedList增删只需移动指针，时间效率高。不需扩容，空间效率也高。但随机访问元素时间效率低。

链表翻转? 手写链表逆序代码?

方法1：递归: 从最后一个Node开始，在弹栈的过程中将指针顺序置换。

 1 public class Node {
 2 
 3     private String data;
 4 
 5     private Node next;
 6 
 7               // Getter() & Setter()
 8 
 9 }
10 
11     public Node reverse(Node head) {
12 
13         if (head == null || head.getNext() == null) {
14 
15             return head;
16 
17         }
18 
19         Node temp = head.getNext();
20 
21         Node newHead = reverse(head.getNext());
22 
23         temp.setNext(head);
24 
25         head.setNext(null);
26 
27         return newHead;
28 
29 }

View Code

解析：递归本质是系统压栈，压栈时保留现场。

例子：A->B->C->D

程序先压栈，到达倒数第2个节点时(C)，C的next为D, reverse(D)返回D。

接着就是弹栈过程，执行temp.setNext(head); 此时temp是D, head是C，temp的next设置为C, 就是D->C, 不过head是C，还有next是D，这句会形成环(D->C->D)。需要下一句head.setNext(null);把C的next指针断开，形成D->C(C.next->null)的反转最后2个节点。返回新链表的头结点newHead，也就是D。后面进行相同操作，最终完成整个链表的反转。

方法2：遍历: 在链表遍历的过程中将指针顺序置换。

 1 public Node traverseReverse(Node head) {
 2 
 3               Node pre = null;
 4 
 5               Node next;
 6 
 7               while(head != null) {
 8 
 9                              next = head.getNext();
10 
11                              head.setNext(pre);
12 
13                              pre = head;
14 
15                              head = next;
16 
17               }
18 
19               return pre;
20 
21 }

View Code

解析：在head点遍历, 第一次时为A节点，next为B节点，head(A)节点的next设置为前一个节点pre(当前为null)，把head节点赋给pre，pre为A节点，再把next节点(B)赋给head。

进行下一次循环，head为B节点，pre为A节点，head(B)节点的next设置为前一个节点pre(A)，形成B->A，再复制给pre。Head移动到下一个节点。依次继续循环。。。

判断一个单链表是否有环？如果有环找出环的起点，以及环的长度？

方法一，穷举遍历。用新节点ID和此节点之前所有节点ID依次比较，如发现存在相同ID，则有环。时间复杂度O(N*N), 没有额外空间，空间复杂度O(1)

方法二，哈希表HashSet缓存。如发现存在相同节点，则说明有环。时间复杂度O(N)，空间复杂度O(N)。

方法三，快慢指针。快指针移动2个节点，慢指针移动1个节点。然后比较2个指针节点是否相同。相同有环。

Q3 Map

HashMap数据结构，实现原理？put, get, resize等工作原理？

HashMap存储key-value键值对。Key和value都允许为null。Key重复会被覆盖，value可以重复。无序。非线程安全。

JDK1.7 数组+链表，JDK1.8 数组+链表+红黑树。

默认集合容量16，默认填充因子0.75，数组长度为2的幂次方，链表长度>8，集合容量>64，链表转红黑树，当红黑树节点个数小于6，又会转化为链表。新增红黑树作为底层数据结构，在数据量较大且哈希碰撞较多时，提高索引效率。

HashMap实现原理：

底层table，是一个Node<K,V>的数组，当添加一个元素时，先计算key的hash值，以此确定插入table的位置。如果同一个hash的元素已经放入在table的同一位置，则添加到该元素的后面，形成链表。当链表过长时，转化为红黑树，提高查询效率。

计算数组table索引的方法：(算hash是1,2步，第3步算table索引)

1. 取 hashCode 值： h = key.hashCode()

2. 高位参与运算：h ^ (h>>>16)

好处：右位移16位，正好是32bit的一半，高半区和低半区做异或，就是为了混合原始哈希码的高位和低位，以此来加大低位的随机性。

3. 取模运算：(table.length – 1) & hash

为什么用&，不用%? 因为lenth = 2ⁿ 时，X % length = X & (length – 1), & 的效率比 % 高很多。

Put()方法工作原理：

① 判断键值对数组 table 是否为空或为null，否则执行resize()进行扩容；

② 根据键值key计算hash值得到插入的数组索引i，如果table[i]==null，直接新建节点添加，转向⑥，如果table[i]不为空，转向③；

③ 判断table[i]的首个元素是否和key一样，如果相同直接覆盖value，否则转向④，这里的相同指的是hashCode以及equals；

④ 判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对，否则转向⑤；

⑤ 遍历table[i]，判断链表长度是否大于8，大于8的话把链表转换为红黑树(treeifyBin)，在红黑树中执行插入操作，否则进行链表的插入操作；遍历过程中若发现key已经存在直接覆盖value即可；

⑥ 插入成功后，判断实际存在的键值对数量size是否超过了最大容量threshold，如果超过，进行扩容resize()。

⑦ 如果新插入的key不存在，则返回null，如果新插入的key存在，则返回原key对应的value值（注意新插入的value会覆盖原value值）

Resize扩容的工作原理：

1.计算新桶数组的容量 newCap

2.新阀值 newThr

3. 将原集合的元素重新映射到新集合中

3.1 既不是链表又不是红黑树，直接插入

3.2 红黑树，调用split方法重新分配

3.3.链表，不用像JDK1.7重新计算hash，只看原hash值新增的bit是1还是0，是0则索引不变，是1则索引变为”原索引+oldCap”

Get工作原理：

1. 通过key的hash计算table索引位置:hash & (length – 1)。

2. 检查数组该位置节点是否刚好是要找的元素，如果是则返回，如果不是则第3步。

3. 判断该元素时否TreeNode, 如果是则用红黑树TreeNode的方法find查找元素。如果不是则第4步。

4.遍历链表，找到相等(==或equals)的key。

HashMap线程不安全实际会如何体现？

1. 多线程同时Put元素，假设key发生碰撞(hash相同)，这个两个key会添加到数组同一个位置，其中一个线程的数据被覆盖。

2. 多线程同时检查到需要扩容，都在重新计算元素位置及复制数据，最终只有一个线程扩容后的数组会赋值给table，其他线程会丢失。

HashMap如何变成线程安全？

1. Collections.synchronizeMap();

2. ConcurrentHashMap(java.util.concurrent). JDK1.5+

为什么String, Integer这样的wrapper类适合作为键？

String是不可变的，所以他创建的时候hashcode就被缓存了，不需要重新计算。还有字符串的处理速度要快过其他的键对象。

Integer的hashcode返回本身的值，也是不变的。

重新调整HashMap的大小存在什么问题？

JDK1.7多线程会产生竞争条件(race condition)。

两个线程同时尝试调整大小。调整过程，存储链表中元素次序会反过来，放在头部不是尾部，是为了避免尾部遍历(tail traversing)。如果竞争条件发生，就产生死循环。

HashMap中如何解决碰撞问题？如何减少碰撞？

在调用Put和get方法时，首先通过key的hashcode方法计算哈希桶的位置在存储对象。当获取对象时，通过键对象的equals()方法找到正确的键值对。

HashMap使用链表来解决碰撞问题，当碰撞发生了，对象将会存储在链表的下一个节点。

减少碰撞：1. 使用不可变,声明为final的对象，比如String 作为Key。

2.采用合适的equals()和hashCode()方法，将会减少碰撞发生，提高效率。String已经重写了equals和hashcode方法，很适合作为HashMap的Key。

LinkedHashMap和TreeMap是如何保证它的顺序的？

LinkedHashMap继承HashMap.Node的属性，额外增加了before, after用于指向前一个Entry和后一个Entry，在哈希表继承上构成双向链表。可以按照插入的顺序排序的Map。

TreeMap是按照Key的自然顺序或者Comparator的顺序进行排序。

LinkedHashMap是双向链表，TreeMap是红黑树。

它们两个哪个的有序实现比较好？

如果要按自然顺序或自定义顺序遍历键，那么TreeMap实现更好。如果需要输出的顺序和输入的相同,那么用LinkedHashMap实现更好。

Collection思维导图Github地址：

https://github.com/channingy/JavaSummary/

参考资料：

https://www.cnblogs.com/ysocean/p/8657850.html

https://www.cnblogs.com/ysocean/p/8711071.html

https://www.cnblogs.com/litexy/p/9744241.html

本文链接：https://www.cnblogs.com/fyql/p/11027148.html

[Java复习] 集合框架 Collection

[Java复习] 集合框架 Collection的更多相关文章

随机推荐

热门专题

目录导航