Java集合源码解析-ArrayList

    xiaoxiao2021-03-25  184

    从今天开始,会用一段时间对Java集合框架中的一些常用数据结构进行源码解析(部分的源码解析会以注释的方式出现)。首先入手的是ArrayList,ArrayList是一个动态数组,其容量能够自动增长。

     

    public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable

    从ArrayList类的定义中可以看出,它是支持泛型的,除了继承和实现与List相关的抽象类和接口外,还实现了RandomAccess,Cloneable, Serializable标记接口(接口中没有任何内容),表明ArrayList支持随机访问、拷贝和序列化。 首先从ArrayList的构造方法开始看起,ArrayList总共提供3种构造方法 private static final int DEFAULT_CAPACITY = 10; private static final Object[] EMPTY_ELEMENTDATA = {}; private transient Object[] elementData; //以transient修饰,说明其数组不会被序列化 private int size; //elementData数组中元素的数量 public ArrayList(int initialCapacity) { super(); if (initialCapacity < 0) throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); this.elementData = new Object[initialCapacity]; } public ArrayList() { super(); this.elementData = EMPTY_ELEMENTDATA; } public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); size = elementData.length; // c.toArray might (incorrectly) not return Object[] (see 6260652) if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } 从上述的构造函数源码可以看出,初始化ArrayList其实就是在初始化其内部的一个私有Object数组elementData。也就是说ArrayList使用一个Object数组来存储其内部的元素。在这里一开始对elementData被transient修饰感到比较困惑,被transient修饰的变量的值在序列化时是不会被保存的,ArrayList又是可序行化的类,elementData是ArrayList具体存放元素的成员,岂不是反序列化后的ArrayList丢失了原先的元素?其实当看完整个源码你就明白了,ArrayList源码中有如下两个函数 private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException{ // Write out element count, and any hidden stuff int expectedModCount = modCount; s.defaultWriteObject(); // Write out size as capacity for behavioural compatibility with clone() s.writeInt(size); // Write out all elements in the proper order. for (int i=0; i<size; i++) { s.writeObject(elementData[i]); } if (modCount != expectedModCount) { throw new ConcurrentModificationException(); } } private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException { elementData = EMPTY_ELEMENTDATA; // Read in size, and any hidden stuff s.defaultReadObject(); // Read in capacity s.readInt(); // ignored if (size > 0) { // be like clone(), allocate array based upon size not capacity ensureCapacityInternal(size); Object[] a = elementData; // Read in all elements in the proper order. for (int i=0; i<size; i++) { a[i] = s.readObject(); } } }  ArrayList在序列化的时候会调用writeObject,直接将size和element写入ObjectOutputStream;反序列化时调用readObject,从ObjectInputStream获取size和element,再恢复到elementData。不直接序列化elementData的原因在于elementData是一个缓存数组,它通常会预留一些容量,等容量不足时再扩充容量,那么有些空间可能就没有实际存储元素,采用上诉的方式来实现序列化时,就可以保证只序列化实际存储的那些元素,而不是整个数组,从而节省空间和时间。 下面再看ArrayList的常用方法: add: private static final int DEFAULT_CAPACITY = 10; ....public boolean add(E e) { ensureCapacityInternal(size + 1); //size+1代表插入元素后数组的容量 elementData[size++] = e; //在数组elementData的末尾插入当前元素,同时size自增 return true; } public void add(int index, E element) { rangeCheckForAdd(index); //检查index是否合法 ensureCapacityInternal(size + 1); System.arraycopy(elementData, index, elementData, index + 1, size - index); elementData[index] = element; size++; } //以下是几个函数实现数组扩容的相关方法 //添加元素前会调用此方法 private void ensureCapacityInternal(int minCapacity) { if (elementData == EMPTY_ELEMENTDATA) { //如果elementData数组为空 minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); 取二者最大赋给变量minCapacity } ensureExplicitCapacity(minCapacity); } private void ensureExplicitCapacity(int minCapacity) { modCount++;//定义于ArrayList的父类AbstractList,用于存储结构修改次数 // overflow-conscious code if (minCapacity - elementData.length > 0) //如果minCapacity大于elementData数组的长度,开始扩容 grow(minCapacity); } //容量扩容的主要实现算法 private void grow(int minCapacity) { // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); //相当于int newCapacity=oldCapacity+(oldCapacity/2),扩容50%的意思,右移比除2更快 if (newCapacity - minCapacity < 0) newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); } private static int hugeCapacity(int minCapacity) { if (minCapacity < 0) // overflow throw new OutOfMemoryError(); return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE; } 从上述源码可以得出,当执行add(E e)方法时,首先调用了ensureCapacity(size+1)方法,之后将元素的索引赋给elementData[size],而后size自增。比如初次添加元素时,size=0,add方法将e赋值给elementData[0],然后size为1。size+1为增加元素后,数组的容量。在方法ensureCapacity中,我们可以看到,size+1大于数组的当前容量,就会开始扩容。在具体的扩容算法grow中,从中可以看出,数组进行扩容时,会将老数组中的元素重新拷贝一份到新的数组中,每次数组容量的增长大约是其原容量的1.5倍。当执行add(int index, E element)时,首先会检查index值的合法性,然后判断是否需要扩容,是否执行System.arraycopy(elementData, index, elementData, index + 1,size - index)方法,此方法的意思是将elementData中从Index位置开始、长度为size-index的元素, 拷贝到从下标为index+1位置开始的新的elementData数组中,即将当前位于该位置的元素以及所有后续元素右移一个位置。然后在index处插入e。 从上述可以看出,每次进行扩容时,都要将原来的数组拷贝到一个新的数组中,非常耗时。所以当我们可以预知ArrayList的容量时,就应该手动传入容量以避免扩容。也可以调用如下方法ensureCapacity,一次性增加capacity,可以减少增加重分配的次数提高性能。 public void ensureCapacity(int minCapacity) { int minExpand = (elementData != EMPTY_ELEMENTDATA) // any size if real element table ? 0 // larger than default for empty table. It's already supposed to be // at default size. : DEFAULT_CAPACITY; if (minCapacity > minExpand) { ensureExplicitCapacity(minCapacity); } } remove: public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work return oldValue; } public boolean remove(Object o) { if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { fastRemove(index); return true; } } else { for (int index = 0; index < size; index++) if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; } private void fastRemove(int index) { modCount++; int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work } ArrayList提供了2种移除元素的方式,remove(int index)是根据下标来移除元素,而remove(object o)则是根据指定对象来移除元素。remove(int index)的实现思路如下:首先是检查index范围,修改modCount,j把要被移除的元素进行保留,将移除位置之后的元素向前挪动一个位置,将list末尾元素置为null,返回被移除的元素。remove(object o)的实现思路则为:遍历elementData数组,找到需要删除的元素,将移除位置之后的元素向前挪动一个位置,将list末尾元素置为null(ArrayList允许元素为null,当传入的object为null需要使用==进行比较)。 get: public E get(int index) { rangeCheck(index); return elementData(index); } set: public E set(int index, E element) { rangeCheck(index); E oldValue = elementData(index); elementData[index] = element; return oldValue; } 这两个方法没什么好说的,因为ArrayList是顺序存储结构(数组),可以根据下标实现随机存取。 以后会抽空了解更多的Java框架的源码并进行分享。

    转载请注明原文地址: https://ju.6miu.com/read-1437.html

    最新回复(0)