hashCode概念
hashCode是jdk根据对象的地址算出来的一个int数字,即对象的哈希码值,代表了该对象在内存中的存储位置。
我们都知道hashCode()方法是顶级类Object类的提供的一个方法,所有的类都可以进行对hashCode方法重写。
我们也知道在比较一个类是否相同时往往会重写equals方法,值得注意的是,重写equals方法的同时必须也要重写hashCode方法,多次调用一个对象的hashCode方法必须返回同一个数字,这也是必须遵守的规范,不然会造必须存在的危害。
hash冲突
当两个对象equals相同,hashCode规定也必须相同,但反过来就不一定,两个对象对应一个hashCode,但equals却并不相等。。这就是传说中的hash冲突。HashMap是以hashCode取模数组形式存放值的,那两个对象hashCode一样会不会造成前一个对象的值覆盖呢?答案是不会,因为它采用了另外一种链表数据结构来解决hash冲突的情况,即使两个对象的hashCode一样,它们会放到当前数组索引位置的链表中。
hashCode设计
HashSet通过HashMap来实现的,用来存储不重复数据的,怎么判断里面的对象是否重复呢?判断对象是否重复即是判断对象里面的属性是否都一样,这时必须是重写了equals方法去比较对象的里面所有的值,而不是比较引用地址,比较引用地址它们永远都不相等,除非是同一个对象。通过equals比较的过程性能是非常不佳的,所以有了hashCode这个设计,简单两个数字的比较性equals没法比的,所以可以先通过比较对象的hashCode是否一样确定是不是同一个对象,如果hashCode不一样这时肯定就不是同一个对象,反之如果hashCode一样而且equals或者==也一样这肯定就是同一个对象。所以先比较数字的hashCode再比较equals或者==,这样效率会明显提升。
假如我们重写了equals而不重写hashCode方法,多个对象属性值一样的它们的hashCode肯定是不一样的,这时作为key在put到map中的时候,就会有多个这样的key,而达不到对象作为key的场景,同样也达不到HashSet去重的效果
identityHashCode
identityHashCode是System里面提供的本地方法,java.lang.System#identityHashCode。
/** * Returns the same hash code for the given object as * would be returned by the default method hashCode(), * whether or not the given object's class overrides * hashCode(). * The hash code for the null reference is zero. * * @param x object for which the hashCode is to be calculated * @return the hashCode * @since JDK1.1 */public static native int identityHashCode(Object x);
identityHashCode和hashCode的区别是,identityHashCode会返回对象的hashCode,而不管对象是否重写了hashCode方法。
示例
public static void main(String[] args) { String str1 = new String("abc"); String str2 = new String("abc"); System.out.println("str1 hashCode: " + str1.hashCode()); System.out.println("str2 hashCode: " + str2.hashCode()); System.out.println("str1 identityHashCode: " + System.identityHashCode(str1)); System.out.println("str2 identityHashCode: " + System.identityHashCode(str2)); User user = new User("test", 1); System.out.println("user hashCode: " + user.hashCode()); System.out.println("user identityHashCode: " + System.identityHashCode(user));}
输出结果:
str1 hashCode: 96354str2 hashCode: 96354str1 identityHashCode: 1173230247str2 identityHashCode: 856419764user hashCode: 621009875user identityHashCode: 621009875
结果分析:
1、str1和str2的hashCode是相同的,是因为String类重写了hashCode方法,它根据String的值来确定hashCode的值,所以只要值一样,hashCode就会一样。
2、str1和str2的identityHashCode不一样,虽然String重写了hashCode方法,identityHashCode永远返回根据对象物理内存地址产生的hash值,所以每个String对象的物理地址不一样,identityHashCode也会不一样。
3、User对象没重写hashCode方法,所以hashCode和identityHashCode返回的值一样