11-5 Java集合---- Collection子接口之二: Set接口(1)概述 & HashSet & LinkedHashSet
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了11-5 Java集合---- Collection子接口之二: Set接口(1)概述 & HashSet & LinkedHashSet,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含6860字,纯文字阅读大概需要10分钟。
内容图文
![11-5 Java集合---- Collection子接口之二: Set接口(1)概述 & HashSet & LinkedHashSet](/upload/InfoBanner/zyjiaocheng/604/592fd0bc06b14497a368f49b279a1746.jpg)
11-5 Java集合---- Collection子接口之二: Set接口(1)
一、Set 接口概述
1.Set接口是Collection的子接口,set接口没有提供额外的方法
2.Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set 集合中,则添加操作失败。
3.Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法
4.框架见代码注释
二、Set:存储无序的、不可重复的数据
以HashSet为例说明:
1.无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
2.不可重复性:保证添加的元素按照equals()判断时,不能返回true.即:相同的元素只能添加一个。
三、添加元素的过程:以HashSet为例:
1.我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
2.此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:
(1)如果此位置上没有其他元素,则元素a添加成功。 —>情况1
(2)如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
①如果hash值不相同,则元素a添加成功。—>情况2
②如果hash值相同,进而需要调用元素a所在类的equals()方法:
- equals()返回true,元素a添加失败;
- equals()返回false,则元素a添加成功。—>情况3
3.对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
(1)jdk 7 :元素a放到数组中,指向原来的元素。
(2)jdk 8 :原来的元素在数组中,指向元素a
-----》总结:七上八下,HashSet底层:数组+链表的结构。
四、Set实现类之一:HashSet
1.HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。
2.HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。
3.HashSet 具有以下特点:
(1)不能保证元素的排列顺序
(2)HashSet 不是线程安全的
(3)集合元素可以是 null
4.HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。
5.对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:“相等的对象必须具有相等的散列码”。
五、重写
1.重写 hashCode() 方法的基本原则
(1)在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值。
(2)当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode() 方法的返回值也应相等。
(3)对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
2.重写 equals() 方法的基本原则:以自定义的Customer类为例,何时需要重写equals()?
(1)当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。
(2)因此,违反了“相等的对象必须具有相等的散列码”。
(3)结论:复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。
3.Eclipse/IDEA工具里hashCode()的重写
以Eclipse/IDEA为例,在自定义类中可以调用工具自动重写equals和hashCode。
问题:为什么用Eclipse/IDEA复写hashCode方法,有31这个数字?
(1)选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会提高。(减少冲突)
(2)并且31只占用5bits,相乘造成数据溢出的概率较小。
(3)31可以 由i*31== (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。(提高算法效率)
(4)31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终出来的结果只能被素数本身和被乘数还有1来整除!(减少冲突)
六、Set实现类之二:LinkedHashSet
1.LinkedHashSet 是 HashSet 的子类
2.LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
3.LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。
4.LinkedHashSet 不允许集合元素重复
-------》LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。
优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
User类:
package java2;
public class User implements Comparable{
private String name;
private int age;
public User() {
}
public User(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "User{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
@Override
public boolean equals(Object o) {
System.out.println("User equals()....");
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
User user = (User) o;
if (age != user.age) return false;
return name != null ? name.equals(user.name) : user.name == null;
}
@Override
public int hashCode() { //return name.hashCode() + age;
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
//按照姓名从大到小排列,年龄从小到大排列
@Override
public int compareTo(Object o) {
if(o instanceof User){
User user = (User)o;
// return -this.name.compareTo(user.name);
int compare = -this.name.compareTo(user.name);
if(compare != 0){
return compare;
}else{
return Integer.compare(this.age,user.age);
}
}else{
throw new RuntimeException("输入的类型不匹配");
}
}
}
SetTest 代码:
package java2;
import org.junit.Test;
import java.util.HashSet;
import java.util.Iterator;
import java.util.LinkedHashSet;
import java.util.Set;
/**
* 1. Set接口的框架:
*
* |----Collection接口:单列集合,用来存储一个一个的对象
* |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
* |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
* |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
* |----TreeSet:可以按照添加对象的指定属性,进行排序。
*
* (1)Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
*
* (2)要求:向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals()
* 要求:重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
* 重写两个方法的小技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
*/
public class SetTest {
@Test
public void test1() {
Set set = new HashSet();
set.add(456);
set.add(123);
set.add(123);
set.add("AA");
set.add("CC");
set.add(new User("Tom", 12));
set.add(new User("Tom", 12));
set.add(129);
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
}
//LinkedHashSet的使用
//LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。
//优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
@Test
public void test2() {
Set set = new LinkedHashSet();
set.add(456);
set.add(123);
set.add(123);
set.add("AA");
set.add("CC");
set.add(new User("Tom", 12));
set.add(new User("Tom", 12));
set.add(129);
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
}
}
输出:
User equals()....
AA
CC
129
456
123
User{name='Tom', age=12}
User equals()....
456
123
AA
CC
User{name='Tom', age=12}
129
内容总结
以上是互联网集市为您收集整理的11-5 Java集合---- Collection子接口之二: Set接口(1)概述 & HashSet & LinkedHashSet全部内容,希望文章能够帮你解决11-5 Java集合---- Collection子接口之二: Set接口(1)概述 & HashSet & LinkedHashSet所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。