为什么 Java 要把字符串设计成不可变的

String是Java中一个不可变的类,所以他一旦被实例化就无法被修改。不可变类的实例一旦创建,其成员变量的值就不能被修改。不可变类有很多优势。本文总结了为什么字符串被设计成不可变的。将涉及到内存、同步和数据结构相关的知识。

字符串池

字符串池是方法区中的一部分特殊存储。当一个字符串被被创建的时候,首先会去这个字符串池中查找,如果找到,直接返回对该字符串的引用。

下面的代码只会在堆中创建一个字符串

String string1 = “abcd”;
String string2 = “abcd”;

那么在堆里面,只有一个对象”abcd”

如果字符串可变的话,当两个引用指向指向同一个字符串时,对其中一个做修改就会影响另外一个。(请记住该影响,有助于理解后面的内容)

缓存Hashcode

Java中经常会用到字符串的哈希码(hashcode)。例如,在HashMap中,字符串的不可变能保证其hashcode永远保持一致,这样就可以避免一些不必要的麻烦。这也就意味着每次在使用一个字符串的hashcode的时候不用重新计算一次,这样更加高效。

在String类中,有以下代码:

private int hash;//this is used to cache hash code.

以上代码中hash变量中就保存了一个String对象的hashcode,因为String类不可变,所以一旦对象被创建,该hash值也无法改变。所以,每次想要使用该对象的hashcode的时候,直接返回即可。

使其他类的使用更加便利

在介绍这个内容之前,先看以下代码:

HashSet set = new HashSet();
set.add(new String(“a”));
set.add(new String(“b”));
set.add(new String(“c”));

for(String a: set)
a.value = “a”;

在上面的例子中,如果字符串可以被改变,那么以上用法将有可能违反Set的设计原则,因为Set要求其中的元素不可以重复。上面的代码只是为了简单说明该问题,其实String类中并没有value这个字段值。

安全性

String被广泛的使用在其他Java类中充当参数。比如网络连接、打开文件等操作。如果字符串可变,那么类似操作可能导致安全问题。因为某个方法在调用连接操作的时候,他认为会连接到某台机器,但是实际上并没有(其他引用同一String对象的值修改会导致该连接中的字符串内容被修改)。可变的字符串也可能导致反射的安全问题,因为他的参数也是字符串。

代码示例:

boolean connect(string s){
if (!isSecure(s)) {
throw new SecurityException();
}
//如果s在该操作之前被其他的引用所改变,那么就可能导致问题。
causeProblem(s);
}

不可变对象天生就是线程安全的

因为不可变对象不能被改变,所以他们可以自由地在多个线程之间共享。不需要任何同步处理。

总之,String被设计成不可变的主要目的是为了安全和高效。所以,使String是一个不可变类是一个很好的设计。

《为什么 Java 要把字符串设计成不可变的》有3个想法

  1. 说到HashSet以及hashCode,我又想起一个大坑,分享一下:
    本来想用文字表述,后来发现说不清楚,直接用代码加以说明:
    自定义某个类
    class Person{
    private String name;//姓名
    private Integer age;//年龄
    private Double weight;//体重

    //getter and setter

    public int hashCode() {//其中的name属性参与hashCode运算
    return name != null ? name.hashCode() : 0;
    }
    }
    来段测试代码

    Person p1=new Person();
    p1.setName(“zhangsan”);
    p1.setAge(10);
    p1.setWeight(100D);

    Person p2=new Person();
    p2.setName(“lisi”);
    p2.setAge(20);
    p2.setWeight(200D);

    HashSet set=new HashSet<>();
    set.add(p1);
    set.add(p2);

    System.out.println(“删除前set的size:”+set.size());
    p1.setName(“wangwu”);
    set.remove(p1);
    System.out.println(“删除后set的size:”+set.size());

    代码很短,我简单解释一下:
    new了两个Person的对象p1,p2
    name分别为zhangsan 和lisi
    然后将他们加入到HashSet集合中
    打印一下删除前set的size为 2,这是显而易见的
    然后给p1随意改个名字,比如上面的wangwu
    然后从set中remove掉p1
    再打印删除后set的size,结果为2

    不知道有没有看明白我想表达的意思。
    如果没有,那,仅仅把p1.setName(“wangwu”) 这行代码注释掉
    再执行一遍,打印删除后set的size,结果为1!

    结论:如果可变类某属性参与了hashCode的运算,且将对象放入了以hash值为搜索的集合(比如HashSet,HashMap),就不要轻易修改该属性的值,否则容易出现内存泄漏的问题(你无法再从集合中找到该对象)。

  2. 还有几个大好处是,String由于值不可变,所以是天然并发安全的,另外,多个值相同的String对象,由于值不可变性,可以被jvm优化为指向一个String对象地址,大大减少了Java gc压力

发表评论

电子邮件地址不会被公开。 必填项已用*标注