深入理解java.lang.String类的不可变性

1. 字符串 String 的不可变性

什么是不可变类？

这样理解：
一个对象在创建完成后，不能去改变它的状态，不能改变它的成员变量（如果成员变量包含基本数据类型，那么这个基本数据类型的值不能改变；如果包含引用类型，那么这个引用类型的变量不能指向别的对象）

不可变类只是其实例不能被修改的类。每个实例中包含的所有信息都必须在创建该实例的时候就提供，并且在对象的整个生命周期内固定不变。为了使类不可变，要遵循下面五条规则：

不要提供任何会修改对象状态的方法
保证类不会被扩展。一般的做法是让这个类称为 final 的，防止子类化，破坏该类的不可变行为
使所有的域都是 final 的
使所有的域都成为私有的。防止客户端获得访问被域引用的可变对象的权限，并防止客户端直接修改这些对象
确保对于任何可变性组件的互斥访问。如果类具有指向可变对象的域，则必须确保该类的客户端无法获得指向这些对象的引用

翻阅 API 文档：

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    // value 数组被 final 修饰
    private final char value[];
    ...
}

String 类代表字符串。Java 程序中的所有字符串字面值（如 “abc” ）都作为此类的实例来实现。这些字面值都是直接存储在“方法区”的 字符串常量池 中

字符串是常量；它们的值在创建之后 不能改变，所以可以共享它们。例如：

String str = "abc";

这时就有人疑惑了：为什么 String 不可变？但我的代码中经常改变 String 啊，如下：

String str = "HELLO";
str = "WORLD";
System.out.println(str);    // WORLD

这样操作，不就是将 “HELLO” 对象改变成了 “WORLD” 对象了吗？

虽然字符串的内容看上去从“HELLO” 变成了“WORLD”，但实际上，这已经是生成了一个新的字符串了：

String str = "HELLO";
System.out.println(str.hashCode());  // 68624562
str = "WORLD";
System.out.println(str.hashCode());  // 82781042

变量 str 前后的 hashCode 值不一样，说明了 str 在改变前后，指向了不同的对象。所以，变量 str 只是指向了不同对象，字符串 “HELLO”对象本身没有被改变。

变量 str 的指向如下图所示（jdk1.8：字符串常量位于堆中）：

我们也可以使用 javap 命令来查看 class 的常量池：

javap -c -v StringTest.class

执行后，常量池信息如下：

从常量池中可以看出，确实有两个字符串对象：HELLO、WORLD

【总结】：一旦一个 String 对象堆中被创建出来，它就无法被修改。而且，String 类的所有 API 方法都没有改变字符串本身的值，都是返回了一个新的字符串对象。

2. String 设计成不可变类的好处

在了解了“String 是不可变”的之后，大家是不是很疑惑：为什么要把 String 设计成不可变的呢？这样做又有什么好处呢？

主要从以下几个角度考虑：

安全可靠性：字符串在 Java 应用程序中应用广泛（存储敏感信息，如：用户名、密码、连接 url、网络连接等）；JVM类加载器在加载类的时也广泛地使用它。因此，保护 String 类对于提升整个应用程序的安全性至关重要。
缓存：字符串是使用最广泛的数据结构，大量的字符串的创建是非常耗费资源的。JVM 中专门开辟了一部分空间来存储 Java 字符串，那就是字符串常量池。通过字符串常量池，两个内容相同的字符串变量，可以从池中指向同一个字符串对象，从而节省了关键的内存资源
线程安全：不可变会自动使字符串成为线程安全的，因为当从多个线程访问它们时，它们不会被更改
hashcode 缓存：字符串也被广泛地用于哈希实现，如 HashMap、HashTable、HashSet 等。在对这些散列实现进行操作时，经常调用键的hashCode() 方法。不可变性保证了字符串的值不会改变，因此，hashCode() 方法在 String 类中被重写，以方便缓存。这样，在第一次hashCode() 调用期间计算和缓存散列，并从那时起返回相同的值。

3. 面试题

// 生成两个对象：一个在常量池中；一个中堆中，且都是 hello 对象
String s = new String("hello");

那么，下面会生成几个对象呢？

// 只会在字符串常量池中生成一个对象：helloworld。
String s3 = "hello" + "world";

这种字面量用“+”拼接，编译器在编译期间会直接进行优化。

// 这个会生成4个对象。2个在常量池中：hello、world
// 2个在堆中：StringBuilder、helloworld对象
String s = "hello";
String s2 = s + "world";

编译后，使用反编译软件 ------ jad 进行查看：

String s1 = "hell0";
String s2 = (new StringBuilder()).append(s1).append("world").toString();

发现：使用“+”将变量和字面量进行拼接的结果是：将 String 转成了StringBuilder 后，使用其 append() 方法进行处理的

查看 StringBuilder.toString() 方法源码：

@Override
public String toString() {
	// char[] value; value 是 StringBuilder 类的成员变量
    return new String(value, 0, count);
}

最后调用 toString() 方法时，会创建一个 String 对象。这个字符串对象只会在堆中创建，并不会在字符串常量池中创建。所以，会创建4个对象（hello 和 world 会直接在字符串常量池中创建）。

您可能感兴趣的文章:

深入理解java.lang.String类的不可变性

目录

1. 字符串 String 的不可变性

2. String 设计成不可变类的好处

3. 面试题