1. 字符串 String 的不可变性
什么是不可变类?
这样理解:
一个对象在创建完成后,不能去改变它的状态,不能改变它的成员变量(如果成员变量包含基本数据类型,那么这个基本数据类型的值不能改变;如果包含引用类型,那么这个引用类型的变量不能指向别的对象)
不可变类只是其实例不能被修改的类。每个实例中包含的所有信息都必须在创建该实例的时候就提供,并且在对象的整个生命周期内固定不变。为了使类不可变,要遵循下面五条规则:
- 不要提供任何会修改对象状态的方法
- 保证类不会被扩展。 一般的做法是让这个类称为 final 的,防止子类化,破坏该类的不可变行为
- 使所有的域都是 final 的
- 使所有的域都成为私有的。 防止客户端获得访问被域引用的可变对象的权限,并防止客户端直接修改这些对象
- 确保对于任何可变性组件的互斥访问。 如果类具有指向可变对象的域,则必须确保该类的客户端无法获得指向这些对象的引用
翻阅 API 文档:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { // value 数组被 final 修饰 private final char value[]; ... }
String 类代表字符串。Java 程序中的所有字符串字面值(如 “abc” )都作为此类的实例来实现。 这些字面值都是直接存储在“方法区”的 字符串常量池
中
字符串是常量;它们的值在创建之后 不能改变
,所以可以共享它们。例如:
String str = "abc";
这时就有人疑惑了:为什么 String 不可变?但我的代码中经常改变 String 啊,如下:
String str = "HELLO"; str = "WORLD"; System.out.println(str); // WORLD
这样操作,不就是将 “HELLO” 对象改变成了 “WORLD” 对象了吗?
虽然字符串的内容看上去从“HELLO” 变成了“WORLD”,但实际上,这已经是生成了一个新的字符串了:
String str = "HELLO"; System.out.println(str.hashCode()); // 68624562 str = "WORLD"; System.out.println(str.hashCode()); // 82781042
变量 str 前后的 hashCode 值不一样,说明了 str 在改变前后,指向了不同的对象。所以,变量 str 只是指向了不同对象,字符串 “HELLO”对象本身没有被改变。
变量 str 的指向如下图所示(jdk1.8:字符串常量位于堆中):
我们也可以使用 javap 命令来查看 class 的常量池:
javap -c -v StringTest.class
执行后,常量池信息如下:
从常量池中可以看出,确实有两个字符串对象:HELLO、WORLD
【总结】:一旦一个 String 对象堆中被创建出来,它就无法被修改。而且,String 类的所有 API 方法都没有改变字符串本身的值,都是返回了一个新的字符串对象。
2. String 设计成不可变类的好处
在了解了“String 是不可变”的之后,大家是不是很疑惑:为什么要把 String 设计成不可变的呢?这样做又有什么好处呢?
主要从以下几个角度考虑:
- 安全可靠性:字符串在 Java 应用程序中应用广泛(存储敏感信息,如:用户名、密码、连接 url、网络连接等);JVM类加载器在加载类的时也广泛地使用它。因此,保护 String 类对于提升整个应用程序的安全性至关重要。
- 缓存:字符串是使用最广泛的数据结构,大量的字符串的创建是非常耗费资源的。JVM 中专门开辟了一部分空间来存储 Java 字符串,那就是字符串常量池。通过字符串常量池,两个内容相同的字符串变量,可以从池中指向同一个字符串对象,从而节省了关键的内存资源
- 线程安全:不可变会自动使字符串成为线程安全的,因为当从多个线程访问它们时,它们不会被更改
- hashcode 缓存:字符串也被广泛地用于哈希实现,如 HashMap、HashTable、HashSet 等。在对这些散列实现进行操作时,经常调用键的hashCode() 方法。不可变性保证了字符串的值不会改变,因此,hashCode() 方法在 String 类中被重写,以方便缓存。这样,在第一次hashCode() 调用期间计算和缓存散列,并从那时起返回相同的值。
3. 面试题
// 生成两个对象:一个在常量池中;一个中堆中,且都是 hello 对象 String s = new String("hello");
那么,下面会生成几个对象呢?
// 只会在字符串常量池中生成一个对象:helloworld。 String s3 = "hello" + "world";
这种字面量用“+”拼接,编译器在编译期间会直接进行优化。
// 这个会生成4个对象。2个在常量池中:hello、world // 2个在堆中:StringBuilder、helloworld对象 String s = "hello"; String s2 = s + "world";
编译后,使用反编译软件 ------ jad 进行查看:
String s1 = "hell0"; String s2 = (new StringBuilder()).append(s1).append("world").toString();
发现:使用“+”将变量和字面量进行拼接的结果是:将 String 转成了StringBuilder 后,使用其 append() 方法进行处理的
查看 StringBuilder.toString() 方法源码:
@Override public String toString() { // char[] value; value 是 StringBuilder 类的成员变量 return new String(value, 0, count); }
最后调用 toString() 方法时,会创建一个 String 对象。这个字符串对象只会在堆中创建,并不会在字符串常量池中创建。所以,会创建4个对象(hello 和 world 会直接在字符串常量池中创建)。