您的当前位置:首页正文

深入理解java.lang.String类的不可变性

2024-11-04 来源:个人技术集锦

1. 字符串 String 的不可变性

什么是不可变类?

这样理解:
        一个对象在创建完成后,不能去改变它的状态,不能改变它的成员变量(如果成员变量包含基本数据类型,那么这个基本数据类型的值不能改变;如果包含引用类型,那么这个引用类型的变量不能指向别的对象)

不可变类只是其实例不能被修改的类。每个实例中包含的所有信息都必须在创建该实例的时候就提供,并且在对象的整个生命周期内固定不变。为了使类不可变,要遵循下面五条规则:

  • 不要提供任何会修改对象状态的方法
  • 保证类不会被扩展。 一般的做法是让这个类称为 final 的,防止子类化,破坏该类的不可变行为
  • 使所有的域都是 final 的
  • 使所有的域都成为私有的。 防止客户端获得访问被域引用的可变对象的权限,并防止客户端直接修改这些对象
  • 确保对于任何可变性组件的互斥访问。 如果类具有指向可变对象的域,则必须确保该类的客户端无法获得指向这些对象的引用

翻阅 API 文档:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    // value 数组被 final 修饰
    private final char value[];
    ...
}

String 类代表字符串。Java 程序中的所有字符串字面值(如 “abc” )都作为此类的实例来实现。 这些字面值都是直接存储在“方法区”的 字符串常量池

字符串是常量;它们的值在创建之后 不能改变,所以可以共享它们。例如:

String str = "abc";

这时就有人疑惑了:为什么 String 不可变?但我的代码中经常改变 String 啊,如下:

String str = "HELLO";
str = "WORLD";
System.out.println(str);    // WORLD

这样操作,不就是将 “HELLO” 对象改变成了 “WORLD” 对象了吗?

虽然字符串的内容看上去从“HELLO” 变成了“WORLD”,但实际上,这已经是生成了一个新的字符串了:

String str = "HELLO";
System.out.println(str.hashCode());  // 68624562
str = "WORLD";
System.out.println(str.hashCode());  // 82781042

变量 str 前后的 hashCode 值不一样,说明了 str 在改变前后,指向了不同的对象。所以,变量 str 只是指向了不同对象,字符串 “HELLO”对象本身没有被改变。

变量 str 的指向如下图所示(jdk1.8:字符串常量位于堆中):

我们也可以使用 javap 命令来查看 class 的常量池:

javap -c -v StringTest.class

执行后,常量池信息如下:

从常量池中可以看出,确实有两个字符串对象:HELLO、WORLD

【总结】:一旦一个 String 对象堆中被创建出来,它就无法被修改。而且,String 类的所有 API 方法都没有改变字符串本身的值,都是返回了一个新的字符串对象。

2. String 设计成不可变类的好处

在了解了“String 是不可变”的之后,大家是不是很疑惑:为什么要把 String 设计成不可变的呢?这样做又有什么好处呢?

主要从以下几个角度考虑:

  • 安全可靠性:字符串在 Java 应用程序中应用广泛(存储敏感信息,如:用户名、密码、连接 url、网络连接等);JVM类加载器在加载类的时也广泛地使用它。因此,保护 String 类对于提升整个应用程序的安全性至关重要。
  • 缓存:字符串是使用最广泛的数据结构,大量的字符串的创建是非常耗费资源的。JVM 中专门开辟了一部分空间来存储 Java 字符串,那就是字符串常量池。通过字符串常量池,两个内容相同的字符串变量,可以从池中指向同一个字符串对象,从而节省了关键的内存资源
  • 线程安全:不可变会自动使字符串成为线程安全的,因为当从多个线程访问它们时,它们不会被更改
  • hashcode 缓存:字符串也被广泛地用于哈希实现,如 HashMap、HashTable、HashSet 等。在对这些散列实现进行操作时,经常调用键的hashCode() 方法。不可变性保证了字符串的值不会改变,因此,hashCode() 方法在 String 类中被重写,以方便缓存。这样,在第一次hashCode() 调用期间计算和缓存散列,并从那时起返回相同的值。

3. 面试题

// 生成两个对象:一个在常量池中;一个中堆中,且都是 hello 对象
String s = new String("hello");

那么,下面会生成几个对象呢?

// 只会在字符串常量池中生成一个对象:helloworld。
String s3 = "hello" + "world";

这种字面量用“+”拼接,编译器在编译期间会直接进行优化。

// 这个会生成4个对象。2个在常量池中:hello、world
// 2个在堆中:StringBuilder、helloworld对象
String s = "hello";
String s2 = s + "world";

编译后,使用反编译软件 ------ jad 进行查看:

String s1 = "hell0";
String s2 = (new StringBuilder()).append(s1).append("world").toString();

发现:使用“+”将变量和字面量进行拼接的结果是:将 String 转成了StringBuilder 后,使用其 append() 方法进行处理的

查看 StringBuilder.toString() 方法源码:

@Override
public String toString() {
	// char[] value; value 是 StringBuilder 类的成员变量
    return new String(value, 0, count);
}

最后调用 toString() 方法时,会创建一个 String 对象。这个字符串对象只会在堆中创建,并不会在字符串常量池中创建。所以,会创建4个对象(hello 和 world 会直接在字符串常量池中创建)。

您可能感兴趣的文章:
Top