关于不可知的语言:什么是装箱和拆箱,以及要权衡哪些?

关于不可知的语言:什么是装箱和拆箱,以及要权衡哪些?

What is boxing and unboxing and what are the trade offs?

我正在寻找一个清晰,简洁和准确的答案。

理想情况下,作为实际答案,尽管欢迎提供指向良好解释的链接。


装箱值是最小化原始类型*包装的数据结构。装箱的值通常存储为指向堆上对象的指针。

因此,盒装值使用更多的内存,并且至少需要两次内存查找才能访问:一次获取指针,另一次跟随该指针到达原语。显然,这不是您想要在内部循环中执行的操作。另一方面,带框值通常在系统中的其他类型上发挥更好的作用。由于它们是该语言中的一流数据结构,因此它们具有其他数据结构所期望的元数据和结构。

在Java和Haskell中,通用集合不能包含未装箱的值。 .NET中的泛型集合可以保存未装箱的值,而不会受到惩罚。在Java的泛型仅用于编译时类型检查的情况下,.NET将为在运行时实例化的每种泛型类型生成特定的类。

Java和Haskell具有拆箱数组,但是它们明显不如其他集合方便。但是,当需要最佳性能时,避免装箱和拆箱的开销值得一点不便。

*在此讨论中,原始值是可以存储在调用堆栈中的任何值,而不是作为指向堆上值的指针存储的值。通常,这只是机器类型(整数,浮点数等),结构,有时还有静态大小的数组。 .NET-land将它们称为值类型(与引用类型相对)。 Java人士称它们为原始类型。 Haskellions只是称它们为未装箱。

**在这个答案中,我还将重点放在Java,Haskell和C#上,因为这就是我所知道的。值得一说的是,Python,Ruby和Javascript都具有专门装箱的值。这也称为"一切都是对象"方法***。

***警告:足够高级的编译器/ JIT在某些情况下实际上可以检测到在查看源代码时在语义上装箱的值可以在运行时安全地成为未装箱的值。本质上,由于出色的语言实现者,您的盒子有时是免费的。


从C#3.0概括地说:

Boxing is the act of casting a value
type into a reference type:

1
2
int x = 9;
object o = x; // boxing the int

unboxing is... the reverse:

1
2
3
// unboxing o
object o = 9;
int x = (int)o;


装箱和拆箱是将原始值转换为面向对象的包装器类(装箱),或者将值从面向对象的包装器类转换回原始值(装箱)的过程。

例如,在Java中,如果要将其存储在Collection中,则可能需要将int值转换为Integer(装箱),因为原语不能存储在Collection中,只能存储对象。但是,当您想从Collection中取回它时,您可能希望将该值作为一个int而不是一个Integer来获取,因此可以将其拆箱。

装箱和拆箱并不是天生的坏事,但这是一个折衷。取决于语言的实现,它可能比仅使用基元更慢且占用更多内存。但是,它也可以使您使用更高级别的数据结构并在代码中获得更大的灵活性。

如今,最常在Java(和其他语言)"自动装箱/自动拆箱"功能的上下文中讨论它。这是以Java为中心的自动装箱说明。


在.Net中:

通常,您不能依赖于函数将使用哪种变量类型,因此您需要使用从最低公分母开始扩展的对象变量-在.Net中为object

但是object是一个类,并将其内容存储为引用。

1
2
3
4
5
List<int> notBoxed = new List<int> { 1, 2, 3 };
int i = notBoxed[1]; // this is the actual value

List<object> boxed = new List<object> { 1, 2, 3 };
int j = (int) boxed[1]; // this is an object that can be 'unboxed' to an int

虽然这两个都拥有相同的信息,但第二个列表更大且更慢。第二个列表中的每个值实际上是对保存intobject的引用。

之所以称为盒装(Boxed),是因为intobject包装。当其后退int取消装箱时-转换回其值。

对于值类型(即所有structs),这很慢,并且可能占用更多空间。

对于引用类型(即所有classes),这几乎没有什么问题,因为它们仍然存储为引用。

装箱的值类型的另一个问题是,不是在处理盒子,而是在处理值。当您比较两个structs时,您正在比较值,但是当您比较两个classes时(默认情况下),您正在比较引用-即这些实例是否相同?

在处理盒装值类型时,这可能会造成混淆:

1
2
3
4
5
6
7
8
9
int a = 7;
int b = 7;

if(a == b) // Evaluates to true, because a and b have the same value

object c = (object) 7;
object d = (object) 7;

if(c == d) // Evaluates to false, because c and d are different instances

解决起来很容易:

1
2
3
if(c.Equals(d)) // Evaluates to true because it calls the underlying int's equals

if(((int) c) == ((int) d)) // Evaluates to true once the values are cast

但是,在处理带框值时要特别注意另一件事。


.NET FCL通用集合:

1
2
3
4
5
6
List< T >
Dictionary<TKey, UValue>
SortedDictionary<TKey, UValue>
Stack< T >
Queue< T >
LinkedList< T >

旨在克服以前的集合实现中装箱和拆箱的性能问题。

有关更多信息,请参见第16章,通过C#(第二版)进行CLR。


装箱是将值类型转换为引用类型的过程。

取消装箱是将引用类型转换为值类型。

1
2
3
EX: int i=123;
    object o=i;// Boxing
    int j=(int)o;// UnBoxing

值类型为:
整数,字符和结构,枚举。
参考类型为:
类,接口,数组,字符串和对象


装箱和拆箱有助于将值类型视为对象。装箱意味着将值转换为对象引用类型的实例。例如,Int是类,而Int是数据类型。将Int转换为Int是装箱的示例,而将Int转换为Int则是取消装箱。该概念有助于垃圾回收,另一方面,拆箱可将对象类型转换为值类型。

1
2
3
4
5
int i=123;
object o=(object)i; //Boxing

o=123;
i=(int)o; //Unboxing.

像其他任何东西一样,自动装箱如果使用不当,可能会出现问题。经典的方法是以NullPointerException结尾,并且无法对其进行跟踪。即使使用调试器。尝试这个:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public class TestAutoboxNPE
{
    public static void main(String[] args)
    {
        Integer i = null;

        // .. do some other stuff and forget to initialise i

        i = addOne(i);           // Whoa! NPE!
    }

    public static int addOne(int i)
    {
        return i + 1;
    }
}

推荐阅读