这一次,我要系统的了解一下JVM

  1. 云栖社区>
  2. 博客>
  3. 正文

这一次,我要系统的了解一下JVM

云栖号资讯小哥 2020-07-06 17:09:02 浏览493
展开阅读全文

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!


一.JVM的加载机制

1.什么是类的加载机制

类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个 java.lang.Class对象,用来封装类在方法区内的数据结构。类的加载的最终产品是位于堆区中的 Class对象, Class对象封装了类在方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口。

类加载器并不需要等到某个类被“首次主动使用”时再加载它,JVM规范允许类加载器在预料某个类将要被使用时就预先加载它,如果在预先加载的过程中遇到了.class文件缺失或存在错误,类加载器必须在程序首次主动使用该类时才报告错误(LinkageError错误)如果这个类一直没有被程序主动使用,那么类加载器就不会报告错误。

2.类的生命周期

类加载的过程包括了加载、验证、准备、解析、初始化五个阶段。在这五个阶段中,加载、验证、准备和初始化这四个阶段发生的顺序是确定的,而解析阶段则不一定,它在某些情况下可以在初始化阶段之后开始,这是为了支持Java语言的运行时绑定(也成为动态绑定或晚期绑定)。

另外注意这里的几个阶段是按顺序开始,而不是按顺序进行或完成,因为这些阶段通常都是互相交叉地混合进行的,通常在一个阶段执行的过程中调用或激活另一个阶段。

3.类加载器

站在java虚拟机的角度来讲,只存在两种不同的类加载器:启动类加载器和其他的加载器。(因为启动类加载器是使用C++语言实现的,它是虚拟机自身的一部分,而其他的加载器则是由java语言实现的,而且都是继承自抽象类java.lang.ClassLoad,而这些加载器必须由启动类加载器加载到内存后,才能去加载其他的类。)

但是站在java开发人员来看,类加载器大概分为四种,启动类加载器,扩展类加载器,应用程序类加载器,自定义加载器。

  • 启动类加载器(BootStrap ClassLoad):

负责加载存在在jdk/jre/lib目录下的能被虚拟机识别的类库,而且启动类加载器是无法被java程序直接应用的。

  • 扩展类加载器(Extension ClassLoad):

该加载器是用来加载jdk/jre/lib/ext目录下的所有类库,开发者可以直接使用扩展类加载器。

  • 应用程序类加载器(Application ClassLoad):

该类加载器是负责加载用户类路径所指定的类,开发者可以直接使用该类加载器,如果应用程序中没有自定义过自己的加载器,那么这个加载器就是程序中默认的加载器。

  • 自定义类加载器(User ClassLoad):

自定义加载器是用户自己定义的加载器,这种加载器主要注意三点:

(1).在执行非置信代码之前,自动验证数字签名。

(2).动态地创建符合用户特定需要的定制化构建类。

(3).从特定的场所取得java class,例如数据库中和网络中。

4.JVM的类加载机制

全盘负责,当一个类加载器负责加载某个Class时,该Class所依赖的和引用的其他Class也将由该类加载器负责载入,除非显示使用另外一个类加载器来载入。

父类委托,先让父类加载器试图加载该类,只有在父类加载器无法加载该类时才尝试从自己的类路径中加载该类。

缓存机制,缓存机制将会保证所有加载过的Class都会被缓存,当程序中需要使用某个Class时,类加载器先从缓存区寻找该Class,只有缓存区不存在,系统才会读取该类对应的二进制数据,并将其转换成Class对象,存入缓存区。这就是为什么修改了Class后,必须重启JVM,程序的修改才会生效。

5.双亲委派模型

双亲委派模型的工作流程是:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把请求委托给父加载器去完成,依次向上,因此,所有的类加载请求最终都应该被传递到顶层的启动类加载器中,只有当父加载器在它的搜索范围中没有找到所需的类时,即无法完成该加载,子加载器才会尝试自己去加载该类。

双亲委派模型的意义:

1.系统类防止出现内存中出现多份同样的字节码。
2.保证java程序安全稳定运行。

二.JVM内存结构

Jvm的内存结构主要是由java堆,java栈,本地方法栈,方法区,程序计数器组成。

1.Java堆:

Java堆内存,是由所有线程共享的一块内存区域,这个内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。
从内存回收的角度来讲,因为现在的收集器基本都是采用的分代收集算法,所以java堆中还可以细分为:新生代和老年代。而新生代,则又进行划分,分为了Eden区,From Survivor区域,To Survivor区域。

2. 方法区

方法区和java堆一样,都是由所有线程共享的内存区域。它主要的作用,是存储已经被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。虽然在java虚拟机规范里面,会把方法区当作java堆的一个逻辑部分,但是它却也有一个别名,叫做Non-Heap(非堆),目的是要与java堆分开来。

但是,在HotSpot虚拟机上,会把方法区称为“永久代”,本质上当然两者并不等价,而出现这种情况的原因是,HotSpot虚拟机的团队将GC分代收集扩展到了方法区,与java堆联合在一起,形成了一个GC回收的网络。

3.程序计数器

当java文件被打包成class文件的时候,里面的代码都是被优化过的,但是java程序是多线程的,当一个线程在执行一个程序到一半的时候,忽然被调去执行另外一个程序了,那么如何保证等它执行另外一个程序,返回过来执行之前的程序的时候,能够准确的找到之前执行到程序的哪个点呢?这个时候就需要程序计数器了。

每一个线程都会有一个单独的程序计数器,它会记录这个线程正在执行的虚拟机字节码指令的地址,但是只能记录java方法的,如果是Native方法,那么这个计数器的值就是为空(Undefined)。

这个区域,也是唯一一个在java虚拟机规范中没有规定任何内存溢出情况的区域。

4.java栈

和程序计数器一样,java栈也是线程私有的内存区域。

一个线程,当它开始的时候,就会内存中出现一个独属于它的java栈,当这个线程在执行一个方法的时候,java栈中会开辟一个栈帧,这个栈帧将会存储这个方法的局部变量表,操作栈,动态链接,方法出口等信息。所以线程会调用一个又一个的方法,那么也就会在独属于它的java栈中开辟出一个又一个的栈帧,而每一个方法被调用直到这个方法被执行完成,就对应着一个栈帧在虚拟机栈中从入栈到出栈的一个过程。

但是java栈,只为虚拟机执行java方法服务。

5.本地方法栈

本地方法栈(Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的Native方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。

甚至有的虚拟机(譬如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。

三.GC算法

在jvm中,程序计数器,java栈,本地方法栈都是随着线程而生也随着线程而灭,那么自然就实现了内存的清理。但是java堆和方法区,却不是这样,因此我们现在的GC垃圾回收器主要就是集中在java堆和方法区。

1. 如何判断一个对象是否存活

判断对象是否存活一般有两种方式:

引用计数:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单,无法解决对象相互循环引用的问题。

可达性分析(Reachability Analysis):从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。不可达对象。

2. 分代收集算法

分代收集算法的前提,是确定绝大部分对象的生命周期都是非常短暂的,存活时间短。

分代收集算法的特点,是把java堆设置新生代和老年代,这样就可以根据不同年代的特点来选择最合适的算法。(现在讨论的基本都是HotSpot虚拟机)

新生代:朝生夕灭的对象(例如:方法的局部变量引用的对象等)。

这个是java堆中,java堆主要是分为新生代和老年代,一般默认的比例是新生代占据整个java堆的1/3,新生代自己也会再度细分,目的是为了选择出更为合适的GC收集算法,提升回收的效率。

新生代分为了Eden区,From Survivor区域,To Survivor区域。

当系统创建一个对象的时候,总是会在Eden区操作,但是大部分对象,都是在创建后不久就永远都不会再使用了,因此也会很快变得不可达,当这个区域快要满了到时候,就会触发一次YongGC,将这些不可达的对象清理掉。而剩下的还存活着的对象呢,YongGC就会通过“复制算法”,转移到From Survivor区域。

当From Survivor区域的对象消亡后,会触发YongGC来清理掉这些对象,而剩下的对象,YongGC则会全部通过“复制算法”复制到To Survivor区域。而这个时候,To Survivor区域就变成了了From Survivor区域,而之前的From Survivor区域则就会被YongGC全部清空内存,变成了To Survivor。

当一个对象,在年轻代存活了足够长的时间后,如果没有被GC清理掉,那么就会通过“复制算法”复制到老年代去。还有一种情况就是,如果一次GC下来,存活的对象占据的内存超过了新生代的内存的10%,那么也会将这部分内存复制到老年代中去。

老年代:存活得比较久,但还是要死的对象(例如:缓存对象、单例对象等)。

老年代存储的对象比年轻代多得多,而且不乏大对象,对老年代进行内存清理时,如果使用停止-复制算法,则相当低效。一般,老年代用的算法是标记-整理(也称之为标记-压缩算法)算法,即标记出仍然存活的对象(存在引用的),将所有存活的对象向一端移动,以保证内存的连续。

在发生Minor GC时,虚拟机会检查每次晋升进入老年代的大小是否大于老年代的剩余空间大小,如果大于,则直接触发一次Full GC。

永久代:对象生成后几乎不灭的对象(例如:加载过的类信息)。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-07-05
本文作者:吴里斯蒂亚诺_翀纳尔多
本文来自:“掘金”,了解相关信息可以关注“掘金”

网友评论

登录后评论
0/500
评论
云栖号资讯小哥
+ 关注