专利 一种基于调用点二进制压缩编码的程序内联自动调优方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211040330.4 (22)申请日 2022.08.29 (71)申请人北京航空航天大学地址 100191 北京市海淀区学院路37号 (72)发明人史晓华　黄达　 (74)专利代理机构北京永创新实专利事务所 11121 专利代理师周长琪 (51)Int.Cl. G06F 11/36(2006.01) G06N 20/00(2019.01) (54)发明名称一种基于调用点二进制压缩编码的程序内联自动调优方法 (57)摘要本发明为一种基于调用点二进制压缩编码的程序内联自动调优方法，涉及计算机编译技术领域。本发明方法包括：获取程序的函数调用图，选取热点函数，对函数调用点的开关情况进行特征向量编码，并使特征向量作为编译参数传入编译器，对调用点是否内联进行控制；随机生成不同特征向量编码值，传入编译器，获取对应程序运行时间，生成训练集；利用训练集对不同机器学习模型训练，选取预测程序运行时间最好的模型，利用训练好的模型搜索能获得最佳程序运行时间的特征向量的编码值，作为最终编译参数。本发明在给定应用程序和给定输入的情况下，可以得到优于启发式函数内联的程序性能，降低现有内联启发式方法中做出良好内联决策的难度。权利要求书1页说明书3页附图2页 CN 115454830 A 2022.12.09 CN 115454830 A 1.一种基于调用点二进制压缩编码的程序内联自动调优方法，其特征在于，包括：步骤1，对程序编译得到二进制文件以及函数调用图；步骤2，对函数调用点的开关情况进行特征向量编码，包括：对每个调用点，用一位二进制数0/1表示函数是否内联的开关情况， 0表示不内联， 1表示内联；按照函数调用图的拓扑序遍历调用点，保证每次函数节点访问顺序不变；对由拓扑序限制的调用点访问顺序组成的二进制编码的特征向量进行压缩；步骤3，修改编译器的内联优化相关代码，使得特征向量作为编译参数传入，通过特征向量对调用点是否内联进行控制；修改编译器的内联优化相关代码时，还需要设置对特征向量的解码方式，解码方式为根据当前调用点按照拓扑序遍历函数调用图所处于的位置数，从特征向量中获取当前调用点是否内联的开关情况；步骤4，对步骤2得到的函数调用点的特征向量，随机生成不同的编码值，将特征向量的编码值作为编译参数传入编译器，对程序编译生成二进制文件并运行，获取程序运行时间；由特征向量的编码值与程序运行时间组成一个训练样本，获取训练集；步骤5，使用训练集对不同机器学习模型进行训练；所述模型的输入是特征向量编码值，输出为程序运行时间，选取预测效果最好的模型；步骤6，利用训练选取的模型搜索找到能获得最佳程序运行时间的特征向量的编码值，使用该特征向量编码值作为编译参数输入编译器，对程序进行编译。 2.根据权利要求1所述的方法，其特征在于，所述的步骤2中，选取热点函数进行特征向量编码。 3.根据权利要求1或2所述的方法，其特征在于，所述的步骤2中，对由拓扑序限制的调用点访问顺序组成的二进制编码向量进行压缩，是将每2k位二进制数分为一组用一个十进制数来表示，将特征向量的维数降低到1/2k，其中k为大于等于4的整数。 4.根据权利要求3所述的方法，其特征在于，所述的步骤3 中，设按照拓扑序遍历函数调用图当前调用点所处于的位置数为cnt，则计算x＝cnt/2k， y＝cnt％2k，则当前调用点是否内联的开关情况，记载在特征向量的第x维中的第y位二进制位；根据当前调用点对应的特征向量中二进制位的值控制当前调用点是否内联。权　利　要　求　书 1/1 页 2 CN 115454830 A 2一种基于调用点二进制压缩编码的程序内联自动调优方法技术领域 [0001]本发明属于计算机领域，涉及编译优化技术，具体地说，是指一种基于调用点二进制压缩编码的程序内联自动调优方法。背景技术 [0002]随着软件工程方法和面向对象编程模型的广泛使用，程序的结构越来越复杂、函数和源文件的数量越来越多，这无疑加大了编译器过程间分析和优化的难度。 [0003]函数内联(又称内联扩展)是重要的编译优化技术之一。它通过将符合条件的被调用函数的源码在调用点展开，不仅消除了函数调用开销并潜在地缩小了二进制文件大小，而且还扩展了过程内分析和优化的范围，是一种能够克服上述程序优化问题的简单方法。然而这种方法并非没有缺陷，追求最大性能的函数内联优化已经被证明是NP完全问题，不存在多项式时间复杂度范围内的解决方法。虽然所有优秀的编译器都实现了启发式函数内联优化，但做出良好的内联决策是困难的，好的选择不仅取决于其他内联选择，还取决于优化管道的其余部分。例如，内联可以消除死代码或导致代码大小膨胀。内联启发式方法必须平衡实现进一步的编译器优化和大小增加。所以这个过程中的约束数量及其组合非常多，这使得实现最佳甚至给定应用程序的良好内联优化性能几乎是不可能的。发明内容 [0004]本发明针对上述内联启发式方法存在做出良好内联决策困难的问题，提出了一种基于调用点二进制压缩编码的程序内联自动调优方法，通过对函数调用点是否内联进行编码后，使用机器学习自动学习不同函数调用点的开关组合策略下的程序性能，进而搜索得到最大程序性能的调用点开关策略。 [0005]本发明提供的一种基于调用点二进制压缩编码的程序内联自动调优方法，包括如下步骤： [0006]步骤1，对程序编译得到二进制文件以及函数调用图； [0007]步骤2，对函数调用点的开关情况进行特征向量编码，包括： [0008]对每个调用点，用一位二进制数0/ 1表示函数是否内联的开关情况， 0表示不内联， 1表示内联；按照函数调用图的拓扑序遍历调用点，保证每次函数节点访问顺序不变；对由拓扑序限制的调用点访问顺序组成的二进制编码的特征向量进行压缩； [0009]步骤3，修改编译器的内联优化相关代码，使得特征向量作为编译参数传入，通过特征向量对调用点是否内联进行控制； [0010]修改编译器的内联优化相关代码时，还需要设置对特征向量的解码方式，解码方式为根据当前调用点按照拓扑序遍历函数调用图所处于的位置数，从特征向量中获取当前调用点是否内联的开关情况； [0011]步骤4，对步骤2得到的函数调用点的特征向量，随机生成不同的编码值，将特征向量的编码值作为编译参数传入编译器，对程序编译生成二进制文件并运行，获取程序运行说　明　书 1/3 页 3 CN 115454830 A 3

专利 一种基于调用点二进制压缩编码的程序内联自动调优方法

专利一种基于调用点二进制压缩编码的程序内联自动调优方法