010-64928252 400-6446-365

C语言程序优化工作流程的注意事项

2017-04-13
  在《【解密】C语言程序优化工作流程(一)》一文中分形科技为大家介绍了关于C语言程序优化工作的三个阶段,且对每个阶段进行的详细的介绍。程序员在进行优经工作时需要根据自身的情况来决定需要优化到哪个阶段。如有不懂之处可及时的联系分形科技的在线客服人员,我们将随时为您提升服务。

  接下来分形科技小编要为大家介绍的是C语言程序优化工作流程的第二部分内容,也就是C语言程序优化工作流程的一些注意事项,共八个点需要编程人员注意。

  C语言程序优化工作流程的注意事项

  1)选用C编译器提供的优化选项

  在编译器中提供了分为若干等级和种类的自动优化选项,如下:

  ● -o:使能软件流水和其他优化方法

  ● -pm:使能程序级优化

  ● -mt:使能编译器假设程序中没有数据存储混淆,可进一步优化代码。

  ● -mg:使能分析(profile)优化代码

  ● -ms:确保不产生冗余循环,从而减小代码尺寸● -mh:允许投机执行● -mx:使能软件流水循环重试,基于循环次数对循环试用多个方案,以便选择最佳方案。

  程序员在C语言程序优化工作中应根据实际编译的程序,选择合适的优化选项,进行源程序的优化。

  2)减小存储器相关性

  为使指令达到最大效率,C64X编译器尽可能将指令安排为并行执行。为使指令并行操作,编译器必须知道指令间的关系,因为只有不相关的指令才可以并行执行。当编译器不能确定两条指令是否相关时,则编译器假定它们是相关的,从而不能并行执行。

  设计中常采用关键字const来指定目标,const表示一个变量或一个变量的存储单元保持不变。因此,在代码中加入关键字const,可以去除指令间的相关性。例如下面的程序:

  void vecsum(short *sum,short*in1,short*in2,unsigned int N){int i;

  for(i=0;i

  由于使用了关键字const,消除了指令之间的相关路径,从而使编译器能够判别内存操作之间的相关性,找到更好的指令执行方案。

  3)使用内联函数(intrinsics)

  内联函数是C64X编译器提供的专门函数,它们与嵌入式的汇编指令是一一对应的,其目的是快速优化C源程序。在源程序中调用内联函数,与调用一般的函数相同,只不过内联函数名称前有下划线作特殊标识。

  当汇编指令功能不易采用C语言表达时,可采用内联函数表示。例如在定点运算中经常要求出源操作数的冗余符号位数,这一功能如果用C完成的话,需要如下的代码:

  unsigned int norm(int src1)

  {

  unsigned int sign, result = 0;

  sign = src1 & 0x80000000;

  while(1)

  {

  f(sign)

  {

  if((src1 = src1

  4)short型数据的int处理

  C64XDSP具有双16bit扩充功能,芯片能在一个周期内完成双16bit的乘法、加减法、比较、移位等操作。在设计时,当对连续的short型数据流操作时,应该转化成对int型数据流的操作。

  这样一次就可以把两个16位的数据读入一个32位的寄存器,然后用内部函数来对它们处理(如_sub2等),充分运用双16bit扩充功能,一次可以进行两个16bit数据的运算,速度将提升一倍。

  5)尽量少进行函数调用

  函数调用的时候,要将PC和一些寄存器压栈保存,函数返回时,则将这些寄存器出栈返回,增加了一些不必要的操作。所以一些小的函数,最好是用适当的内联函数代替直接写入主函数里,一些调用不多的函数,也可以直接写入主函数内。

  这样可以减少不必要的操作,提高速度。但是这样往往会增加程序的长度,因此它是一种利用空间换取时间的办法。

  6)尽量使用逻辑运算代替乘除运算

  在DSP里,乘除运算指令的执行时间要远远超过逻辑移位指令,尤其是除法指令,在设计的时候,可以根据实际情况,进行一些调整,尽量用逻辑移位运算来代替乘除运算,这样可以加快指令的运行时间。

  7)软件流水线技术的使用

  软件流水线技术主要是用来对一个循环结构的指令进行调度安排,使之成为多重迭代循环并行执行。在编译代码时,可以选择编译器的-o2或-o3选项,那么编译器将根据程序尽可能地安排软件流水线。

  在DSP算法中存在大量的循环操作,因此充分地运用软件流水线方式,能极大地提高程序的运行速度。但使用软件流水线还有下面几点限制:

  ● 循环结构不能包含代码调用,但可以包含内联函数。

  ● 循环计数器应该是递减的。

  ● 循环结构不能包含break,if语句不能嵌套,条件代码应当尽量的简单。

  ● 循环结构中不要包含改变循环计数器的代码。

  ● 循环体代码不能过长,因为寄存器(32个)的数量有限,应该分解为多个循环。

  在软件流水线的运用上,应该尽量使复杂的循环分解成简单的小循环,以避免寄存器的数量不够;对于过于简单的循环,应该适当的展开,以增加代码数量和增加流水线中的迭代指令。

  8)采用指令乱序技术

  C语言程序中,有些指令的执行顺序没有严格的要求,程序员可以作出一些位置上的调整,因此可以适当的调整这些指令的位置,穿插于其他的指令之中,从而减小指令的相关性,增加运行时的并行性。

  尤其在循环里,当循环体较小的时候,可以把多个循环的代码写在一个循环体里,合并成一个循环,从而减小循环内指令的相关性,增加指令运行的并行性。但是要注意不要使循环过于复杂,否则很可能会导致不能进行软件流水线的优化。


       上文接《【解密】C语言程序优化工作流程》 

TAG标签耗时:0.022284984588623 秒
010-64928252/400-6446-365 我现在就想找顾问聊聊
让决策变的简单
好的开始是成功的一半
您需要一位互联网
顾问提供专业咨询
高端网站建设 · 小程序 · APP · 微信 · H5网站 · 电商平台建设
网络营销 · 年度运营 · H5场景 、游戏 · VR 、AR · AI人工智能