Thread: [sdcc-devel] A question of optimization...

SourceForge Headquarters 225 Broadway Suite 1600 San Diego, CA 92101 +1 (858) 454-5900

For various (possibly silly) reasons, I had the code:

void multiplyByte(Byte a, Byte b, Byte xdata * lo, Byte xdata * high) {
  unsigned int r =3D a * b ;
  *low =3D r ;
  *high =3D r >> 8 ;
}

For the mcs51, this generates the code:

 0079                     324 _multiplyByte:
                            325 ;	multiplyByte_test.c 65
   0079 AA 82               326 	mov	r2,dpl
                            327 ;	multiplyByte_test.c 63
   007B 85*00 F0            328 	mov	b,_multiplyByte_PARM_2
   007E EA                  329 	mov	a,r2
   007F A4                  330 	mul	ab
   0080 FA                  331 	mov	r2,a
   0081 AB F0               332 	mov	r3,b
                            333 ;	multiplyByte_test.c 64
   0083 85*01 82            334 	mov	dpl,_multiplyByte_PARM_3
   0086 85*02 83            335 	mov	dph,(_multiplyByte_PARM_3 + 1)
   0089 8A 04               336 	mov	ar4,r2
   008B EC                  337 	mov	a,r4
   008C F0                  338 	movx	@dptr,a
                            339 ;	multiplyByte_test.c 65
   008D 85*03 82            340 	mov	dpl,_multiplyByte_PARM_4
   0090 85*04 83            341 	mov	dph,(_multiplyByte_PARM_4 + 1)
   0093 8B 02               342 	mov	ar2,r3
   0095 7B 00               343 	mov	r3,#0x00
   0097 EA                  344 	mov	a,r2
   0098 F0                  345 	movx	@dptr,a
   0099                     346 00101$:
   0099 22                  347 	ret

The code works and so there is no actual error but the use of r4 at
0089/008D seems totally superfluous.  The hand-written optimization I
came up with is:

  _asm
  mov a, dpl
  mov  b, _multiplyByte_PARM_2
  mul ab
  mov	dpl,_multiplyByte_PARM_3
  mov	dph,(_multiplyByte_PARM_3 + 1)
  movx @dptr,a
  mov	dpl,_multiplyByte_PARM_4
  mov	dph,(_multiplyByte_PARM_4 + 1)
  mov	a,b ;
  movx @dptr,a ;
  _endasm ;

Is it likely to be impossible for SDCC to get any closer to this sort of
code?  My suspicion is that a global rather than peephole optimizer
would be required.

--=20
Russel.
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
Dr Russel Winder               +44 20 7585 2200
41 Buckmaster Road             +44 7770 465 077
London SW11 1EN, UK            ru...@ru...

Thread: [sdcc-devel] A question of optimization...

The Small Device C Compiler (SDCC), targeting 8-bit architectures

sdcc-devel