Thread: check-tests-parallel: popSP

Brought to you by: haible, hoehle, sds

clisp-devel

check-tests-parallel: popSP

From: Sam S. <sd...@gn...> - 2008-11-25 15:00:43

Now check-tests-parallel fails in interpret_bytecode:

Program received signal SIGSEGV, Segmentation fault.
[Switching to Thread 1124084032 (LWP 1695)]
0x000000000045702c in interpret_bytecode_ (closure=
       {one_o = 16164979579800633476}, codeptr=0x346b2f8c0,
     byteptr=0x346b2f8fe "ch\002\001@\002\026\002H\031\004\031\004")
     at ../src/eval.d:7025
7025          codeptr = TheSbvector(TheCclosure(closure)->clos_codevec);
(gdb) p closure
$2 = {one_o = 16164979579800633476}
(gdb) up
#1  0x000000000044ee4a in funcall_closure (closure={one_o = 2533288861432472},
     args_on_stack=2) at ../src/eval.d:5618
5618        interpret_bytecode(closure,codevec,CCV_START_NONKEY); /* process 
Bytecode starting at Byte 8 */
(gdb) p closure
$3 = {one_o = 2533288861432472}
(gdb) xout closure
#<COMPILED-FUNCTION SYS::INDEFINITE-SUBCLASSP>{one_o = 2533288861432472}
(gdb) down
#0  0x000000000045702c in interpret_bytecode_ (closure=
       {one_o = 16164979579800633476}, codeptr=0x346b2f8c0,
     byteptr=0x346b2f8fe "ch\002\001@\002\026\002H\031\004\031\004")
     at ../src/eval.d:7025
7025          codeptr = TheSbvector(TheCclosure(closure)->clos_codevec);
(gdb) p closure
$4 = {one_o = 16164979579800633476}
(gdb) p closureptr
$5 = (gcv_object_t *) 0x551bd8
(gdb) p *closureptr
$6 = {one_o = 16164979579800633476}

looks like closureptr is not restored properly by

popSP(closureptr = (gcv_object_t*) );

Re: check-tests-parallel: popSP

From: Vladimir T. <vtz...@gm...> - 2008-11-25 16:20:03

On Nov 25, 2008, at 5:00 PM, Sam Steingold wrote:
> Now check-tests-parallel fails in interpret_bytecode:
>
> Program received signal SIGSEGV, Segmentation fault.
> [Switching to Thread 1124084032 (LWP 1695)]
> 0x000000000045702c in interpret_bytecode_ (closure=
>       {one_o = 16164979579800633476}, codeptr=0x346b2f8c0,
>     byteptr=0x346b2f8fe "ch\002\001@\002\026\002H\031\004\031\004")
>     at ../src/eval.d:7025
> 7025          codeptr = TheSbvector(TheCclosure(closure)- 
> >clos_codevec);
> (gdb) p closure
> $2 = {one_o = 16164979579800633476}
> (gdb) up
> #1  0x000000000044ee4a in funcall_closure (closure={one_o =  
> 2533288861432472},
>     args_on_stack=2) at ../src/eval.d:5618
> 5618        interpret_bytecode(closure,codevec,CCV_START_NONKEY); / 
> * process Bytecode starting at Byte 8 */
> (gdb) p closure
> $3 = {one_o = 2533288861432472}
> (gdb) xout closure
> #<COMPILED-FUNCTION SYS::INDEFINITE-SUBCLASSP>{one_o =  
> 2533288861432472}
> (gdb) down
> #0  0x000000000045702c in interpret_bytecode_ (closure=
>       {one_o = 16164979579800633476}, codeptr=0x346b2f8c0,
>     byteptr=0x346b2f8fe "ch\002\001@\002\026\002H\031\004\031\004")
>     at ../src/eval.d:7025
> 7025          codeptr = TheSbvector(TheCclosure(closure)- 
> >clos_codevec);
> (gdb) p closure
> $4 = {one_o = 16164979579800633476}
> (gdb) p closureptr
> $5 = (gcv_object_t *) 0x551bd8
> (gdb) p *closureptr
> $6 = {one_o = 16164979579800633476}
>
> looks like closureptr is not restored properly by
>
> popSP(closureptr = (gcv_object_t*) );

On which test does this happen? How deep is the C call stack?

Most of the SIGSEGV I have encountered in interpret_bytecode were  
caused by C stack overflow - but I have increased it to 16 MB in  
check-tests-parallel. Also in
most of the cases it happens on entering in interpret_bytecode.

Vladimir

Re: check-tests-parallel: popSP

From: Sam S. <sd...@gn...> - 2008-11-25 17:12:40

Vladimir Tzankov wrote:
> 
> On which test does this happen? 

dunno.
what difference does it make?
on a different occasion I got a deadlock (nothing happens, loadavg=2, i.e., 
apparently, two threads are spinning).

the tests now get fairly far, while generating quite a few failures.
after the crash I see these:

       0 Nov 25 11:33 iofkts.erg
       0 Nov 25 11:33 lambda.erg
       0 Nov 25 11:33 lists151.erg
       0 Nov 25 11:35 alltest.erg
       0 Nov 25 11:35 characters.erg
       0 Nov 25 11:35 clos.erg
     870 Nov 25 11:35 backquot.erg
       0 Nov 25 11:36 encoding.erg
    3002 Nov 25 11:36 eval20.erg
       0 Nov 25 11:36 ext-clisp.erg


> How deep is the C call stack?

Program received signal SIGSEGV, Segmentation fault.
[Switching to Thread 1107302720 (LWP 5168)]
0x000000000045702c in interpret_bytecode_ (closure={one_o = 202623543511880},
     codeptr=0x3456b0730,
     byteptr=0x3456b07dc 
"\026\006H\033���\033B�\033��\205\a�k\r��3\003\025��h\a") at ../src/eval.d:7025
7025          codeptr = TheSbvector(TheCclosure(closure)->clos_codevec);
(gdb) where
#0  0x000000000045702c in interpret_bytecode_ (closure=
       {one_o = 202623543511880}, codeptr=0x3456b0730,
     byteptr=0x3456b07dc 
"\026\006H\033���\033B�\033��\205\a�k\r��3\003\025��h\a") at ../src/eval.d:7025
#1  0x000000000044ee4a in funcall_closure (closure={one_o = 2533288840017992},
     args_on_stack=2) at ../src/eval.d:5618
#2  0x000000000044bbd9 in funcall (fun={one_o = 2533288840017992},
     args_on_stack=2) at ../src/eval.d:4850
#3  0x00000000004550b9 in interpret_bytecode_ (closure=
       {one_o = 2533288840034328}, codeptr=0x3456c7030, byteptr=0x3456c70c8 "")
     at ../src/eval.d:6833
#4  0x000000000044b624 in apply_closure (closure={one_o = 2533288840034328},
     args_on_stack=0, args={one_o = 1125899916528448}) at ../src/eval.d:4783
#5  0x0000000000446716 in apply (fun={one_o = 2533288840034328},
     args_on_stack=0, other_args={one_o = 18014453559950672})
     at ../src/eval.d:4004
#6  0x000000000045544a in interpret_bytecode_ (closure=
       {one_o = 2533288840056976}, codeptr=0x3456ca728, byteptr=0x3456ca745 "")
     at ../src/eval.d:6854
#7  0x000000000044ee4a in funcall_closure (closure={one_o = 2533288840056976},
     args_on_stack=0) at ../src/eval.d:5618
#8  0x000000000044bbd9 in funcall (fun={one_o = 2533288840056976},
     args_on_stack=0) at ../src/eval.d:4850
#9  0x0000000000648da1 in thread_stub (arg=0x165d78c0) at ../src/zthread.d:142
#10 0x00000033c8e062f7 in start_thread () from /lib64/libpthread.so.0
#11 0x00000033c82ce85d in clone () from /lib64/libc.so.6
(gdb)



what I see now is:

*** - FRESH-LINE: extending the vector by 1 elements makes it too long



Program exited with code 01.
(gdb)

Re: check-tests-parallel: popSP

From: Vladimir T. <vtz...@gm...> - 2008-11-25 17:34:37

On Nov 25, 2008, at 7:12 PM, Sam Steingold wrote:
> Vladimir Tzankov wrote:
>> On which test does this happen?
>
> dunno.
> what difference does it make?

Some tests require (very) deep stack - but apparently this is not the  
case.

> on a different occasion I got a deadlock (nothing happens,  
> loadavg=2, i.e., apparently, two threads are spinning).

I observed deadlocks and traced them to symbol package.d:newinsert():  
(actually in string_hashcode()) but have gone further.

check-tests-parallel problems

From: Vladimir T. <vtz...@gm...> - 2008-11-25 16:47:25

Hi,

Currently I encountered following problems:

1. There is a problem in the GC (pinned objects) - I am working on it  
now - almost succeeded to consistently reproduce it (and it seems  
related to SSTRINGS).
2. Streams bindings get messed (especially broadcasted *standard- 
output*).  I am not sure that bindings get wrong or something else.
3. SSTRINGS (particularly O() that are used by the printer) cause  
SIGSEGV when used in few threads simultaneously - but may be this is  
related to the GC problem above.

Vladimir