Thread: [Sbcl-devel] deadlock in PCL

SourceForge Headquarters 225 Broadway Suite 1600 San Diego, CA 92101 +1 (858) 454-5900

  Hello.
  I've run into some deadlocks in PCL code. I wrote about it on #lisp,
and dlowe noted that this has to deal with cffi foreign string class
being changed.
  There are 11 threads that are locked up waiting on an unnamed
spinlock in PCL (I guess it's *pcl-lock*). A backtrace from such
thread looks like

  0: ((LAMBDA (SWANK-BACKEND::DEBUGGER-LOOP-FN)) #<FUNCTION (LAMBDA #)
{1002BD5429}>)
  1: (SWANK::DEBUG-IN-EMACS #<SIMPLE-ERROR {10056EB6A1}>)
  2: (SWANK:INVOKE-SLIME-DEBUGGER #<SIMPLE-ERROR {10056EB6A1}>)
  3: (SWANK:SIMPLE-BREAK "Interrupt from Emacs")
  4: ((LAMBDA (SWANK-BACKEND::HOOK SWANK-BACKEND::FUN)) #<FUNCTION
SWANK:SWANK-DEBUGGER-HOOK> #<FUNCTION (LAMBDA #) {100999E919}>)
  5: (SWANK::CALL-WITH-REDIRECTED-IO #<SWANK::CONNECTION {1003831E21}>
#<CLOSURE (LAMBDA #) {10056EB589}>)
  6: (SWANK::CALL-WITH-CONNECTION #<SWANK::CONNECTION {1003831E21}>
#<FUNCTION (LAMBDA #) {100999E919}>)
  7: (SWANK::INVOKE-OR-QUEUE-INTERRUPT #<CLOSURE (LAMBDA #) {10056EA969}>)
  8: ((FLET SB-UNIX::INTERRUPTION))
  9: ((FLET #:WITHOUT-INTERRUPTS-BODY-[INVOKE-INTERRUPTION]10))
 10: (SB-SYS:INVOKE-INTERRUPTION #<FUNCTION (FLET
SB-UNIX::INTERRUPTION) {1000070B99}>)
 11: ("foreign function: #x41EF72")
 12: ("foreign function: #x41F030")
 13: (SB-PCL::INVALIDATE-WRAPPER #<SB-PCL::WRAPPER #<STANDARD-CLASS
CFFI::FOREIGN-STRING-TYPE> {10054899A1}> :FLUSH #<SB-PCL::WRAPPER
#<STANDARD-CLASS CFFI::FOREIGN-STRING-TYPE> {10055C4931}>)
 14: ((FLET #:WITHOUT-INTERRUPTS-BODY-[CALL-WITH-SPINLOCK]448))
 15: (SB-THREAD::CALL-WITH-SPINLOCK #<CLOSURE (FLET
SB-THREAD::WITH-SPINLOCK-THUNK) {7FBC8AAC45A9}> #S(SB-THREAD::SPINLOCK
:NAME NIL :VALUE #<SB-THREAD:THREAD RUNNING {1002730081}>))
 16: (SB-PCL::FORCE-CACHE-FLUSHES #<STANDARD-CLASS CFFI::FOREIGN-STRING-TYPE>)
 17: (SB-PCL::CHECK-WRAPPER-VALIDITY #<error printing object>)
 18: (SB-PCL::CACHE-MISS-VALUES #<error printing object>)
 19: (SB-PCL::CACHING-MISS #<error printing object>)
 20: (MODBUS-INT::MODBUS-INIT-TCP #.(SB-SYS:INT-SAP #X00A20FA0)
"127.0.0.1" 2029)
 21: (MODBUS::MODBUS-SLAVE-ALLOC #<MODBUS::MODBUS-SLAVE {1002881FE1}>)
 22: (MODBUS::MODBUS-SLAVE-LOOP #<MODBUS::MODBUS-SLAVE {1002881FE1}>)
 23: ((LAMBDA ()))
 24: ((FLET SB-THREAD::WITH-MUTEX-THUNK))
 25: ((FLET #:WITHOUT-INTERRUPTS-BODY-[CALL-WITH-MUTEX]477))
 26: (SB-THREAD::CALL-WITH-MUTEX ..)
 27: ((LAMBDA ()))
 28: ("foreign function: #x41EF72")
 29: ("foreign function: #x41654A")

MODBUS-INT::MODBUS-INIT-TCP function definition looks like

(defcfun "modbus_init_tcp" :void
  (mb-param :pointer)
  (ip-address :string)
  (port :int))

which expands into

(PROGN
  NIL
  (DEFUN MODBUS-INIT-TCP (MB-PARAM IP-ADDRESS PORT)
    (LET ((#:G947 MB-PARAM))
      (MULTIPLE-VALUE-BIND
            (#:G948 #:PARAM974)
          (TRANSLATE-TO-FOREIGN IP-ADDRESS #<CFFI::FOREIGN-STRING-TYPE :UTF-8>)
        (UNWIND-PROTECT
             (PROGN
               (LET ((#:G949 PORT))
                 (CFFI-SYS:%FOREIGN-FUNCALL "modbus_init_tcp"
                                            (:POINTER #:G947 :POINTER
#:G948 :INT
                                                      #:G949 :VOID)
                                            :CALLING-CONVENTION :CDECL :LIBRARY
                                            :DEFAULT)))
          (FREE-TRANSLATED-OBJECT #:G948 #<CFFI::FOREIGN-STRING-TYPE :UTF-8>
                                  #:PARAM974))))))

My guess is that this may be somehow connected with the fact that
CFFI-FOREIGN-STRING-TYPE class isn't used at all before these threads
are started, and they all are started simultaneously. I never
encountered this problem before I switched to a dual-core computer,
and it's not easily reproducible (it occurs once in 10-20 runs).

Ivan

Thread: [Sbcl-devel] deadlock in PCL

Common Lisp compiler and runtime

sbcl-devel