Menu

Sphinx4 for Spanish

javiercl
2008-12-11
2012-09-21
  • javiercl

    javiercl - 2008-12-11

    Hi,

    I'm reading several tutorials about Sphinx4 but I still have some doubts.

    • Is there Sphinx4 for Spanish ?
    • I would like to create a dictionary which replay the meaning of a word just by saying it. Is that workable?.

    Thanks in advance.

     
    • Raul  Xolaltenco

      Raul Xolaltenco - 2008-12-12

      Que tal Javier seguro que se puede si gustas puedo ayudarte ha echar andar algunos ejemplos que tra consigo el sphinx 4 asi que si gustas solo avisame va mi correo.

       
    • javiercl

      javiercl - 2008-12-23

      Hola de nuevo,

      He probado el modelo del ITEMS y realmente funciona tal como indica el videoAyuda.zip.

      Todavía tengo alguna dificultad con mi pronunciación, ya que pronuncio el sonido 'z' en lugar de 's'. Por ejemplo al decir, cero, cinco o diez.
      Deduzco que modificando el archivo h4.dict y cambiando 'S' por 'Z' , donde corresponda, podría adaptarlo a mi pronunciación. ¿estoy en lo cierto?.

      A parte del acento que se tenga he notado que incluso en la demo HelloDigits en inglés, me reconoce un porcentaje demasiado bajo. ¿podría deberse al tipo de micrófono que utilizo (aunque he probado tres diferentes) o al sistema operativo (utilizo Linux)?

      Muchas gracias.
      Saludos.
      Javier.

       
      • Nickolay V. Shmyrev

        I managed to get it translated with google at last. You need to try to recognize a recording from a file and submit an example of what you are doing. Probably you aren't a Mexican macho :)

         
    • vicsanca

      vicsanca - 2008-12-30

      Hola

      Estamos probando el ejemplo del video y apenas reconoce nada de nada, vamos, para nada se parece a los resultados en tu ejemplo. ¿hay que realizar ajustes al microfono? ¿eres tu el creador del modelo de habla hispana y por eso te reconoce mejor a ti?
      ¿algun consejo para mejorar el porcentaje de aciertos?

      Gracias

       
    • javiercl

      javiercl - 2008-12-30

      Hola,

      Al principio me ocurria lo mismo, probad lo siguiente.

      En el archivo HelloDigits.config.xml buscad ;

      <component name="featureExtraction"
      type="edu.cmu.sphinx.frontend.feature.DeltasFeatureExtractor"/>

      y cambiarlo por ;

      <component name="featureExtraction"
      type="edu.cmu.sphinx.frontend.feature.S3FeatureExtractor"/>

      Saludos.

       
    • vicsanca

      vicsanca - 2008-12-31

      Pues si, mejora bastante. Muchisimas gracias.
      ¿Algun otro consejo mas tu que has estado ya trabajando con esto mas tiempo? cualquier consejo o lectura que me recomiendes sera bien recibida.

       
    • javiercl

      javiercl - 2009-01-01

      Yo me voy guiando por la diversa documentación que hay en la página de sphinx además de consultar en este foro. En el mismo directorio donde se instala sphinx4, hay un archivo index.html que contiene documentación interesante.

      Saludos.

       
    • Ahmad Hassan

      Ahmad Hassan - 2009-01-06

      I am using SLM tool kit online to create Language model.Is it right ?. Is there any difference between SLM tool kit online and CMU-Cam_Toolkit_v2 to create Language model.

       
    • Ahmad Hassan

      Ahmad Hassan - 2009-01-06

      Sir

           I am getting some error during Language model.
           Help me out.
      

      Error

      ahmad@HSRD14:~/Speech/CMU-Cam_Toolkit_v2/bin$ text2idngram -vocab $bn.tmp.vocab < $bn.tmp.closed > $bn.tmp.idngram
      text2idngram
      Vocab : weather.txt.tmp.vocab
      N-gram buffer size : 100
      Hash table size : 200000
      Temp directory : /usr/tmp/
      Max open files : 20
      FOF size : 10
      n : 3
      Initialising hash table...
      Reading vocabulary...
      Allocating memory for the n-gram buffer...
      Reading text into the n-gram buffer...
      20,000 n-grams processed for each ".", 1,000,000 for each line.
      ..................................................
      ........................
      Sorting n-grams...
      Writing sorted n-grams to temporary file /usr/tmp/text2idngram.temp.HSRD14.6331.1
      rr_fopen: problems opening /usr/tmp/text2idngram.temp.HSRD14.6331.1 for "w".

       
    • javiercl

      javiercl - 2009-01-06

      ahmad92hassan, I've never used SLM tool kit, but I think you should ask the question in another thread because the subject of this one is "Sphinx4 for Spanish" and many people who is able to replay you don't see your question.

      regards.

       
    • Martin Acuña

      Martin Acuña - 2009-04-30

      Hola Raul, estoy interesado en hacer funcionar el Sphinx en español, he tratado de varias formas pero solo reconoce cuando hablo en ingles, me interesaria ver tu video de ayuda si no te molesta. Desde los links que agregaste no pude hacerlo.

      Saludos y gracias!

      Martin.

       
  • Anonymous

    Anonymous - 2011-05-28

    holas como esta intente de todo para poder hacer funcionar esto.. estoy usando
    el Sphinx 4 y quisiera ver si tiene por ahi algun ejemplito de como poder
    reconocer las voces en español o donde las bajo por fa.. :S es urgente.......
    gracias..

     
  • Anonymous

    Anonymous - 2011-05-28

    holas podrian enviar el link donde esta el video que comentan.... por que
    logre hacerlo funcionar bien en ingles pero ahora lo quiero hacer funcionar en
    español.. :D gracias..

     

Log in to post a comment.

Want the latest updates on software, tech news, and AI?
Get latest updates about software, tech news, and AI from SourceForge directly in your inbox once a month.