I'm trying to measure the accuracy of speech recognition pocketsphinx with help word_align.pl. I recognize Russian speech. I use the encoding in console 65001 (UTF-8). but I get this result. what am I doing wrong? how can I measure the accuracy of recognizing the Russian language? I will be very grateful!
C:\Users\goncharovav\pocketsphinx>C:\Perl64\bin\perl.exe word_align.pl audio/101.transcription audio/hyp
Use of the encoding pragma is deprecated at word_align.pl line 14.
закрыть приложение начать работу показать команды начать выполнение завершить выполнение ответ нет выбрать пункт отменить выполнение ответ да предыдущий шаг (101)
закÑÑÑÑ Ð¿ÑиложÐΜниÐΜ Ð½Ð°ÑаÑÑ ÑабоÑÑ Ð¿Ð¾ÐºÐ°Ð·Ð°ÑÑ ÐºÐ¾Ð¼Ð°Ð½Ð´Ñ Ð½Ð°ÑаÑÑ Ð²ÑполнÐΜниÐΜ Ð·Ð°Ð²ÐΜÑÑиÑÑ Ð²ÑполнÐΜниÐΜ Ð¾ÑвÐΜÑ Ð½ÐΜÑ Ð²ÑбÑаÑÑ Ð¿ÑÐ½ÐºÑ Ð¾ÑмÐΜниÑÑ Ð²ÑполнÐΜниÐΜ Ð¾ÑвÐΜÑ Ð´Ð° пÑÐΜдÑдÑÑий Ñаг (101)
Words: 20 Correct: 0 Errors: 20 Percent correct = 0.00% Error = 100.00% Accuracy = 0.00%
Insertions: 0 Deletions: 0 Substitutions: 20
file adapt.transcription
<s> закрыть приложение начать работу показать команды начать выполнение завершить выполнение ответ нет выбрать пункт отменить выполнение ответ да предыдущий шаг </s> (101)
file hyp
закрыть приложение начать работу показать команды начать выполнение завершить выполнение ответ нет выбрать пункт отменить выполнение ответ да предыдущий шаг (101 -30354)
If you would like to refer to this comment somewhere else in this project, copy and paste the following link:
I'm trying to measure the accuracy of speech recognition pocketsphinx with help word_align.pl. I recognize Russian speech. I use the encoding in console 65001 (UTF-8). but I get this result. what am I doing wrong? how can I measure the accuracy of recognizing the Russian language? I will be very grateful!
file adapt.transcription
file hyp
Attach the files here.
I apologize for not adding the files at once.
Last edit: Goncharova Valentina 2018-02-08
Please try newer version of word_align script
https://raw.githubusercontent.com/cmusphinx/sphinxtrain/master/scripts/decode/word_align.pl
Thank you so much! It works