Download Latest Version ocr2data_libre_20110914.tar.gz (8.0 MB)
Email in envelope

Get an email when there's a new version of ocr2data

Home
Name Modified Size InfoDownloads / Week
base de datos 2011-03-08
documentos_ocr2data_20110914.tar.gz 2011-09-14 738.5 kB
ocr2data_libre_20110914.tar.gz 2011-09-14 8.0 MB
ocr2data_doxygen_docs.zip 2011-03-29 5.1 MB
doc_ocr_20110316.pdf 2011-03-16 61.1 kB
README_es.txt 2011-03-08 2.1 kB
ocr2data_sql_20110303l.zip 2011-03-03 1.1 kB
congen_20110222.zip 2011-02-23 7.7 MB
congen_20110214.zip 2011-02-14 7.7 MB
Totals: 9 Items   29.2 MB 0
***********************************************
 OCR2DATA, 1# Snapshot
***********************************************

Hemos estado muy ocupados y finalmente ha sido posible terminar y publicar otro snapshot del projecto.  Con esta versión hemos logrado tener un prototipo completo. 
Para ello hemos reducido un poco las funcionalidades del panel de lectura de documentos, limitándolo a unos pocos campos concretos.  
Desde Ecomm tenemos una lista de comunicaciones, al hacer click en la primera, se carga el "modframe.php", este fichero carga el primer documento, y encola (carga en segundo plano) el siguiente reconocimiento.  Naturalmente estos documentos han sido reconocidos previamente, con lo que el resultado de OCR y análisis esta ya en la base de datos.  El usuario confirma el reconocimiento, y al pulsar el botón es enviado al siguiente reconocimiento, que como ya ha sido cargado en memoria aparece instantáneamente. 
El OCR+analisis es bastante bueno. Ahí donde el OCR puede extraer suficiente información, quizás un 60% del texto, el análisis completa este porcentaje hasta el 100%. 
Desgraciadamente hay datos sobre los que no podemos hacer excesivo análisis, como los números de pedido.. que son alfanumericos,  y las fechas.  Con las fechas creíamos que lo tendríamos fácil, pero ha resultado un problema bastante mas complicado y ha resultado en un reconocimiento menos fiable de lo que nos gustaría. 
Ahora mismo estamos usando OCR2DATA integrado con Ecomm, aunque permanecen como dos aplicaciones separadas. La integración es a nivel de base de datos con un campo que enlaza los comunicados ecomm con los reconocimientos OCR2DATA. 
Tanto Ecomm como OCR2DATA utilizan el motor de templates patTemplate, asi que es fácil realizar modificaciones en los diseños.  Nos gustaría que hicierais preguntas, o hicierais sugerencias.  En esta fase del proyecto el metal aun esta caliente y se pueden integrar ideas que podáis darnos. 


Un saludo,
Óscar


Pagina oficial:
https://sourceforge.net/projects/ocr2data/

Foro:
https://sourceforge.net/projects/ocr2data/forums/forum/1331899
Source: README_es.txt, updated 2011-03-08