apertium-catala Mailing List for Apertium: Machine Translation Toolbox

SourceForge Headquarters 225 Broadway Suite 1600 San Diego, CA 92101 +1 (858) 454-5900

Bon dia,

Us escric per a informar-vos que he enllestit el canvi d'etiquetatge del 
lèxic valencià que tenim en el diccionari monolingüe català. Ja no tenim 
entrades amb l'atribut "vr" i les variacions es gestionen amb el nou 
sistema de preferències. Això implica que ja no cal compilar el 
diccionari monolingüe diverses vegades per a tenir una versió de cada 
variant; hi ha un únic diccionari que ho pot analitzar i generar tot i 
es trien les formes més adequades en funció del mode del parell. Notareu 
que la compilació és més ràpida.

Només heu de revisar que no us hagi aparegut algun error de testvoc pel 
canvi en algunes entrades. No en seran gaires. A banda d'això, no cal 
fer res més.

Encara hi ha marge de millora: hi ha lèxic etiquetat com un fenomen 
concret (per exemple, "rodó" > "redó") i lèxic inclòs en el calaix de 
sastre "lèxic valencià". Això es pot afinar més, però no implica cap 
regressió ni tocar cap parell, es pot fer quan vulguem i al ritme que 
vulguem. Només és qüestió de canviar el paradigma en el diccionari 
monolingüe per a l'entrada específica.

Us faig un resum del nou etiquetatge en el diccionari monolingüe de català:

1. L'atribut "vr" ja no es fa servir.

2. El lèxic amb petites variacions ortogràfiques, sense canvis de 
paradigma i sinònims complets s'etiqueta amb una preferència monolingüe 
i està disponible per a tots els parells:

<e lm="escalfar">        <i>escalf</i><par n="abander/ar__vblex"/></e>
<e lm="calfar">          <p><l>calf</l><r>escalf</r></p><par n="abander/ar__vblex"/><par n="v:calfar"/></e>

3. El lèxic amb variacions més importants, fins i tot canvis de 
gènere/nombre, i sense importar que no siguin sinònims complets, 
s'etiqueta amb un comentari i s'ha de gestionar en el diccionari 
bilingüe de cada parell:

<e lm="xocolata" c="V xocolata"><i>xocolat</i><par n="abell/a__n"/></e>
<e lm="xocolate" c="V xocolata"><i>xocolate</i><par n="abric__n"/></e>

A reveure,

Marc Riera

2016	Jan	Feb (3)	Mar	Apr	May	Jun	Jul	Aug	Sep	Oct	Nov	Dec
2017	Jan	Feb	Mar (1)	Apr (15)	May (3)	Jun (14)	Jul (15)	Aug	Sep (15)	Oct (8)	Nov (9)	Dec
2018	Jan (19)	Feb (5)	Mar (13)	Apr (40)	May (15)	Jun (14)	Jul (19)	Aug (3)	Sep (3)	Oct (4)	Nov	Dec (3)
2019	Jan	Feb	Mar (4)	Apr (4)	May (6)	Jun (24)	Jul (8)	Aug	Sep (17)	Oct (15)	Nov	Dec (5)
2020	Jan (6)	Feb (8)	Mar	Apr	May (1)	Jun (27)	Jul (1)	Aug	Sep	Oct (1)	Nov (6)	Dec
2021	Jan	Feb	Mar (7)	Apr	May	Jun	Jul	Aug (6)	Sep	Oct (1)	Nov (5)	Dec
2022	Jan	Feb	Mar	Apr	May	Jun (1)	Jul	Aug	Sep	Oct	Nov	Dec (7)
2023	Jan	Feb (4)	Mar (1)	Apr	May	Jun (4)	Jul	Aug	Sep	Oct	Nov (4)	Dec
2024	Jan (1)	Feb	Mar	Apr	May	Jun	Jul	Aug	Sep	Oct (1)	Nov	Dec

apertium-catala Mailing List for Apertium: Machine Translation Toolbox

The free and open-source rule-based machine translation platform

apertium-catala — Una llista per gent que desenvolupa i utilitza els parells amb català en Apertium