Yhdysmerkin sisältäviä summayhdyssanoja ei tunnisteta
Library of linguistic tools
Brought to you by:
hatp
Voikko ei yleensä tunnista yhdysmerkin sisältäviä
summayhdyssanoja. Summayhdyssanan osat ovat
merkitykseltään rinnakkaisia, eli ne eivät määritä
toisiaan. Tällaisia ovat
esimerkiksi "laulaja-näyttelijä"
tai "jääkaappi-pakastin".
Muodon "suomalais-ugrilainen" Voikko tunnistaa.
Summayhdyssanoissa vain jälkimmäinen osa taipuu,
esimerkiksi "musta-puna-keltaiseen". Osat kuuluvat
samaan sanaluokkaan (nomini tai adverbi mutta ei
verbi).
(Summayhdyssana on myös "mustavalkoinen" 'musta ja
valkoinen', mutta monet summayhdyssanat vakiintuvat
muotoon, jossa ei käytetä yhdysmerkkiä.)
Logged In: YES
user_id=1358010
Tämä on vaikea korjattavaksi, koska sanojen
rinnakkaisuuden toteaminen koneellisesti on vaikeaa. Se,
että ne kuuluvat samaan sanaluokkaan ei riitä. Yleisimmät
tapaukset ("jääkaappi-pakastin" ja "laulaja-näyttelijä")
voi lisätä sanastoon erikseen. -inen-päätteisiä varten on
jo olemassa heuristiikka joka huolehtii tästä. Tätä
voitaisiin myös laajentaa mm. väreihin. Mutta täysin
yleistä ratkaisua tuskin on mahdollista toteuttaa.
Logged In: YES
user_id=1525892
Sekä Soikko että Lingsoft näyttäisivät hyväksyvän kaikki
substantiivien ja adjektiivien yhdistelmät.
Logged In: YES
user_id=1525892
Vielä tarkennus, että Lingsoft ja Soikko sallivat
yhdysmerkin yhdyssanoissa, jos yhdysmerkin vasemmalla
puolella oleva (yhdys)sanan viimeinen osa on nominatiivissa
(yks.) tai genetiivissä (yks. tai mon.).
Logged In: YES
user_id=1358010
Originator: NO
Lisäsin tiedostoon yhdyssanat.lex muutamia hyvin yleisiä tällaisia sanoja (r2071). Ajamalla esimerkiksi Wikipediasta otetun yleisyysjärjestyksessä olevan sanalistan komentojen "voikkospell" ja "voikkospell accept_extra_hyphens=1" läpi ja vertaamalla eroja voi helposti löytää lisää tapauksia, joissa summayhdyssana kannattaa lisätä sanastoon. Kaikkia ei tietysti kannata laittaa vaan ainoastaan yleisimmät.