Menu

#8 Yhdysmerkin sisältäviä summayhdyssanoja ei tunnisteta

bug
open
nobody
morphology (34)
2
2012-09-30
2006-10-18
No

Voikko ei yleensä tunnista yhdysmerkin sisältäviä
summayhdyssanoja. Summayhdyssanan osat ovat
merkitykseltään rinnakkaisia, eli ne eivät määritä
toisiaan. Tällaisia ovat
esimerkiksi "laulaja-näyttelijä"
tai "jääkaappi-pakastin".
Muodon "suomalais-ugrilainen" Voikko tunnistaa.

Summayhdyssanoissa vain jälkimmäinen osa taipuu,
esimerkiksi "musta-puna-keltaiseen". Osat kuuluvat
samaan sanaluokkaan (nomini tai adverbi mutta ei
verbi).

(Summayhdyssana on myös "mustavalkoinen" 'musta ja
valkoinen', mutta monet summayhdyssanat vakiintuvat
muotoon, jossa ei käytetä yhdysmerkkiä.)

Discussion

  • Harri Pitkänen

    Harri Pitkänen - 2006-10-18

    Logged In: YES
    user_id=1358010

    Tämä on vaikea korjattavaksi, koska sanojen
    rinnakkaisuuden toteaminen koneellisesti on vaikeaa. Se,
    että ne kuuluvat samaan sanaluokkaan ei riitä. Yleisimmät
    tapaukset ("jääkaappi-pakastin" ja "laulaja-näyttelijä")
    voi lisätä sanastoon erikseen. -inen-päätteisiä varten on
    jo olemassa heuristiikka joka huolehtii tästä. Tätä
    voitaisiin myös laajentaa mm. väreihin. Mutta täysin
    yleistä ratkaisua tuskin on mahdollista toteuttaa.

     
  • Teemu Likonen

    Teemu Likonen - 2006-11-08

    Logged In: YES
    user_id=1525892

    Sekä Soikko että Lingsoft näyttäisivät hyväksyvän kaikki
    substantiivien ja adjektiivien yhdistelmät.

     
  • Teemu Likonen

    Teemu Likonen - 2006-11-08

    Logged In: YES
    user_id=1525892

    Vielä tarkennus, että Lingsoft ja Soikko sallivat
    yhdysmerkin yhdyssanoissa, jos yhdysmerkin vasemmalla
    puolella oleva (yhdys)sanan viimeinen osa on nominatiivissa
    (yks.) tai genetiivissä (yks. tai mon.).

     
  • Harri Pitkänen

    Harri Pitkänen - 2008-03-29

    Logged In: YES
    user_id=1358010
    Originator: NO

    Lisäsin tiedostoon yhdyssanat.lex muutamia hyvin yleisiä tällaisia sanoja (r2071). Ajamalla esimerkiksi Wikipediasta otetun yleisyysjärjestyksessä olevan sanalistan komentojen "voikkospell" ja "voikkospell accept_extra_hyphens=1" läpi ja vertaamalla eroja voi helposti löytää lisää tapauksia, joissa summayhdyssana kannattaa lisätä sanastoon. Kaikkia ei tietysti kannata laittaa vaan ainoastaan yleisimmät.

     

Log in to post a comment.