pouzity bol lexsklonovac od ceresnu
data a zdrojaky na:
http://www.sturak.sk/~michalicka/csfish/
je hotova a ulozena v cvs:
http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/csfish/src/matchovanie_slova_sk_cz/
Nanestastie v DELPHI, tymto prosim vsetkych aby svoje prispevky robili najlepsie v Jave, ked to nejde aspon v C(++). Tym je to aspon portabilne na unixy.
das vetu v jednom tvare (alebo cast vety) do googla
a pozres pocet hitov, to iste pre tu istu vetu v inom tvare. Viac hitov vyhrava.
Na koperniku su hotove wordlisty podla slovnych druhov
V pripade, ze by sme mali v slovniku SK CZ aj nejake nezmyselne dvojice, nepouziju sa pri preklade z jednoducheho dovodu, ze ich ziadne vzorove slovo nematchne...to je fajn :)
- by hladny (smadny) -> mit hlad (smed)
- jedes autem, ale jdes pesi
- 2 vyznamy slova porobit v slovencine, ale iba 1 vyznam podelat v cestine
Do modulu dokumenty som pridal subor CVS-navod.txt, kde je vysvetlene zakladne nastavenie CVS systemu (system na pracu so subormi na SF), pozriete si to v sekcii CVS, polozka "Browse CVS repository"
Mali by sme vsetky data s ktorymi budeme pracovat mat v jednom kodovani. Navrhujem ISO-8859-2 - standartne kodovanie, ktore zvladaju aj windoze, aj unixy. (aj tak je to vseobecny standart...)
Postup na rekodovanie v linuxe:
$ iconv -f WINDOWS-1250 -t ISO-8859-2 subor.txt > vystup.txt
- cesko-slovensky slovnik, slova len v zakladnom tvare
- zoznam vysklonovanych slov ceskych a slovenskych
Treba poparit zoznamy slovenskych a ceskych slov. Pripustne su 2 riesenia.
Riesenie 1: Najdeme vela dvojjazycnych textov a podla nich poparime slova
Riesenie 2: Podla CS slovnika ktory mame k dispozicii najdeme odpovedajuce si zakladne
tvary slov. Podla nich najdeme vsetky vysklonovane vyrazy (slovenske aj ceske).
Podla koncoviek bude mozne urcit vzor slovenskeho aj ceskeho slova a slovicka
poparit. Podobne (ale jednoduchsie) sa prelozia aj predpony.
Urobil som symbolicky link ~/web, kde je ulozena stranka csfish.sf.net
Najst literaturu prelozenu do CZ aj SK (pan prstenov bol navrh)
Titulky
Pre vacsiu dostupnost su slovniky a dalsie data ulozene priamo v skole na http://kopernik.cc.fmph.uniba.sk/~potok/skola/csfish