|
From: Jozef P. <pe...@ne...> - 2003-03-29 20:55:29
|
Tu je uz 1. balicek Bilingualnych textov ( z Tituliek ) : = www.perwy.sk/csfish/bilingual.zip ( zip 613KB , rozbalene 1.4 MB ) .. ide o textove subory v ktorych su parovane vety ( formatom na prvy = pohlad jasnym , aspon dufam :O)) ). Dalsi, kto bude tieto pary analyzovat, by mohol pritom pouzivat uz = existujuce slovniky so vsetkymi slovnymi tvarmi kazdeho slova a pomocou = nich zistit zakladny tvar kazdeho slova vo vete SK aj CZ. Na tieto pomocne vety v zakladnych tvaroch sa da pouzit este jeden = slovnik, ktory mapuje zakladne tvary SK na zakladne tvary CZ na to, aby = bolo odhalene ze vo vetach je pouzite to iste slovo a len vtedy = match-ovat prislusne slova. Pomocou slovnika zakladnych tvarov sa da aj zistit zmena slovosledu vo = vete, respektive pouzit iny princip ako porovnavat striktne 1.slovo s = 1., 2. s 2. , 3. s 3. , ... . P.S.: V suboruch su odfiltrovane (nahradene medzerami) niektore znaky ako : , = . ! ; * ' " | a mozno este dalsie :) Vyskyty podretazcov {nejaky text} boli odstranene. Aj po sebe iduce medzery a medzery na oboch koncoh viet boli tiez = odstranene. Jozo |