Re: [Steak-developer] Re: steak
Brought to you by:
razilotfi
From: Joerg S. <jo...@al...> - 2002-09-11 23:15:25
|
Razi Lotfi-Tabrizi <raz...@we...> wrote: > Du hast wohl eine neue Version des Datensatzes, oder? Keine Ahnung. $ dpkg -l trans-de-en ||/ Name Version Beschreibung +++-=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D-=3D=3D=3D=3D=3D=3D=3D=3D=3D= =3D=3D=3D=3D=3D-=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D= =3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D ii trans-de-en 1.2-1 A German-English translation dictionary >> > Au=DFerdem habe ich das Gef=FChl (bin ich mir nicht sicher, denn ich= kenne >> > mich mit Perl nicht gut aus), da=DF die Such-Routine bei der Bash-Ve= rsion >> > schneller ist. Das liegt einfach daran, da=DF die Bash-Version "grep= " >> > verwendet. >> >> Ja und das wird auch nie anders. An Perl h=E4ngt noch so ein Schwanz d= ran, >> das kann nie so gut werden, wie ein hochoptimiertes grep. >=20 > Wei=DFt Du, ob agrep f=FCr Perl gibt? Was ist an agrep soviel anders als an grep? >> Ich w=FCrde sagen, mit Indizes kann man nicht arbeiten. Einmal, weil m= an >> auch Teilworte und Wortgruppen sucht und das andere Problem ist. was w= ill >> man als Index nehmen in einer Spalte, wo links 4 W=F6rter und rechts 4 >> W=F6rter stehen? Also ich sehe ehr einen positiven Punkt in einem Text= als >> Datenbasis. >=20 > Das sehe ich auch so. Aber in einer Index-Datei (siehe Glimpse) kann ma= n auch=20 > nach reg. Ausdr=FCcke suchen. Wie, wei=DF ich auch nicht! Aber ich kenn= e mich mit=20 > Glimpse auch nicht so gut aus. Ich kann es auch nicht sagen und DBen hatten wir noch nicht im Studium und ehrlich gesagt, wollte ich mich auch nicht damit besch=E4ftigen. Ist hier jemand bzw. kennst du jemand, der uns das sagen k=F6nnte, wie man sowas am D=FCmmsten macht? Aber das w=FCrde ich dann mit in die Version von unicode packen ;-) (s.u.= ) >> Der Unterschied bei mir ist ~1 Sekunde. Ich spekuliere mit folgendem, >> heutzutage sind die Rechner wesentlich schneller als mein K6-300. Von >> daher wird der Unterschied garnichtmehr auffallen. Auf Rechnern, die >> jedoch langsamer sind, w=FCrde ich einen steak-tiny vorschlagen, der e= ben >> alss Shellscript implementiert ist, aber nur die Funktionen bietet, di= e >> er kann. >=20 > Finde ich auch OK. Aber schau Dir mal zuert bitte Magic-Dic an. Gibt es ein Debian-Paket dazu? Wo ist das zu bekommen? (Bin gerade zu faul zum suchen :-)) >> >> > Wenn man beispielsweise nach "da=DF" oder "dass" sucht, erh=E4lt = man das >> >> > gleiche Ergebnis; oder wenn man nach "gro=DF" oder "gross" bzw. >> >> > "w=E4hrend" oder "waehrend" sucht. >=20 > Das hat damit zutun, da=DF viele Leute (z.B. bei den Email) sich eher a= n=20 > ASCII-7 halten und dadruch keine =DF oder Umlaute bei den deutschen Tex= ten=20 > verwenden. W=FCrde es dann nicht auch reichen, wenn man das als Option stellt? Sowas wie --expand-letters. >> Nein, ich sehe das als eine unerw=FCnschte Funktionalit=E4t an. Wenn i= ch nach >> dem Wort wei=DF (von wissen) suche, bekomme ich viele viele Ergebnisse= , die >> nicht dahin geh=F6ren.=20 > steak -d -nowait wei=DF > -------------------------------------------------- > Deutsch -> English > 1 ) wei=DF :=3D=3D knows > 2 ) wei=DF :=3D=3D whitely > [...] > Welche Ergebnisse geh=F6ren nicht darein? Keine. Ich bin von Teilwortsuche ausgegangen und da habe ich dann weissagen, Weissager,... >> > Die Frage, die ich mir aber stelle ist, welche Vorteile (abgesehen v= on >> > eine bequeme und agbeschlossen abgerundete Werkzeugmenge) bietet Per= l, >> > die Shell-Skript nicht bietet? >> >=20 >> In der Shell gibt ees zwar Arrays, aber die sind nicht gerade das gelb= e >> vom Ei. Wie k=F6nnte man es also anstellen, dass man aus eine >> Konfigurationsdatei die W=F6rterb=FCcher ausliest. >> add_dict("/usr/share/trans/de-en", "de", "en") >> add_dict("/usr/share/trans/fr-de", "fr", "de") >> add_dict("~/.en-de", "en", "de") >=20 > Vielleicht kann uns dazu Jens mehr sagen. Wer ist Jens? > Ja, das wei=DF ich auch! Leider. Es kann aber sein, da=DF agrep UNICODE= =20 > unterst=FCtzt. Auf den ersten Blick w=FCrde ich bei der dpkg-Beschreibung =BBnein=AB sag= en. >> Wie soll das gehen? Hast du schonmal ein funktionierendes unicode Syst= em >> gesehen? Ich wollte letztends die Console auf unicode umstellen, aber >> welche Shell unterst=FCtzt das? :-(( >=20 > Bei DICT (kombiniert mit Mozilla 7.0 als Client) habe ich es ausprobier= t. Es=20 > funktioniert. Aber auf der Konsole habe ich es auch nicht geschafft. > Aber meine System ist ein wenig veraltert. > Irgendwann will ich SuSE-8.1 installieren. Mal sehen, ob ich es danach = doch=20 > schaffe. Viel Gl=FCck! >> Kannst du mir mal bitte, interessenhalber, erkl=E4ren, wozu >> auto{make,config} gut sind? Was machen diese lustigen Programme? >=20 > Es ist bei der Installation der Unix-Software ist es fast ein Standard,= =20 > configure und make zu verwenden. Es w=E4re nicht schlecht, wenn das Ste= ak sich=20 > auch daran halten k=F6nnte. Ist aber auch nicht so wichtig! make w=FCrde ich so und so nehmen. Ich k=F6nnte mir ein Leben ohne make garnicht vorstellen :-) >> Ich kann dieses Programm nicht mitnehmen. Denn wenn ich es mit aufnehm= e, >> muss ich in die Dependencies xlib schreiben und das ist wieder ein rie= sen >> Klotz. Das Problem ist, dass das Paket nicht vollkommen funktionst=FCc= htig >> ist ohne xlibs. Ohne printbuffer, habe ich die M=F6glichkeit zu testen= (-x) >> ob xcb ausf=FChrbar ist und damit wei=DF ich, dass es geht. Bringe ich= aber >> selbst printbuffer mit, dann ist es immer installiert, muss aber nicht >> funktionieren, falls keine xlibs da sind. Die einzigste Chance, die ic= h >> sehe, printbuffer arbeitet mit dlopen und pr=FCft, ob xlibs da sind, w= enn >> ja l=E4dt es diese, wenn nein endet es in einem definierten Zustand (w= as >> bei den dyn. linken nicht m=F6glicht ist) >=20 > Das k=F6nnte man doch in der Configure-Routine herausfinden, ob xlib=20 > installiert ist oder nicht. Nein, das geht nicht. Die Pakete enthalten ja alle kompilierte Programme und ich muss das Paket schon vollst=E4ndig machen, damit es bei dem geht, der alles will und alles hat. Und den kann ich aber zur Laufzeit nicht von dem Unterscheiden, der alles will, aber nicht alles hat. >> > 10) Den Datensatz vielleicht vollkommen von dem Programm trennen und >> > bei einem anderen separaten CVS-Server integrieren! >> >> %-) Wie jetzt, das verstehe ich nicht ganz. >=20 > Siehe freedict.de Mach ich. >> > 11) Das Programm "Steak/Datensatz/datenbankaktualisieren.sh" >> > modifizieren, so da=DF es auch automatisch den aktuellen Datensatz v= on >> > einer CVS-Server holen kann. >> >> W=FCrde ich nicht f=FCr Debian nutzen, da es unter Debian ein Paket >> trans-de-en gibt, dass mir immer die aktuelle Version der o.g. Datenba= nk >> bietet. Was will man mehr? >=20 > Was ist das f=FCr ein Programm? Gibt es auch allgemein f=FCr Linux? Das ist kein Programm sondern ein Paket, wie rpm unter SuSE. Wenn es eine neue DB gibt, macht der Maintainer ein neues Paket und ich erhalte beim n=E4chsten Update eine neue Datei /usr/.../de-en. Die ist genau das, was von Frank Richter unter http://dict.tu-chemnitz.de/ bereitgestellt wird. Ich w=FCrde so und so sagen, dass steak keine W=F6rterbuchdatei mit liefe= rt und halt nur Links auf die freedict.de und dict.tu-c... vorschl=E4gt. Man muss halt nur zusehen, dass steak mit allen B=FCchern arbeiten kann. > Warum Abh=E4ngigkeiten? > Ja, warum nicht! Mann nicht beispielsweise Teile von grep! Naja, das ginge auch, einfach Code aus grep kopieren. Was ich aber meinte war, eine Bibliothek von jemand anders zu verwenden. Zum Beispiel "librx1g - GNU Posix Basic Regular Expression language library." Steak ist dann gegen diese Lib gelinkt. > Das hei=DF aber nicht, da=DF man dann Unicode nie mehr verwendet! Oder = glaubst=20 > Du, da=DF wenn Unicode sich durchsetzt, ASCII keine Verwendung finden=20 > wird?=20 Keine Ahnung, ich glaube nichtmal, dass der 32-Bit-Code kommt. Ich w=FCrd= e mich aber im Moment noch nicht um unicode sorgen. Erst wenn das Programm steht und wiedermal jemand Langeweile hat. |