Lingvoilo kaj Tatoeba

Jan 30, 2011 09:31

Mi daŭre plibonigas la liberan gramatikan kontrolilon Lingvoilo, ne nur en Esperanto, sed ankaŭ en la franca. Lingvoilo-1.2 ankoraŭ tro ofte atentigis pri neveraj eraroj. Iuj el la falsaj atentigoj facile korekteblas, sed aliaj atentigoj ne tiom facile korekteblas. Por testi la Esperantan version de Lingvoilo, mi uzas: Mi malkovris, ke eblas elŝuti la tutan frazaron de la projekto Tatoeba. Utilas ne nur por testi Lingvoilon, sed ankaŭ por korekti la frazojn ĉe Tatoeba pere de Lingvoilo. Jen kiel elŝuti kaj filtri frazojn por konservi nur la Esperantajn frazojn (tiujn kun la lingvokodo ISO 639-3 epo):
$ wget http://tatoeba.org/files/downloads/sentences.csv $ perl -F'\t' -ane 'print "@F[2 .. $#F]" if ($F[1] eq "epo")' sentences.csv > sentences-epo.csv Tiu frazaro enhavas pli ol 70.000 Esperantajn frazojn. Esperanto estas fakte la 3-a lingvo ĉe Tatoeba. Estas sufiĉe bona atingo por lingvo iom malpli parolata ol la angla.

esperanto, lingvoilo

Previous post Next post
Up