пятница, марта 07, 2008

Многоязычная самообучающаяся система автоматизированного перевода

Буквально сегодня мне понадобилось перевести несколько небольших текстов с украинского языка на русский. Оказывается, ситуация с переводчиками текстов в Linux такая же, как и с системами распознавания - выбора, по большому счету, на данный момент нет никакого. Единственный более-менее вменяемый вариант (которым я и воспользовался) - это "Переводчица" - многоязычная самообучающаяся система автоматизированного перевода. На сайте проекта доступны два вида перевода - перевод текста и перевод файла. В обоих случаях размер переводимого фрагмента/текста ограничен 100 Кб. По сравнению с другими online-переводчиками, где ограничение составляет 500-1000 символов, 100 Кб - очень даже неплохо. Поддерживаемые типы файлов: rtf, xml, html, а также все форматы OpenOffice.org. Поддерживаемые языки для перевода (имеющиеся в наличии): русский, украинский, английский. Но словари можно сделать для любого языка.

Систему можно также установить на локальный компьютер. Со страницы загрузки доступны исходные тексты программы и словарей, а также собранные пакеты для ALT Linux, ASP Linux (Fedora Core), Gentoo Linux и MS Windows. Для Ubuntu/Debian пакетов к сожалению нет.

Следует отметить, что для программы имеется графический интерфейс на wxWidgets.

Перед установкой переводчика необходимо установить несколько пакетов:
$ sudo apt-get install libarchive-zip-perl libconfig-general-perl libhtml-simpleparse-perl libtext-csv-perl
$ sudo apt-get install ncftp
и модули Perl, которых в репозитории нет:
$ sudo cpan RTF::Tokenizer
$ sudo cpan Wx
Затем скачиваем пакет Lingua-Pere-0.2.0.tar.gz, распаковываем, собираем и устанавливаем его:
$ tar xvfz Lingua-Pere-0.2.0.tar.gz
$ cd Lingua-Pere-0.2.0
$ perl Makefile.PL
$ make
$ sudo make install
То же самое проделываем с пакетом wxpere-0.2.0.tar.gz:
$ tar xvfz wxpere-0.2.0.tar.gz
$ cd wxpere-0.2.0
$ perl Makefile.PL
$ make
$ sudo make install
Теперь очередь словарей. Словари берем из http://pere.org.ua/dwn/src/dic/ (dmp или src; пакеты src меньше в 3 раза, но их сборка займёт больше времени; у меня русско-украинский словарь собирался из исходников 3,5 часа; за это время я успел скачать архивы с дампами и восстановить словари из них). Для каждого словаря после распаковки выполняем команду вида:
$ ./install.sh ~/dic/en-us_ru-ru_dzer-tyzh en-us_ru-ru_dzer-tyzh.dmp
На этом установка окончена. Теперь можно запустить wxpere:



Если переводить тексты необходимо время от времени, то нет смысла устанавливать "Переводчицу" - намного проще воспользоваться online-переводом.

четверг, марта 06, 2008

Анонсирован Nero Linux 3.5

Компания Nero анонсировала новую версию своего пакета программ для работы с мультимедиа Nero для Linux. Среди заявленных нововведений можно отметить новый клиент для работы из командной строки. Благодаря ему можно работать с движком Nero, используя скрипты и приложения, созданные независимыми разработчиками. В Nero Linux 3.5 также реализована поддержка субноутбуков с небольшим разрешением (800x480 пикселов).

Начиная с третьей версии, Nero Linux поддерживает запись Blu-ray и HD DVD. Другая особенность Nero Linux 3 – поддержка 64-битной архитектуры. Программа также имеет встроенный кодировщик и декодировщик, поддерживающий форматы Ogg, Flac, Wav, и MP3.

Пакет Nero Linux доступен в виде коробочной версии, а также есть версия для скачивания. Программы доступны на многих языках и совместимы с большим числом дистрибутивов, в том числе Red Hat Enterprise Linux 4, SuSE Linux 10.0, Fedora 4, Debian GNU/Linux 3.1 и Ubuntu 5.10. Выход Nero Linux 3.5 ожидается до конца месяца.

Источник