06 июля 2008

Итак тесты реврайтинга

Итак я подумал, стенография - сосет и без того ясно что ошибок будет
столько сколько волос на голове 8)).
А я - крупноволосатый.
Остается лишь использовать другие сто миллионов способов реврайтить.

Итак подем тестить переводчики.
Как какой-то итог хочется сказать что нормализация с первого захода
маловероятна, т.к.
1. Неверно переводятся слова (PROMT как-то кажется более верно делает
перевод, Google похуже)

Рассмотрим следующую фразу:
o:It checks for the contents of window.name while your page is being loaded.
p:Это проверяет для содержания window.name, в то время как ваша страница загружается.
g:Он проверяет содержимое window.name вашей странице в то время как в настоящее время загружены.

Второй взгляд:
Первую часть предложения Google перевел отлично до запятой, только
окончание на одну букву неверно. Вторую часть предложения хорошо
перевел PROMT, почти идеально, если объединить части, получается:

Он проверяет содержимое window.name вашей странице, в то время как ваша страница загружается.
Можно выкинуть ВАШЕЙ СТРАНИЦЕ
Очень забавно, Посмотрим на другой пример:

o:There is a bold goal at the beginning of the document (why is the doc a PDF/.doc and not just HTML!!!):
p:Есть смелая цель в начале документа (почему - доктор PDF/.doc и не только HTML!!!):
g:Существует смелые цели в начале документа (почему документ PDF / .doc, а не только HTML !!!):

PROMT - сильно наврал. Вообще по двум примерам видно, что PROMT -
ужасно переводит как справочник, по одному слову. doc заменил на
доктора. А вообще мысль предложения привязана к предидущему контексту,
поэтому необходимо по смыслу опираться на предидущие слова.
Это говорит о том что читающий такой перевод возможно очень быстро
устанет и покинет страницу. А этого допускать нельзя.

Однозначно сказать о том что переводчики можно использовать для
перевода для человека - нельзя. перевести можно, но необходимо затем
нормализовать под конкретный контекст.
нормализовать без нейронной сети - невозможно.
Нейронная сеть - эмулятор мозга.
Вообщем это идея даже близко не проглядывается в Гугле.
Писать НС пока не собираюсь
Текст без нормализации почти не читаем.
Нужны другие кординальные меры. Иду искать.
О вопросах морали мы не говорим.


Видеочат рулетка