Дикая вода моего сердца. Переводим стихотворение на праиндоевропейский с помощью нейросетей

Дикая вода моего сердца. Переводим стихотворение на праиндоевропейский с помощью нейросетей

Ранее я публиковал переводы своих стихотворений на праиндоевропейский язык с помощью пользовательского чат-бота Déiwos-Lókwos GPT, основанного на ChatGPT. Его создал один из участников Reddit, но точные технические детали и личность автора мне неизвестны. Это придаёт работе с ботом оттенок онлайн-диггерства.

В первой заметке я провёл пробный перевод и отметил характерные ошибки — например, игнорирование социокультурного контекста. Во второй — разобрал более серьёзные проблемы: «ложную агглютинацию» и галлюцинации. Теперь пришло время сравнить этот бот с другими нейросетями: Perplexity, Google Gemini и Consensus. Для этого я перевёл третье своё стихотворение.

Ты, я и Дождь
На улице давно стемнело,
Я жду, а ты меня не ждешь.
У дома твоего бессменный
Мой серый собеседник Дождь.
Он, Дождь, меня не мочит, к счастью,
Загнав под старый шумный клён.
Вдруг чует родственную душу?
Возможно, он, как я, влюблён...
Бьёт по карнизам и фасадам
Оркестр капелек дождя,
Играет с грустью серенаду,
В ночи по лужам шелестя.
Он нежной дождевой пастелью
Размыл все в городе огни,
Асфальт раскрасил акварелью,
Так повествуя о любви...
Надрывно плача в водостоке,
Он с рёвом рвётся в сточный люк.
Чем мучится он так жестоко?
Как я, страдает от разлук?
И я скучаю и тоскую -
Ведь жду как будто целый век...
Готов я выразиться так же -
Но я не дождь, а человек...
В десятый раз я жму на кнопки -
Но домофон опять молчит.
Лишь шепчет Дождь в весенних листьях,
А свет в твоём окне горит.
Дождь, не стихая, с прежней силой
Из тёмной выси льёт и льёт
И не уходит, будто тоже
Кого-то он упорно ждёт.
Жасмина и сирени запах
Разнёс с собой романтик-Дождь...
В такт стуку капель бьётся сердце -
Ведь ты из тьмы ко мне идёшь!
Подходишь, мокрая до нитки,
И говоришь: "Пойдём ко мне!
Забыла я, за хлебом выйдя,
Свет погасить в своём окне"....
Сидим мы у тебя на кухне,
С тобой уютно и тепло,
Вот и бродяга-Дождь, проказник,
О наше греется окно.
И кто же уведёт тот Дождик
С промокших улиц за собой?
И кто заставит улыбнуться
Широкой радугой-дугой?
Но это всё случится ночью,
Оставшись неизвестным мне:
Сейчас ведь мы заснём в обнимку
И не погасим свет в окне.
Ты спишь уже, я засыпаю,
Но задаюсь вопросом всё ж:
Кого же любит в этом мире
Наш серый собеседник Дождь?

Часть 1: нейросети снова галлюцинируют

Начну с плохой новости: Consensus, ориентированный на научные тексты, отказался переводить стихотворение. Perplexity справился, но с массой галлюцинаций. Приведу лишь фрагменты его перевода для сравнения.

Nókʷts h₁ésti; dʰwérsu stéh₂mi.
Túh₂ mé ne spéḱesi.
Pr̥h₂i tóweyo dómosmóy wódr̥ h₁éǵros wéḱweti.
Ночь наступила; я стою у дверей.
Ты не ищешь меня.
Перед твоим домом дикая вода (дождь) разговаривает со мной.

Sá wódr̥ mé ne pléweti, h₁léudhro k̑léu̯nóm h₁órnom ud nódh₁e.
H₁ésmi sélbhā dusmós? Wódr̥ api mé h₁léubh̥eti.
Дождь не мочит меня, заставляя укрыться под старым шумным клёном.
Может быть, он чувствует родственную душу?
Возможно, дождь любит так же, как и я.
...

Самые яркие галлюцинации — транслитерации современных слов: serénadom, h₂ésminos, wéndʰnom (от window). У Perplexity таких ошибок ещё больше:

  • orkʰestros
  • sḗrinádhom
  • péstelā
  • ákweléh₂
  • ásh̥ltom
  • knóphḱeh₂
  • domofónos
  • yásminéh₂
  • sirénéh₂
  • wétus-dó-nítḱeh₂
  • r̥dh̥wéh₂dúǵʷʰéh₂

Однако Perplexity в целом сделал в 5 раз меньше ошибок. Он избегает прямых кальок: «домофон» заменён на «звонок в дом», что звучит аутентично. «Акварель» передаётся как «водяные краски» — корректно, ведь слово для «краски» в праиндоевропейском есть.

Такие переводы требуют допущения: язык дожил до наших дней и усвоил современные реалии. Но замена «серенады» на sḗrinádhom — не интерпретация, а артефакт генерации.

Ещё одна типичная ошибка — искажение корней из-за токенизации. Например, глаголы «бить» (*bʰei-) и «быть» (*bʰew-) передаются почти одинаково:

H₁ḗrtor mé bʰeweti
"Сердце моё бьётся"

Tód nókʷti bhéweti
"То ночью будет"

Нейросети, использующие byte-pair encoding, выделяют общую часть bʰew как токен, а последний символ теряется. Это приводит к путанице.

Лучше всех справился Gemini. Он не стал переводить дословно, а создал стилизованное изложение на праиндоевропейской лексике:

Nókʷts gʷémt, h₁éǵoh₂ stéh₂mi,
Túh₂ né gʷémsi, ǵʰéh₂imi túm.
Dṓm-pótis n̥ebʰos-yós mē-met-i,
Wédōr n̥ebʰos-yóm, mōlyéti mē.
Ночь пришла, я стою,
Ты не приходишь, я жду тебя.
Хозяин дома (дождь) облачный со мной говорит,
Вода облачная страдает со мной.
...

В этом переводе почти нет галлюцинаций. Современное слово «окно» заменено на h₃ókʷi — «глаз», что типологически обосновано: от праиндоевропейского h₃ékʷs происходят и «окно», и «window».

Однако и у Gemini есть ошибка: nebʰos-yós вместо nebʰ-yós. Нейросеть прикрепляет суффикс прилагательного не к корню, а к уже склонённому существительному — как будто nebʰos + -yós. Это бессмысленно с точки зрения морфологии, но статистически вероятно. Та же ошибка, что и у других моделей: нейросети не видят границ морфем.

Часть 2: почему нейросети не могут сказать «дождь»

Все три нейросети избегают прямого слова для «дождя». Déiwos-Lókwos GPT использует wódr̥ h₁éǵros — «дикая вода». Gemini — wédōr n̥ebʰ-yóm — «облачная вода». Perplexity вообще заменил «дождь» на «снег» (snigʷʰs).

Дело в том, что общеиндоевропейского слова для дождя не существует. В разных ветвях языка оно имеет разную этимологию. Это означает: либо слово было, но исчезло повсеместно, либо его никогда не было.

Второй вариант более вероятен. Дождь, вероятно, не воспринимался праиндоевропейцами как отдельный концепт. Для описания осадков хватало глаголов вроде pléweti («льёт») или mergʰeti («моросит»). Слово для дождя как объекта не требовалось.

Это похоже на ситуацию с эскимосами: в праэскимосско-алеутском языке три слова для снега — *qaniɣ, *aniɣu, *apun. А в праиндоевропейском — только одно для снега: snigʷʰs. Языковая лексика отражает среду и образ жизни.

Если ты степной кочевник, тебе не нужно много слов для снега. Если ты не земледелец — тебе не важно количество осадков. Тебе не нужен «дождь» как отдельный объект. Тебе не нужен дождь — и слова для него тоже.

Это подтверждает и мифология: у праиндоевропейцев нет бога грома и молнии. Верховный бог *Dyḗus ph₂tḗr — бог ясного неба. Громовержцами становятся его «потомки» — Зевс и Юпитер. Славяне и германцы приходят к этой идее позже, уже при земледельческом укладе.

То есть 5000 лет назад дождь не был значимым явлением. А значит, персонифицировать его в стихотворении было бы невозможно. Замена на «дикую воду» — лишь паллиатив. Смысл теряется.

В предыдущем переводе я сталкивался с «поездом». Пришлось использовать неоиндоевропеизм douknom — от корня *deuk- («вести»). Это логично: технику объяснить проще. А вот идею «влюблённого дождя» — нет.

Заключение: язык как мост через время

Нейросети позволяют за пару кликов увидеть, как изменился мир за 5000 лет. Они показывают, насколько чужд нам был язык праиндоевропейцев — и в то же время как он знаком: в нём угадываются русский, греческий, латынь.

Это язык из другого мира. Он помогает увидеть историю человечества яснее, чем многие учебники. Когда в Египте строили пирамиды, в Европе ещё не было слова для дождя — и не было нужды в нём.

Изучайте праиндоевропейский. И пусть слова для любви находятся всегда — даже если не нашлось слова для дождя.

Читать оригинал