Почему Cluely и другие плохо слышат русских айтишников

Почему Cluely и другие плохо слышат русских айтишников

В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть, как они справляются с русским айти-собесами, раз уж все три заявляют о поддержке русского.

Как устроена речевая часть в ассистентах для собеседований

Архитектурно у всех продуктов в нише одно и то же: перехват аудио, speech-to-text в реальном времени, LLM и вывод на экран.

Почему Whisper ломается именно на айти-речи

Whisper large-v3 обучали на миллионе часов слабо размеченных данных, но русскоязычных IT-контентов там почти нет.

Что конкретно сделали в JobPath

Наш STT — это fine-tune Whisper large-v3 на внутреннем корпусе русскоязычных IT-собеседований.

Почему зарубежные конкуренты это не делают

У них огромные англоязычные рынки, и инвестировать в fine-tune под русский IT-жаргон нецелесообразно.

Читать оригинал