Все Ars Technica AI Habr AI MIT Tech Review AI TechCrunch AI The Verge AI Two Minute Papers VentureBeat AI Yannic Kilcher
О биологии большой языковой модели (часть 2)

О биологии большой языковой модели (часть 2)

Во второй части цикла — подробный разбор публикации от команды Transformer Circuit из компании Anthropic, посвящённой внутренней «биологии» языковых моделей. Исследование внутренних механизмов...

Yannic Kilcher
О биологии большой языковой модели (часть 1)

О биологии большой языковой модели (часть 1)

Вниманию читателей предлагается подробный разбор публикации из блога Transformer Circuits, подготовленной командой компании Anthropic. Исследование посвящено внутренней «анатомии» модели Клод...

Yannic Kilcher
DeepSeekMath: расширяя границы математических рассуждений в моделях открытого языка

DeepSeekMath: расширяя границы математических рассуждений в моделях открытого языка

#deepseek #llm #grpo GRPO — одно из основных усовершенствований, используемых в Deepseek-R1, но оно было представлено еще в прошлом году в этой статье, в которой используется комбинация новых...

Yannic Kilcher
Прямая трансляция традиционного праздника

Прямая трансляция традиционного праздника

https://ykilcher.com/discord Ссылки: Завершение кода TabNine (направление): http://bit.ly/tabnine-yannick Ютуб: https://www.youtube.com/c/yannickilcher Твиттер: https://twitter.com/ykilcher...

Yannic Kilcher