Бенчмарков стало так много, что пора делать бенчмарк бенчмарков
🥴60
Инжектить слово «нурофен» в промпт, чтобы снизить температуру генерации модели
🥴154
Есть те, кто еще не использует tqdm, и те, кто его уже не использует
🥴32
Мало кто знает, но tqdm рисует количество сожранной им памяти
🥴23
Forwarded from Uropb
нативная поддержка круглого прогрессбара ткдм при использовании круглых тензоров
🥴49
При обучении LM, важен не размер батча, а число токенов в нем
🥴24
есть альфа, что пришли ревью с нипса, но наши подписчики туда не сабмитят же, да?
🥴18
Forwarded from Sergey Bratchikov
генеративная модель на круглых тензорах - постоянно скатывается в повторение постов
🥴55
Forwarded from Artur
Тюремная система рангов у агентов в rl
🥴56
стартап woozy face, создающий библиотеки для трансформеров на круглых тензорах
🥴36