Пару недель назад я делал пост о том, что не всегда оптимально использовать сложные пайплайны для работы с нейросетями
Недавно была задача взять одну систему за основу и усовершенствовать её – кое-что выпилить, кое-что допилить, что-то оставить
Был выбор:
1. Использовать сложный пайплайн (публичный вариант) с трехчасовым планированием, 20+ часами исполнением плана, декомпозицией задач в YouTrack и ветками в системе контроля версий. Жесть, в общем
2. Использовать обычный чатик с ручными итерациями "перепиши и проверь"
3. Взять что-то между п.1 и п.2: адаптивный полуавтономный пайплайн под среднебытовую задачу с приоритизацией общения в чатике
По сложному названию и ссылке на гит можно догадаться, что я выбрал третий вариант. Мои два промпта кодексу звучали так:
1. "$bx-dev"
2. "/goal возьми из репы Х все python исходники. Перепиши весь проект на go в более сопровождаемый вид. В каждой итерации используй нужные скиллы из skill-library. Следуй протоколу $bx-dev. Критерий завершения – система полностью перенесена на go и проверена на отсутствие потерь бизнес-логики при миграции"
Отличный промпт? Да! Сейчас разберём
Написав $bx-dev, мы задали рабочий контур: исследование перед изменениями, реализация, проверки, ревью и DDD классификация там, где она действительно нужна
А написав "/goal ..." – мы зафиксировали задачу, критерий завершения и требования к процессу. Агенту сложнее закончить раньше времени: при попытке остановиться его возвращает к цели, проверкам и требованиям из $bx-dev и напоминанию использовать skill-library (буст +16 п.п. к эффективности)
Получается, что у нейронки нет нормального выхода из цикла, пока она не сверится с критерием завершения: полностью перенести систему и не потерять бизнес-логику. При каждой попытке останова её пинают и говорят следовать промпту из /goal, который отлично напоминает про задачу и требования к её исполнению
Отправили всё в кодекс и ушли заниматься своими делами, – спустя 8 часов имеем ваншотом полностью перенесенный проект на другой яп. Запустили, проверили – есть пара мелких недочетов, но фиксятся они за 5-10 минут
Суть в том, что $bx-dev сам по себе вполне автономен и хорошо справляется с большинством задач. А в связке с /goal мы это дополнительно усилили, исключив потерю контекста с течением времени
Теперь самое интересное... Я решил в паблик выложить свой bx-dev skill и встроенную skill-library с механизмом ленивой загрузки 105 скиллов, которые использую в повседневных задачах
В репе описал, как устроен скилл и как с ним работать в разных сценариях
Скилл самодостаточен и готов к работе из коробки, нужны лишь утилиты gh (для git репы проекта) и jq (для записи состояний)
☁️ Исходный код: GitHub
Недавно была задача взять одну систему за основу и усовершенствовать её – кое-что выпилить, кое-что допилить, что-то оставить
Был выбор:
1. Использовать сложный пайплайн (публичный вариант) с трехчасовым планированием, 20+ часами исполнением плана, декомпозицией задач в YouTrack и ветками в системе контроля версий. Жесть, в общем
2. Использовать обычный чатик с ручными итерациями "перепиши и проверь"
3. Взять что-то между п.1 и п.2: адаптивный полуавтономный пайплайн под среднебытовую задачу с приоритизацией общения в чатике
По сложному названию и ссылке на гит можно догадаться, что я выбрал третий вариант. Мои два промпта кодексу звучали так:
1. "$bx-dev"
2. "/goal возьми из репы Х все python исходники. Перепиши весь проект на go в более сопровождаемый вид. В каждой итерации используй нужные скиллы из skill-library. Следуй протоколу $bx-dev. Критерий завершения – система полностью перенесена на go и проверена на отсутствие потерь бизнес-логики при миграции"
Отличный промпт? Да! Сейчас разберём
Написав $bx-dev, мы задали рабочий контур: исследование перед изменениями, реализация, проверки, ревью и DDD классификация там, где она действительно нужна
А написав "/goal ..." – мы зафиксировали задачу, критерий завершения и требования к процессу. Агенту сложнее закончить раньше времени: при попытке остановиться его возвращает к цели, проверкам и требованиям из $bx-dev и напоминанию использовать skill-library (буст +16 п.п. к эффективности)
Получается, что у нейронки нет нормального выхода из цикла, пока она не сверится с критерием завершения: полностью перенести систему и не потерять бизнес-логику. При каждой попытке останова её пинают и говорят следовать промпту из /goal, который отлично напоминает про задачу и требования к её исполнению
Отправили всё в кодекс и ушли заниматься своими делами, – спустя 8 часов имеем ваншотом полностью перенесенный проект на другой яп. Запустили, проверили – есть пара мелких недочетов, но фиксятся они за 5-10 минут
Суть в том, что $bx-dev сам по себе вполне автономен и хорошо справляется с большинством задач. А в связке с /goal мы это дополнительно усилили, исключив потерю контекста с течением времени
Теперь самое интересное... Я решил в паблик выложить свой bx-dev skill и встроенную skill-library с механизмом ленивой загрузки 105 скиллов, которые использую в повседневных задачах
В репе описал, как устроен скилл и как с ним работать в разных сценариях
Скилл самодостаточен и готов к работе из коробки, нужны лишь утилиты gh (для git репы проекта) и jq (для записи состояний)
Please open Telegram to view this post
VIEW IN TELEGRAM
Аппрувнули заявку на четырехдневную трипу в Шерегеш. Даже отпуск взял на недельку ради такого события. Поедем с Мотей (он справа на фото, проходил стажку в Яндексе) жарить маршмелоу и баб сосиски на костре, по 3 штуки на каждого
Вообще суть мп — 300 человек хакатонят бота для мессенджера MAX, но со 2-го июня у меня овердрафт на сабку кодекса. Если овердрафт кончится прям перед поездкой — придетсяписать вручную только отдыхать (наконец-то) и повышать соц капитал
P.s — на фото те самые бабы, по 3 штуки на каждого, в правом нижнем углу
Вообще суть мп — 300 человек хакатонят бота для мессенджера MAX, но со 2-го июня у меня овердрафт на сабку кодекса. Если овердрафт кончится прям перед поездкой — придется
У кодекса есть интересная механика овердрафта, которая действует на любые виды подписок
Раньше брал сабку за $20 – пользовался месяц, не отвязывая карту с нулевым балансом, и потом в течение 1-4 недель вылазила табличка "оплатите пожалуйста, доступ скоро кончится", при этом доступ оставался на весь период овердрафта
Когда пересаживался на кодекс, вообще забыл об этом. И вот происходит то же самое, но на сабке $200. Квазислучайно овердрафчу уже ~2 недели
Когда опенаи поймёт, что продлевать вы не собираетесь, – подписку отзовутв самый неподходящий момент, но платить не заставят
Затем заново как обычно оформляем подписку – получается, платим $200 раз в 1.5-2 месяца?
Честно, я не абузер и готов послушно платить $200 раз в месяц (а на клоде было аж $400/месяц и без овердрафтов). Но когда дают месяц бесплатного доступа к фронтирным моделям просто так, без каких-либо действий с моей стороны, грех не воспользоваться. С барского плеча, так сказать
Раньше брал сабку за $20 – пользовался месяц, не отвязывая карту с нулевым балансом, и потом в течение 1-4 недель вылазила табличка "оплатите пожалуйста, доступ скоро кончится", при этом доступ оставался на весь период овердрафта
Когда пересаживался на кодекс, вообще забыл об этом. И вот происходит то же самое, но на сабке $200. Квазислучайно овердрафчу уже ~2 недели
Когда опенаи поймёт, что продлевать вы не собираетесь, – подписку отзовут
Затем заново как обычно оформляем подписку – получается, платим $200 раз в 1.5-2 месяца?
Честно, я не абузер и готов послушно платить $200 раз в месяц (а на клоде было аж $400/месяц и без овердрафтов). Но когда дают месяц бесплатного доступа к фронтирным моделям просто так, без каких-либо действий с моей стороны, грех не воспользоваться. С барского плеча, так сказать
Окончил 3й курс – наконец-то появилось время для петиков
Вообще, уже пора собраться с мыслями, перестать прокрастинировать во второстепенных проектах, выпустить[до конца июня] свою доработанную версию gbrain (капля в море). Отдохнуть в отпуске и двигаться дальше
А пока что допилил телеграмм-асистента: теперь доступна не только умная транскрибация голосовых, но и:
1. Выгрузка текстовых сообщений по чатам
2. Автолайк новых и старых постов в тг каналах с очень тонкой настройкой. Это моя самая любимая фича
В будущем добавлю возможность автопересылки постов (текст+медиа, старые+реалтайм) из групп и тгк, даже с отключенной пересылкой в них, например, в топик своей группы. Ну и до кучи будет еще экспорт по таким чатам с медиа-выгрузкой, почему бы нет
За подобные грабберы тг-постов люди раньше (да и сейчас) платили ох сколько денег, сейчас это делается буквально за один хороший промпт
А зачем это нужно? Мне комфортнее иметь эти функции в быстром доступе, чем их не иметь. Например, быстрый экспорт личных/публичных чатов для оцифровки личности или смотреть на эмоции людей от фидбека реакциями под их постами в личных тгк
😨 Обнова уже в гите: тык
Вообще, уже пора собраться с мыслями, перестать прокрастинировать во второстепенных проектах, выпустить
А пока что допилил телеграмм-асистента: теперь доступна не только умная транскрибация голосовых, но и:
1. Выгрузка текстовых сообщений по чатам
2. Автолайк новых и старых постов в тг каналах с очень тонкой настройкой. Это моя самая любимая фича
В будущем добавлю возможность автопересылки постов (текст+медиа, старые+реалтайм) из групп и тгк, даже с отключенной пересылкой в них, например, в топик своей группы. Ну и до кучи будет еще экспорт по таким чатам с медиа-выгрузкой, почему бы нет
За подобные грабберы тг-постов люди раньше (да и сейчас) платили ох сколько денег, сейчас это делается буквально за один хороший промпт
А зачем это нужно? Мне комфортнее иметь эти функции в быстром доступе, чем их не иметь. Например, быстрый экспорт личных/публичных чатов для оцифровки личности или смотреть на эмоции людей от фидбека реакциями под их постами в личных тгк
Please open Telegram to view this post
VIEW IN TELEGRAM
Хочу выучить тóкипóну и написать на ней пару постов
Самый добрый язык на свете. Всего 120 слов. На него даже майнкрафт переведён, казалось бы🥴
💫 toki li pona. mi lukin e ijo suli
Самый добрый язык на свете. Всего 120 слов. На него даже майнкрафт переведён, казалось бы
Речь простая. Я смотрю на важное
Please open Telegram to view this post
VIEW IN TELEGRAM
Как не потерять продуктивность?
Одна из лучших покупок для дома – анализатор воздуха. Очень важны температура и концентрация CO2 в воздухе
Моя рабочая атмосфера, в которой КПД мозга максимален: 22.5°C (при 45-50% RH) и 550 ppm CO2. Моё плато размышлений, так сказать
Помню, как в 11-м классе, в 2023-м году, решал задачки по химии при подготовке к ЕГЭ, это было 33-е задание. Апрель, на улице +2. Я открыл окно настежь и просидел так весь день. Это был один из самых продуктивных дней. Я сделал невероятно много, но потом заболел
При низкой температуре есть бафф к продуктивности, но есть и дебафф – организм быстрее истощается. При высокой температуре плюсов нет... мозг сильнее троттлит, а организм тратит много сил на охлаждение
При высокой концентрации CO2 появляется сонливость и затуманенность сознания. Мы чаще входим в режим, который я называю псевдопотоком. Кажется, вот ещё чуть-чуть, и всё закончишь. Но проходит час, два, время улетает мигом. Потом отходишь на полчаса подышать воздухом, возвращаешься и видишь, какую несуразицу делал всё это время. После этого за гораздо меньший промежуток времени делаешь больше и качественнее
Самое ужасное сочетание – CO2 выше 850 ppm и температура выше 26°C. Это точка, после которой мозг начинает реально тупить, и осознать это можно только с опытом. Кажется, что всё как обычно и ты контролируешь ситуацию, но процесс снижения КПД размышлений уже запущен. С этого момента каждое повышение ppm или температуры только ухудшает ситуацию
Своего плато по размышлениям я добиваюсь через мобильный кондиционер и небольшую щель в оконном уплотнителе. Включаю на часик режим dry, затем на постоянку cool. Получается, в комнате прохладно, а из-за щели и разницы давления от кондиционера свежий воздух заходит внутрь. Физика в чистом виде
А при сильной усталости, предвыгорании, мне отлично помогает этот магний. Принимаю 1табл по утрам на протяжении недели (иногда двух), и выгорание/длительная усталость снимаются как рукой. Вообще, магний имеет накопительный эффект (курс 30 дней), но у меня результат прослеживается уже через 4 дня
В критические дни, когда нужен максимальный фокус, принимаю ноотропы. Делаю это крайне редко, потому что однажды мне очень понравился эффект, и я пил их полгода, хотя по инструкции был месяц. Потом мозги стали ватными на 2-3 недели, я почти ничего не соображал. Не советую повторять :)
С тех пор пью только когда реально жесть по задачам и нужна продуктивность. Например, полный рабочий день, а вечером ещё подготовка к экзаменам. И там, и там нужно полное погружение с максимальной отдачей. Недавно я был в таком режиме около 3 недель
По ощущениям, бафф ноотропов в том, что КПД уставшего мозга почти не отличается от КПД отдохнувшего. Усталость, конечно, чувствуется, отдохнуть хочется. Но если продолжать что-то делать, на результате это почти не сказывается
В посте описал только свой опыт. Прежде чем пить магний или ноотропы, проконсультируйтесь с врачом
Одна из лучших покупок для дома – анализатор воздуха. Очень важны температура и концентрация CO2 в воздухе
Моя рабочая атмосфера, в которой КПД мозга максимален: 22.5°C (при 45-50% RH) и 550 ppm CO2. Моё плато размышлений, так сказать
Помню, как в 11-м классе, в 2023-м году, решал задачки по химии при подготовке к ЕГЭ, это было 33-е задание. Апрель, на улице +2. Я открыл окно настежь и просидел так весь день. Это был один из самых продуктивных дней. Я сделал невероятно много, но потом заболел
При низкой температуре есть бафф к продуктивности, но есть и дебафф – организм быстрее истощается. При высокой температуре плюсов нет... мозг сильнее троттлит, а организм тратит много сил на охлаждение
При высокой концентрации CO2 появляется сонливость и затуманенность сознания. Мы чаще входим в режим, который я называю псевдопотоком. Кажется, вот ещё чуть-чуть, и всё закончишь. Но проходит час, два, время улетает мигом. Потом отходишь на полчаса подышать воздухом, возвращаешься и видишь, какую несуразицу делал всё это время. После этого за гораздо меньший промежуток времени делаешь больше и качественнее
Самое ужасное сочетание – CO2 выше 850 ppm и температура выше 26°C. Это точка, после которой мозг начинает реально тупить, и осознать это можно только с опытом. Кажется, что всё как обычно и ты контролируешь ситуацию, но процесс снижения КПД размышлений уже запущен. С этого момента каждое повышение ppm или температуры только ухудшает ситуацию
Своего плато по размышлениям я добиваюсь через мобильный кондиционер и небольшую щель в оконном уплотнителе. Включаю на часик режим dry, затем на постоянку cool. Получается, в комнате прохладно, а из-за щели и разницы давления от кондиционера свежий воздух заходит внутрь. Физика в чистом виде
А при сильной усталости, предвыгорании, мне отлично помогает этот магний. Принимаю 1табл по утрам на протяжении недели (иногда двух), и выгорание/длительная усталость снимаются как рукой. Вообще, магний имеет накопительный эффект (курс 30 дней), но у меня результат прослеживается уже через 4 дня
В критические дни, когда нужен максимальный фокус, принимаю ноотропы. Делаю это крайне редко, потому что однажды мне очень понравился эффект, и я пил их полгода, хотя по инструкции был месяц. Потом мозги стали ватными на 2-3 недели, я почти ничего не соображал. Не советую повторять :)
С тех пор пью только когда реально жесть по задачам и нужна продуктивность. Например, полный рабочий день, а вечером ещё подготовка к экзаменам. И там, и там нужно полное погружение с максимальной отдачей. Недавно я был в таком режиме около 3 недель
По ощущениям, бафф ноотропов в том, что КПД уставшего мозга почти не отличается от КПД отдохнувшего. Усталость, конечно, чувствуется, отдохнуть хочется. Но если продолжать что-то делать, на результате это почти не сказывается
Пока готовлю публичную версию форка gbrain (раз, два), хочу рассказать про интересную механику тестирования, до которой дошёл совершенно случайно
В закрытом контуре делал систему распознавания речи (с разделением голосов) из монодорожки. Параллельно пришел проект по созданию речи из текста. И на второй день разработки меня осинило...
Как тестировать распознавание речи? Слушать человеку!
Как тестировать создание речи? Слушать человеку!
Человек становится узким местом, бутылочным горлышком. От этого нужно избавляться
Как исправляем? Генерируем несколько речей, объединяем в монофайл, немного накладываем голоса друг на друга, моделируя реальные перебивания. Отправляем файл распознаваться. Сверяем результаты по транскрибации и диаризации. Подкручиваем параметры
Получается, round-trip testing, циклическое тестирование TTS – ASR
Это открывает просто тонну возможностей. Проверка частных сценариев: наложения голосов, длительность их наложения; распознавание похожих голосов; распознавание островков. Тысячи вариантов
Мы смогли исключить человека из цепочки разработки. К этому всегда нужно стремиться! Теперь мы можем написать нейросети грамотный промпт и отправить на итеративное автоулучшение
В закрытом контуре делал систему распознавания речи (с разделением голосов) из монодорожки. Параллельно пришел проект по созданию речи из текста. И на второй день разработки меня осинило...
Как тестировать распознавание речи? Слушать человеку!
Как тестировать создание речи? Слушать человеку!
Человек становится узким местом, бутылочным горлышком. От этого нужно избавляться
Как исправляем? Генерируем несколько речей, объединяем в монофайл, немного накладываем голоса друг на друга, моделируя реальные перебивания. Отправляем файл распознаваться. Сверяем результаты по транскрибации и диаризации. Подкручиваем параметры
Получается, round-trip testing, циклическое тестирование TTS – ASR
Это открывает просто тонну возможностей. Проверка частных сценариев: наложения голосов, длительность их наложения; распознавание похожих голосов; распознавание островков. Тысячи вариантов
Мы смогли исключить человека из цепочки разработки. К этому всегда нужно стремиться! Теперь мы можем написать нейросети грамотный промпт и отправить на итеративное автоулучшение