Love. Death. Transformers.

Все это было у Замятина

👍51❤‍🔥7⚡1

5.32K views11:01

Как понять что пишет NLPшник старой закалки: falcon, alpaca, wizardlm как отдельные модели.

бтв жду horny wizard lm

👍17😁7❤2💊1

5.29K viewsedited 15:22

Love. Death. Transformers.

🥴54😁28⚡4💯3👀1

5.66K views18:53

Love. Death. Transformers.

😁66🌚12🥴10🫡5🔥4🤷‍♂3❤1

6.68K views05:51

Love. Death. Transformers.

Всем привет! В эту субботу в 14:00 МСК будет онлайн-лекция для Better Data Community, от Ильи Гусева, старшего инженера по машинному обучению в Букинге, автора Сайги. Лекция будет про архитектуры, альтерантивные трансформерам, а именно про линейные рекуррентные сети. Внутри будет куча крутых архитектур которые полезно знать MLE инженерам из топовых перцентилей!

🔥51👍3❤‍🔥2😁2💯1

17.4K viewsedited 20:01

Love. Death. Transformers.

h=100 in 20years or faster

✍41😁32🤯3❤1😢1🤣1

6.98K views06:49

Love. Death. Transformers.

Тут Dmitry Ustalov на icml провел прикольный воркшоп про RLHF, го читать

Substack

Reinforcement Learning from Human Feedback: When the Math Ain't Enough

Hundreds of brightest people at ICML '23 were in the room at the RLHF tutorial. Speaker asked who wanted to annotate the data. Only five, maybe ten people, raised their hands. That surprised no one.

❤23

6.71K views18:07

Love. Death. Transformers.

Forwarded from ̶с̶а̶м̶̶о̶изолента мёбиуса

Я обновил рейтинг русскоязычных энкодеров предложений github.com/avidale/encodechka, по просьбам трудящихся (и благодаря помощи @dealerAI, нашедшего баг в моих расчетах и настойчиво о нем напоминавшего).

Напомню, что это бенчмарк из 8 задач на эмбеддинги предложений (и еще 2 дополнительные- на эмбеддинги токенов).
В каждой задаче эмбеддинги из модели берутся "как есть" (для BERT-подобных моделей я беру наилучший из двух: эмбеддинг первого токена либо средний эмбеддинг всех токенов), и применяются в качестве фичей для конечной задачи (косинусная близость, либо классификация с помощью логрега или knn).
Дальше я усредняю метрики качества по 8 основным задачам (они разные, но все между 0 и 1), и отмечаю модели, оптимально балансирующие это качество и размер либо скорость.

Что изменилось:
1) Некоторые скоры подвинулись вверх (но не очень сильно, в основном на 1-2%), благодаря исправленной опечатке в формуле усреднения эмбеддингов токенов.
2) Добавилось несколько новых моделей, включая:
- нового лидера Multilingual-E5-large, взявшего сразу 5 медалей в задачах семантической близости, анализа тональности, и классификации интентов;
- эмбеддинги от OpenAI text-embedding-ada-002, которые, несмотря на большую размерность, не особо себя проявили;
- symanto/sn-xlm-roberta-base-snli-mnli-anli-xnli, ожидаемо (и не очень честно) победившую в NLI задаче;
- deepvk/deberta-v1-base, победившую в разряде "детекция токсичности" (aka "одноклассники");
- энкодер от ai-forever/FRED-T5-large, победивший в детекции неполиткорректных текстов.
3) Добавил в лидерборд столбец с размерностью модели, так что теперь например видно, что одинаково перформят 1536-мерные эмбеддинги от OpenAI и 384-мерные из MiniLM-L12.

Если вы хотели бы видеть в бенчмарке какие-нибудь ещё энкодеры – пишите, добавлю!

🔥24👍7❤1

5.14K views07:00

Love. Death. Transformers.

😁78🔥8🥱5🥰3🤩3👎2❤1

5.41K views09:32

Love. Death. Transformers.

до сих пор смешно

😁33🥴5❤3👎3🤣3🤮2👍1🤔1

5.06K views13:16

Love. Death. Transformers.

❤82😢27🥰7🏆6🔥4🤣4🌭2🍌2🤮1

5.42K views19:45

Love. Death. Transformers.

Forwarded from Derp Learning

1:04

This media is not supported in your browser

VIEW IN TELEGRAM

Аж олдскулы свело

Сорс by Dmitry Alekseev

❤82👍4👀3🤮2😢1🖕1

4.46K views20:17

Love. Death. Transformers.

🍌64😁9🐳3🤔2🗿2👍1🥰1🥱1🌭1

5.27K views10:58

Love. Death. Transformers.

код 200
мы вместе

❤‍🔥82🤮37🫡22😁17👍2❤1🍾1🤓1

6.3K views18:17

Love. Death. Transformers.

Forwarded from russiansinlondon

Еду в голодный край

👍34💯7❤3🕊1🗿1

5.18K views12:15

Love. Death. Transformers.

Ого Eva Elfie стала ресерчером??

🔥121😁71🍌15❤5🤮4🤓2👍1🥴1🌚1

6.27K views15:47

Love. Death. Transformers.

Forwarded from еба́ные идеи для резерча

Да)) Почитаем пару твиттер-тредов, а потом в две руки запустим модель на лайтнинге, не переживай, никакого интима)

🌚30🥴6❤5🤡3⚡2👍1

4.7K views08:02

Love. Death. Transformers.

#чтивонаночь по быстрому

Text Embeddings by Weakly-Supervised Contrastive Pre-training
Кажется новая sentence SOTA от microsoft, идея в том чтобы собрать много грязных пар(Reddit, Stackexchange, wiki) где есть пара пост-коммент, статья-описание и всякое такое, а затем дотюнили на NLI/честной текстовой классификации.

В целом около SOTA на эмбед задачах, есть MT версии с поддержкой русского.

модель
статья

👍24❤2🥱1

5.19K viewsedited 21:15

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

пост про диффузии обязательно выйдет погулять, хз когда

гифка украдена из @dankpostcards

🔥17🥰5👍4❤2

4.74K viewsedited 21:15

Love. Death. Transformers.

Forwarded from ML-легушька (Николай Кутузов)

Ранняя_диагностика_нейродегенеративных_заболеваний_2.pdf

647.8 KB

Собственно решение моей задачи.
Я изучил статьи, связанные с диагностикой болезни Альцгеймера. Некоторое время назад было проведено масштабное исследование, которое показало, что мы можем смотреть уровень неправильно свернутого бета-амилоида (белка, который является неизменным спутником болезни Альцгеймера, так как именно накопление неправильного бета-амилоида в мозге ведет к созданию амилоидных бляшек, которые разрушают мозг, и соответственно к деменции) в плазме крови с помощью имунно-инфракрасного датчика, производство которых с каждым годом становится все дешевле. Такой метод имеет 0.79 Recall и 0.06 FPR. Если сочетать его с анализом спинномозговой жидкости на тау-белок, то recall вырастает до 0.87, а FPR снижается до 0.03. Однако пункция спинномозговой жидкости - инвазивный метод, причем более дорогой. Поэтому я предложил использовать ЭЭГ в качестве второго этапа проверки, так как он делается легче, неинвазивно и дешевле, и изменения в ЭЭГ также могут свидетельствовать о болезни Альцгеймера.
Также, чтобы не перегружать систему здравоохранения, я предложил отправлять людей рандомизированно на тест на бета-амилоид + ЭЭГ, дополняя эту связку пункцией спинномозговой жидкости при необходимости. Вероятность отправки на тест зависит от возраста и предсказания ML-модели, которая обучается по истории болезней и анкетированию определять риск появления болезни Альцгеймера.
Чтобы подтвердить жизнеспособность моего решения, я смоделировал работу такой системы, в предположении что несколько этапов теста делают его очень точным. Соответственно, я смоделировал работу ML-модели, ручками сделал решающее дерево для определения вероятностей, и посмотрел, какого recall при отправке на тест при какой нагрузке на систему здравоохранения мы можем добиться. Получилось даже не очень плохо! Система легко адаптируется под другие заболевания, при наличии хороших биомаркеров, т.к. от Альцгеймера тут только вероятность появления болезни от возраста.
Прикладываю презентацию, там подробнее описаны результаты и процесс моделирования.

❤‍🔥60🆒7👍5🔥4🥴1

4.54K views09:27

About

Blog

Apps

Platform