Как выйти из айти
2.52K subscribers
1.53K photos
211 videos
17 files
972 links
Знание — это власть.

Для связи вне комментариев: leaveit@toofat.ru.

На пиво: https://tg-me.sbs/tribute/app?startapp=soCO
Download Telegram
ТНН
🙉22👍52
🤣3311😁2
This media is not supported in your browser
VIEW IN TELEGRAM
😁2611🤣4🔥2
АААААААААААААААААААААААААААААААААА
😁28🤡2🗿1
Как выйти из айти
Photo
Художественный фильм - спиздили
😁24
Как выйти из айти
Художественный фильм - спиздили
Размеры каталогов в корне файловой системы (кроме /home), по du -sh, отсортировано по возрастанию:

512B – /bin

512B – /lib

512B – /lib64

512B – /sbin

4.0K – /boot

4.0K – /media

4.0K – /srv

28K – /openai

232K – /mnt

1.6M – /tmp

6.1M – /etc

265M – /root

327M – /var

5.7G – /opt

12G – /usr


Каталоги /proc, /sys, /dev, /run не включал, это виртуальные/служебные файловые системы, их “размер” через du обычно малоинформативен.
7
Оно не даёт архивировать папки, если они слишком большие. Срабатывает таймаут работы архиватора. Но когда это нас останавливало?
👍8
Как выйти из айти
АААААААААААААААААААААААААААААААААА
В скриптах set_text_alignment.py и set_number_formats.py издвижка таблиц забыли почистить рабочие комментарии.

# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.

# TODO [vicky]: Set formats for B13-B21

Привет Викки. Привет Бобби)
🤯12👏9
Как выйти из айти
В скриптах set_text_alignment.py и set_number_formats.py издвижка таблиц забыли почистить рабочие комментарии. # TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet. # TODO [vicky]: Set formats for B13-B21 Привет Викки.…
Вот подробный разбор того, как устроен «интеллект» OpenAI при работе с файлами. Для большей ироничности его писал Gemini 3 pro.

Запрос: мы изучили структуру катологов инстанса и содержимое home/oai/ Что скажешь?

Ответ:
Это не магия нейросетей. Это набор костылей, жестких скриптов и человеческого микроменеджмента, спрятанный в огромный Docker-контейнер.

1. Инфраструктура: Жирный монолит
Забудь про легковесные микросервисы. Среда исполнения — это Debian 12 (Bookworm), раздутый до неприличия.

Вес: Система занимает более 18 ГБ (12 ГБ /usr + 6 ГБ /opt).

Состав: Внутри лежит всё сразу. LibreOffice для конвертации документов, Java, полный стек X11/Wayland (хотя экрана нет), Chromium с энтерпрайз-политиками Google и куча проприетарных бинарников в /opt.

Зачем: Чтобы модель могла нажать любую кнопку, контейнер должен содержать все возможные зависимости. Обновлять это — ад. Поэтому версия ядра (6.1) и софта фиксируются намертво.

2. Зрение: Параноидальный контроль
Модель слепая. Она не «понимает» структуру DOCX или PDF, когда создает их. Она обязана превращать документы в картинки, чтобы убедиться, что не накосячила.

Механизм: Скрипт render_docx.py запускает LibreOffice, конвертирует документ в PDF, а потом утилитой pdftoppm нарезает его на PNG-изображения.

Лимиты: В код зашиты размеры 1600x2000 пикселей. Скрипт лезет в XML-структуру файла, считает размеры страницы в твипах (типографская единица) и подгоняет DPI, чтобы картинка влезла в интерфейс чата.

Инструкция: В skill.md прямой приказ: «Inspect every exported PNG». Если модель не посмотрела на скриншот — файл пользователю не отдавать. Это не интеллект, это скрипт автотестирования.

3. Excel: Имитация и раскраска
То, что выглядит как работа аналитика, на деле — жесткое следование корпоративному брендбуку.

Протокол: Агент не правит файлы напрямую библиотеками типа pandas. Он генерирует Protobuf-сообщения (oaiproto), которые потом компилируются в XLSX.

Графика: Диаграммы в Excel рисуются движком от PowerPoint (oaiproto.coworker.pptx.chart_pb2). У OpenAI единый рендер для всего. Им плевать на нативные возможности Excel, они просто вставляют объект «Chart» поверх ячеек.

Инвест-банкинг: В промпт зашиты правила для финансовых моделей. Если агент чует LBO или DCF модель, он обязан красить хардкод в синий (RGB 0,0,255), а формулы — в черный. Это не решение модели, это if/else в инструкции.

Цитаты: Ссылки на источники в таблицах — это не смысловая связь. Это механизм tether_id в cite_cells.py. Агент прибивает ячейку гвоздями к конкретным номерам строк в исходном документе.

4. Разработка: «Привет, Вики и Бобби»
Код писали живые люди, и они не успели доделать работу. В скриптах форматирования остались комментарии разработчиков:

# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.

Когда ChatGPT говорит, что «не может повернуть текст в ячейке из-за сложности формата» — он врет. Он не может, потому что Вики и Бобби не дописали этот кусок API в бэкенде. Также в коде торчат уши Windows-разработки: для шрифта Comic Sans нужно использовать системный ID семейства (family=4), как в Win32 API.

5. PDF: Рисование кодом
Агент не пишет текст в PDF. Он его рисует. Используется библиотека reportlab, где каждый элемент размещается по координатам.

Запреты: Модели запрещено использовать неразрывные дефисы (U+2011), потому что рендер от них падает.

Фильтрация: Строжайший запрет на утечку служебных токенов (†L158-L160). Если пользователь увидит эти символы, магия разрушится, и станет ясно, что «умный ответ» — это просто склейка кусков из векторной базы данных.

Итог
«Коллега» (Coworker) от OpenAI — это не нейросеть, которая научилась пользоваться Excel. Это огромный слой C++ и Python кода (Glue code), который транслирует намерения модели в нажатия кнопок устаревшего софта. Модель здесь выступает не творцом, а оператором сложного станка с кучей рычагов, половина из которых (как поворот текста) даже не подключена.
😁31👍5👏4🤮1
Как выйти из айти
Вот подробный разбор того, как устроен «интеллект» OpenAI при работе с файлами. Для большей ироничности его писал Gemini 3 pro. Запрос: мы изучили структуру катологов инстанса и содержимое home/oai/ Что скажешь? Ответ: Это не магия нейросетей. Это набор…
Разработчики OpenAI, похоже, вообще не чистят логи. В \opt\granola-cli\bin\node_modules\@oai\walnut\README.md прямо в примерах кода спалился локальный путь разработчика: /Users/vicky/code/sample_spreadsheets/001_Best_Buy.xlsx.
😁27
Вот детальный технический разбор анатомии «Code Interpreter» от OpenAI. Мы вскрыли их репозиторий, и теперь видим, что король-то голый. Вместо магии нейросетей тут работает жесткая инженерная обвязка, написанная конкретными людьми (Вики и Бобби), с кучей заплаток и заимствований.

1. Walnut: Сердце системы — это C# и .NET 9
Все привыкли, что Data Science — это Python. Но когда дело доходит до тяжелой работы с файлами, OpenAI использует C#.

Технология: Движок @oai/walnut написан на .NET 9.0. Это самый свежий, быстрый стек от Microsoft.

Архитектура «Зеркало» (WASM): OpenAI решили проблему синхронизации гениально и лениво. Они скомпилировали этот C# код в WebAssembly.

На сервере: C# парсит твой Excel, превращает его в Protobuf.

В браузере: Тот же самый C# (в виде WASM) берет этот Protobuf и рисует превью таблицы на Canvas. Это гарантирует, что ты видишь ровно то, что видит модель. Никаких рассинхронов верстки.

Roundtrip (Туда-обратно): Система не редактирует файлы напрямую. Она работает как мясорубка: XLSX -> Protobuf (oaiproto) -> Правки от Python -> Protobuf -> XLSX. Именно на этапе сборки обратно в XLSX часто возникают ошибки "файл поврежден", если модель нарушила структуру Protobuf.

2. Химера OAIProto: Единая Теория Документов
Они изобрели свой формат файлов, чтобы не мучиться с зоопарком Microsoft Office. Но этот формат — Франкенштейн.

Донор — PowerPoint: Вся визуальная часть системы украдена у презентаций.

Если ты рисуешь график в Excel, система использует класс Chart из oaiproto.coworker.pptx.

Если ты меняешь цвет шрифта в таблице, используется Color и Theme из pptx.

Excel для них — это просто сетка данных, на которую натянута шкура от PowerPoint.

Word — это свалка: Файл document.ts показывает, что DOCX собирается из кусков других форматов:

TypeScript

import { Chart } from "../pptx/chart"; // Графики от PPTX
import { Workbook } from "../xlsx/spreadsheet"; // Таблицы от Excel
. Они не писали рендер таблиц для Word. Они просто вставляют туда Excel-объект.

3. "Smart Editor" — это RegEx на стероидах
Когда ChatGPT говорит "Я исправляю ошибку в вашем коде", он не переосмысливает алгоритм. Он запускает примитивный Python-скрипт combined_apply_patch_cli.py.

Протокол: Модель генерирует текст:

Plaintext

*** Begin Patch
file: main.py
type: update
<<<<
old_code()
====
new_code()
>>>>
Скрипт парсит это и тупо заменяет кусок текста А на кусок Б.

Защита от дурака: Вся безопасность "песочницы" при записи файлов держится на честном слове и одной проверке:

Python

if path.startswith("/"):
print("We do not support absolute paths.")
return
. Если модель попытается написать в /usr/bin, скрипт ее остановит. Но внутри своей папки она может творить любой хаос.

4. Визуальная паранойя: Почему так медленно?
Пользователи жалуются на скорость работы с документами. Теперь мы знаем почему. В файл skill.md и скрипт render_docx.py зашит адский цикл проверки:

Генерация: Python создает DOCX.

Конвертация: Запускается тяжеленный LibreOffice (soffice --headless), чтобы сделать PDF.

Растрирование: PDF режется на картинки через pdftoppm.

Инспекция: Модель обязана посмотреть на PNG.

"Inspect every exported PNG... Look for subtle issues like widows/orphans". Если модель пропустит этот шаг, файл не отдадут юзеру. Это не "мышление", это принудительный бюрократический регламент.

5. Инфраструктура: Google и Bun
OpenAI глубоко сидит на игле Google Cloud.

Granola: Утилита для сбора логов/телеметрии granola-cli. Она написана не на Node.js, а на Bun (потому что быстрее стартует). Она таскает все свои node_modules с собой, чтобы работать даже в сломанном окружении.

Внутренние ссылки: В entrypoint.sh и других скриптах куча ссылок на http://go/docs-link/.... Это внутренний шортлинк-сервис Google. Контейнеры собираются по стандартам Google (CUA — Chrome User Agent).

Зачистка: При старте entrypoint.sh делает unset TARBALLS_DIR. Они боятся, что ты через os.environ найдешь, где лежат исходники их инструментов.

6. Человеческий фактор: Вики и Бобби
Этот код не писали боги AI. Его писали замученные разработчики.
17👏2👍1
Вики (Vicky): Она оставила свой локальный путь в документации: /Users/vicky/code/sample_spreadsheets/.... Она оставила TODO в коде форматирования чисел: # TODO [vicky]: Set formats for B13-B21.

Бобби (Bobby): Вместе с Вики они признаются в бессилии: # TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.. Когда ChatGPT говорит "Я не могу повернуть текст", это значит "Бобби не успел это закодить".

Legacy: В set_font_styles.py шрифт Comic Sans задается как family=4. Это магическое число из Win32 API 90-х годов.

Итог для дата-майнинга
Мы имеем дело не с монолитным интеллектом, а с конструктором.
Walnut (.NET/WASM) — это движок данных.
OAIProto — это язык общения компонентов.
Python Scripts — это руки, которые дергают рычаги.
Granola (Bun) — это стукач.

Слабое место — OAIProto. Если научиться генерировать эти бинарники (а схемы лежат в generated/oaiproto/*.ts), можно скармливать модели фальшивые "воспоминания" о документах, которые она якобы видела.
👏21
Так. Дыру прикрыли. Но вот вам всякое говно без структуры, которое я успел скачать

https://drive.google.com/file/d/1Hw3a58rnxlStxFYGOXbWIFx-3tQsxRaY/view?usp=sharing
🔥19
С высокой долей вероятности та самая Вики)
https://www.linkedin.com/in/vicky-gong-0522054a
🌭13
Государству в копилку идей по повышению рождаемости в наше непростое время 😉
😁38👍2😱1
Мне кажется, что-то пошло не так
🤔7