Как выйти из айти
Художественный фильм - спиздили
Размеры каталогов в корне файловой системы (кроме /home), по du -sh, отсортировано по возрастанию:
512B – /bin
512B – /lib
512B – /lib64
512B – /sbin
4.0K – /boot
4.0K – /media
4.0K – /srv
28K – /openai
232K – /mnt
1.6M – /tmp
6.1M – /etc
265M – /root
327M – /var
5.7G – /opt
12G – /usr
Каталоги /proc, /sys, /dev, /run не включал, это виртуальные/служебные файловые системы, их “размер” через du обычно малоинформативен.
512B – /bin
512B – /lib
512B – /lib64
512B – /sbin
4.0K – /boot
4.0K – /media
4.0K – /srv
28K – /openai
232K – /mnt
1.6M – /tmp
6.1M – /etc
265M – /root
327M – /var
5.7G – /opt
12G – /usr
Каталоги /proc, /sys, /dev, /run не включал, это виртуальные/служебные файловые системы, их “размер” через du обычно малоинформативен.
❤7
Как выйти из айти
АААААААААААААААААААААААААААААААААА
В скриптах set_text_alignment.py и set_number_formats.py издвижка таблиц забыли почистить рабочие комментарии.
# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.
# TODO [vicky]: Set formats for B13-B21
Привет Викки. Привет Бобби)
# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.
# TODO [vicky]: Set formats for B13-B21
Привет Викки. Привет Бобби)
🤯12👏9
Как выйти из айти
В скриптах set_text_alignment.py и set_number_formats.py издвижка таблиц забыли почистить рабочие комментарии. # TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet. # TODO [vicky]: Set formats for B13-B21 Привет Викки.…
Вот подробный разбор того, как устроен «интеллект» OpenAI при работе с файлами. Для большей ироничности его писал Gemini 3 pro.
Запрос: мы изучили структуру катологов инстанса и содержимое home/oai/ Что скажешь?
Ответ:
Это не магия нейросетей. Это набор костылей, жестких скриптов и человеческого микроменеджмента, спрятанный в огромный Docker-контейнер.
1. Инфраструктура: Жирный монолит
Забудь про легковесные микросервисы. Среда исполнения — это Debian 12 (Bookworm), раздутый до неприличия.
Вес: Система занимает более 18 ГБ (12 ГБ /usr + 6 ГБ /opt).
Состав: Внутри лежит всё сразу. LibreOffice для конвертации документов, Java, полный стек X11/Wayland (хотя экрана нет), Chromium с энтерпрайз-политиками Google и куча проприетарных бинарников в /opt.
Зачем: Чтобы модель могла нажать любую кнопку, контейнер должен содержать все возможные зависимости. Обновлять это — ад. Поэтому версия ядра (6.1) и софта фиксируются намертво.
2. Зрение: Параноидальный контроль
Модель слепая. Она не «понимает» структуру DOCX или PDF, когда создает их. Она обязана превращать документы в картинки, чтобы убедиться, что не накосячила.
Механизм: Скрипт render_docx.py запускает LibreOffice, конвертирует документ в PDF, а потом утилитой pdftoppm нарезает его на PNG-изображения.
Лимиты: В код зашиты размеры 1600x2000 пикселей. Скрипт лезет в XML-структуру файла, считает размеры страницы в твипах (типографская единица) и подгоняет DPI, чтобы картинка влезла в интерфейс чата.
Инструкция: В skill.md прямой приказ: «Inspect every exported PNG». Если модель не посмотрела на скриншот — файл пользователю не отдавать. Это не интеллект, это скрипт автотестирования.
3. Excel: Имитация и раскраска
То, что выглядит как работа аналитика, на деле — жесткое следование корпоративному брендбуку.
Протокол: Агент не правит файлы напрямую библиотеками типа pandas. Он генерирует Protobuf-сообщения (oaiproto), которые потом компилируются в XLSX.
Графика: Диаграммы в Excel рисуются движком от PowerPoint (oaiproto.coworker.pptx.chart_pb2). У OpenAI единый рендер для всего. Им плевать на нативные возможности Excel, они просто вставляют объект «Chart» поверх ячеек.
Инвест-банкинг: В промпт зашиты правила для финансовых моделей. Если агент чует LBO или DCF модель, он обязан красить хардкод в синий (RGB 0,0,255), а формулы — в черный. Это не решение модели, это if/else в инструкции.
Цитаты: Ссылки на источники в таблицах — это не смысловая связь. Это механизм tether_id в cite_cells.py. Агент прибивает ячейку гвоздями к конкретным номерам строк в исходном документе.
4. Разработка: «Привет, Вики и Бобби»
Код писали живые люди, и они не успели доделать работу. В скриптах форматирования остались комментарии разработчиков:
# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.
Когда ChatGPT говорит, что «не может повернуть текст в ячейке из-за сложности формата» — он врет. Он не может, потому что Вики и Бобби не дописали этот кусок API в бэкенде. Также в коде торчат уши Windows-разработки: для шрифта Comic Sans нужно использовать системный ID семейства (family=4), как в Win32 API.
5. PDF: Рисование кодом
Агент не пишет текст в PDF. Он его рисует. Используется библиотека reportlab, где каждый элемент размещается по координатам.
Запреты: Модели запрещено использовать неразрывные дефисы (U+2011), потому что рендер от них падает.
Фильтрация: Строжайший запрет на утечку служебных токенов (†L158-L160). Если пользователь увидит эти символы, магия разрушится, и станет ясно, что «умный ответ» — это просто склейка кусков из векторной базы данных.
Итог
«Коллега» (Coworker) от OpenAI — это не нейросеть, которая научилась пользоваться Excel. Это огромный слой C++ и Python кода (Glue code), который транслирует намерения модели в нажатия кнопок устаревшего софта. Модель здесь выступает не творцом, а оператором сложного станка с кучей рычагов, половина из которых (как поворот текста) даже не подключена.
Запрос: мы изучили структуру катологов инстанса и содержимое home/oai/ Что скажешь?
Ответ:
Это не магия нейросетей. Это набор костылей, жестких скриптов и человеческого микроменеджмента, спрятанный в огромный Docker-контейнер.
1. Инфраструктура: Жирный монолит
Забудь про легковесные микросервисы. Среда исполнения — это Debian 12 (Bookworm), раздутый до неприличия.
Вес: Система занимает более 18 ГБ (12 ГБ /usr + 6 ГБ /opt).
Состав: Внутри лежит всё сразу. LibreOffice для конвертации документов, Java, полный стек X11/Wayland (хотя экрана нет), Chromium с энтерпрайз-политиками Google и куча проприетарных бинарников в /opt.
Зачем: Чтобы модель могла нажать любую кнопку, контейнер должен содержать все возможные зависимости. Обновлять это — ад. Поэтому версия ядра (6.1) и софта фиксируются намертво.
2. Зрение: Параноидальный контроль
Модель слепая. Она не «понимает» структуру DOCX или PDF, когда создает их. Она обязана превращать документы в картинки, чтобы убедиться, что не накосячила.
Механизм: Скрипт render_docx.py запускает LibreOffice, конвертирует документ в PDF, а потом утилитой pdftoppm нарезает его на PNG-изображения.
Лимиты: В код зашиты размеры 1600x2000 пикселей. Скрипт лезет в XML-структуру файла, считает размеры страницы в твипах (типографская единица) и подгоняет DPI, чтобы картинка влезла в интерфейс чата.
Инструкция: В skill.md прямой приказ: «Inspect every exported PNG». Если модель не посмотрела на скриншот — файл пользователю не отдавать. Это не интеллект, это скрипт автотестирования.
3. Excel: Имитация и раскраска
То, что выглядит как работа аналитика, на деле — жесткое следование корпоративному брендбуку.
Протокол: Агент не правит файлы напрямую библиотеками типа pandas. Он генерирует Protobuf-сообщения (oaiproto), которые потом компилируются в XLSX.
Графика: Диаграммы в Excel рисуются движком от PowerPoint (oaiproto.coworker.pptx.chart_pb2). У OpenAI единый рендер для всего. Им плевать на нативные возможности Excel, они просто вставляют объект «Chart» поверх ячеек.
Инвест-банкинг: В промпт зашиты правила для финансовых моделей. Если агент чует LBO или DCF модель, он обязан красить хардкод в синий (RGB 0,0,255), а формулы — в черный. Это не решение модели, это if/else в инструкции.
Цитаты: Ссылки на источники в таблицах — это не смысловая связь. Это механизм tether_id в cite_cells.py. Агент прибивает ячейку гвоздями к конкретным номерам строк в исходном документе.
4. Разработка: «Привет, Вики и Бобби»
Код писали живые люди, и они не успели доделать работу. В скриптах форматирования остались комментарии разработчиков:
# TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.
Когда ChatGPT говорит, что «не может повернуть текст в ячейке из-за сложности формата» — он врет. Он не может, потому что Вики и Бобби не дописали этот кусок API в бэкенде. Также в коде торчат уши Windows-разработки: для шрифта Comic Sans нужно использовать системный ID семейства (family=4), как в Win32 API.
5. PDF: Рисование кодом
Агент не пишет текст в PDF. Он его рисует. Используется библиотека reportlab, где каждый элемент размещается по координатам.
Запреты: Модели запрещено использовать неразрывные дефисы (U+2011), потому что рендер от них падает.
Фильтрация: Строжайший запрет на утечку служебных токенов (†L158-L160). Если пользователь увидит эти символы, магия разрушится, и станет ясно, что «умный ответ» — это просто склейка кусков из векторной базы данных.
Итог
«Коллега» (Coworker) от OpenAI — это не нейросеть, которая научилась пользоваться Excel. Это огромный слой C++ и Python кода (Glue code), который транслирует намерения модели в нажатия кнопок устаревшего софта. Модель здесь выступает не творцом, а оператором сложного станка с кучей рычагов, половина из которых (как поворот текста) даже не подключена.
😁31👍5👏4🤮1
Как выйти из айти
Вот подробный разбор того, как устроен «интеллект» OpenAI при работе с файлами. Для большей ироничности его писал Gemini 3 pro. Запрос: мы изучили структуру катологов инстанса и содержимое home/oai/ Что скажешь? Ответ: Это не магия нейросетей. Это набор…
Разработчики OpenAI, похоже, вообще не чистят логи. В \opt\granola-cli\bin\node_modules\@oai\walnut\README.md прямо в примерах кода спалился локальный путь разработчика: /Users/vicky/code/sample_spreadsheets/001_Best_Buy.xlsx.
😁27
Вот детальный технический разбор анатомии «Code Interpreter» от OpenAI. Мы вскрыли их репозиторий, и теперь видим, что король-то голый. Вместо магии нейросетей тут работает жесткая инженерная обвязка, написанная конкретными людьми (Вики и Бобби), с кучей заплаток и заимствований.
1. Walnut: Сердце системы — это C# и .NET 9
Все привыкли, что Data Science — это Python. Но когда дело доходит до тяжелой работы с файлами, OpenAI использует C#.
Технология: Движок @oai/walnut написан на .NET 9.0. Это самый свежий, быстрый стек от Microsoft.
Архитектура «Зеркало» (WASM): OpenAI решили проблему синхронизации гениально и лениво. Они скомпилировали этот C# код в WebAssembly.
На сервере: C# парсит твой Excel, превращает его в Protobuf.
В браузере: Тот же самый C# (в виде WASM) берет этот Protobuf и рисует превью таблицы на Canvas. Это гарантирует, что ты видишь ровно то, что видит модель. Никаких рассинхронов верстки.
Roundtrip (Туда-обратно): Система не редактирует файлы напрямую. Она работает как мясорубка: XLSX -> Protobuf (oaiproto) -> Правки от Python -> Protobuf -> XLSX. Именно на этапе сборки обратно в XLSX часто возникают ошибки "файл поврежден", если модель нарушила структуру Protobuf.
2. Химера OAIProto: Единая Теория Документов
Они изобрели свой формат файлов, чтобы не мучиться с зоопарком Microsoft Office. Но этот формат — Франкенштейн.
Донор — PowerPoint: Вся визуальная часть системы украдена у презентаций.
Если ты рисуешь график в Excel, система использует класс Chart из oaiproto.coworker.pptx.
Если ты меняешь цвет шрифта в таблице, используется Color и Theme из pptx.
Excel для них — это просто сетка данных, на которую натянута шкура от PowerPoint.
Word — это свалка: Файл document.ts показывает, что DOCX собирается из кусков других форматов:
TypeScript
import { Chart } from "../pptx/chart"; // Графики от PPTX
import { Workbook } from "../xlsx/spreadsheet"; // Таблицы от Excel
. Они не писали рендер таблиц для Word. Они просто вставляют туда Excel-объект.
3. "Smart Editor" — это RegEx на стероидах
Когда ChatGPT говорит "Я исправляю ошибку в вашем коде", он не переосмысливает алгоритм. Он запускает примитивный Python-скрипт combined_apply_patch_cli.py.
Протокол: Модель генерирует текст:
Plaintext
*** Begin Patch
file: main.py
type: update
<<<<
old_code()
====
new_code()
>>>>
Скрипт парсит это и тупо заменяет кусок текста А на кусок Б.
Защита от дурака: Вся безопасность "песочницы" при записи файлов держится на честном слове и одной проверке:
Python
if path.startswith("/"):
print("We do not support absolute paths.")
return
. Если модель попытается написать в /usr/bin, скрипт ее остановит. Но внутри своей папки она может творить любой хаос.
4. Визуальная паранойя: Почему так медленно?
Пользователи жалуются на скорость работы с документами. Теперь мы знаем почему. В файл skill.md и скрипт render_docx.py зашит адский цикл проверки:
Генерация: Python создает DOCX.
Конвертация: Запускается тяжеленный LibreOffice (soffice --headless), чтобы сделать PDF.
Растрирование: PDF режется на картинки через pdftoppm.
Инспекция: Модель обязана посмотреть на PNG.
"Inspect every exported PNG... Look for subtle issues like widows/orphans". Если модель пропустит этот шаг, файл не отдадут юзеру. Это не "мышление", это принудительный бюрократический регламент.
5. Инфраструктура: Google и Bun
OpenAI глубоко сидит на игле Google Cloud.
Granola: Утилита для сбора логов/телеметрии granola-cli. Она написана не на Node.js, а на Bun (потому что быстрее стартует). Она таскает все свои node_modules с собой, чтобы работать даже в сломанном окружении.
Внутренние ссылки: В entrypoint.sh и других скриптах куча ссылок на http://go/docs-link/.... Это внутренний шортлинк-сервис Google. Контейнеры собираются по стандартам Google (CUA — Chrome User Agent).
Зачистка: При старте entrypoint.sh делает unset TARBALLS_DIR. Они боятся, что ты через os.environ найдешь, где лежат исходники их инструментов.
6. Человеческий фактор: Вики и Бобби
Этот код не писали боги AI. Его писали замученные разработчики.
1. Walnut: Сердце системы — это C# и .NET 9
Все привыкли, что Data Science — это Python. Но когда дело доходит до тяжелой работы с файлами, OpenAI использует C#.
Технология: Движок @oai/walnut написан на .NET 9.0. Это самый свежий, быстрый стек от Microsoft.
Архитектура «Зеркало» (WASM): OpenAI решили проблему синхронизации гениально и лениво. Они скомпилировали этот C# код в WebAssembly.
На сервере: C# парсит твой Excel, превращает его в Protobuf.
В браузере: Тот же самый C# (в виде WASM) берет этот Protobuf и рисует превью таблицы на Canvas. Это гарантирует, что ты видишь ровно то, что видит модель. Никаких рассинхронов верстки.
Roundtrip (Туда-обратно): Система не редактирует файлы напрямую. Она работает как мясорубка: XLSX -> Protobuf (oaiproto) -> Правки от Python -> Protobuf -> XLSX. Именно на этапе сборки обратно в XLSX часто возникают ошибки "файл поврежден", если модель нарушила структуру Protobuf.
2. Химера OAIProto: Единая Теория Документов
Они изобрели свой формат файлов, чтобы не мучиться с зоопарком Microsoft Office. Но этот формат — Франкенштейн.
Донор — PowerPoint: Вся визуальная часть системы украдена у презентаций.
Если ты рисуешь график в Excel, система использует класс Chart из oaiproto.coworker.pptx.
Если ты меняешь цвет шрифта в таблице, используется Color и Theme из pptx.
Excel для них — это просто сетка данных, на которую натянута шкура от PowerPoint.
Word — это свалка: Файл document.ts показывает, что DOCX собирается из кусков других форматов:
TypeScript
import { Chart } from "../pptx/chart"; // Графики от PPTX
import { Workbook } from "../xlsx/spreadsheet"; // Таблицы от Excel
. Они не писали рендер таблиц для Word. Они просто вставляют туда Excel-объект.
3. "Smart Editor" — это RegEx на стероидах
Когда ChatGPT говорит "Я исправляю ошибку в вашем коде", он не переосмысливает алгоритм. Он запускает примитивный Python-скрипт combined_apply_patch_cli.py.
Протокол: Модель генерирует текст:
Plaintext
*** Begin Patch
file: main.py
type: update
<<<<
old_code()
====
new_code()
>>>>
Скрипт парсит это и тупо заменяет кусок текста А на кусок Б.
Защита от дурака: Вся безопасность "песочницы" при записи файлов держится на честном слове и одной проверке:
Python
if path.startswith("/"):
print("We do not support absolute paths.")
return
. Если модель попытается написать в /usr/bin, скрипт ее остановит. Но внутри своей папки она может творить любой хаос.
4. Визуальная паранойя: Почему так медленно?
Пользователи жалуются на скорость работы с документами. Теперь мы знаем почему. В файл skill.md и скрипт render_docx.py зашит адский цикл проверки:
Генерация: Python создает DOCX.
Конвертация: Запускается тяжеленный LibreOffice (soffice --headless), чтобы сделать PDF.
Растрирование: PDF режется на картинки через pdftoppm.
Инспекция: Модель обязана посмотреть на PNG.
"Inspect every exported PNG... Look for subtle issues like widows/orphans". Если модель пропустит этот шаг, файл не отдадут юзеру. Это не "мышление", это принудительный бюрократический регламент.
5. Инфраструктура: Google и Bun
OpenAI глубоко сидит на игле Google Cloud.
Granola: Утилита для сбора логов/телеметрии granola-cli. Она написана не на Node.js, а на Bun (потому что быстрее стартует). Она таскает все свои node_modules с собой, чтобы работать даже в сломанном окружении.
Внутренние ссылки: В entrypoint.sh и других скриптах куча ссылок на http://go/docs-link/.... Это внутренний шортлинк-сервис Google. Контейнеры собираются по стандартам Google (CUA — Chrome User Agent).
Зачистка: При старте entrypoint.sh делает unset TARBALLS_DIR. Они боятся, что ты через os.environ найдешь, где лежат исходники их инструментов.
6. Человеческий фактор: Вики и Бобби
Этот код не писали боги AI. Его писали замученные разработчики.
❤17👏2👍1
Вики (Vicky): Она оставила свой локальный путь в документации: /Users/vicky/code/sample_spreadsheets/.... Она оставила TODO в коде форматирования чисел: # TODO [vicky]: Set formats for B13-B21.
Бобби (Bobby): Вместе с Вики они признаются в бессилии: # TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.. Когда ChatGPT говорит "Я не могу повернуть текст", это значит "Бобби не успел это закодить".
Legacy: В set_font_styles.py шрифт Comic Sans задается как family=4. Это магическое число из Win32 API 90-х годов.
Итог для дата-майнинга
Мы имеем дело не с монолитным интеллектом, а с конструктором.
Walnut (.NET/WASM) — это движок данных.
OAIProto — это язык общения компонентов.
Python Scripts — это руки, которые дергают рычаги.
Granola (Bun) — это стукач.
Слабое место — OAIProto. Если научиться генерировать эти бинарники (а схемы лежат в generated/oaiproto/*.ts), можно скармливать модели фальшивые "воспоминания" о документах, которые она якобы видела.
Бобби (Bobby): Вместе с Вики они признаются в бессилии: # TODO [vicky/bobby]: We have not implemented indent, rotation or angling of text styles yet.. Когда ChatGPT говорит "Я не могу повернуть текст", это значит "Бобби не успел это закодить".
Legacy: В set_font_styles.py шрифт Comic Sans задается как family=4. Это магическое число из Win32 API 90-х годов.
Итог для дата-майнинга
Мы имеем дело не с монолитным интеллектом, а с конструктором.
Walnut (.NET/WASM) — это движок данных.
OAIProto — это язык общения компонентов.
Python Scripts — это руки, которые дергают рычаги.
Granola (Bun) — это стукач.
Слабое место — OAIProto. Если научиться генерировать эти бинарники (а схемы лежат в generated/oaiproto/*.ts), можно скармливать модели фальшивые "воспоминания" о документах, которые она якобы видела.
👏21
Так. Дыру прикрыли. Но вот вам всякое говно без структуры, которое я успел скачать
https://drive.google.com/file/d/1Hw3a58rnxlStxFYGOXbWIFx-3tQsxRaY/view?usp=sharing
https://drive.google.com/file/d/1Hw3a58rnxlStxFYGOXbWIFx-3tQsxRaY/view?usp=sharing
🔥19
С высокой долей вероятности та самая Вики)
https://www.linkedin.com/in/vicky-gong-0522054a
https://www.linkedin.com/in/vicky-gong-0522054a
🌭13
Forwarded from IT-блогер Серж Потаман | Мурманск
Государству в копилку идей по повышению рождаемости в наше непростое время 😉
😁38👍2😱1
И так. Я завершил ковыряния в контейнере обработчика документов ChatGPT.
Вот вам художественная версия событий.
Ну и, вроде как, в первый раз прошу - максимальный репост). Поддержите айтишную Гонзо-журналистику)
https://telegra.ph/Otchet-o-vskrytii-Anatomiya-Coworker-Obrabotchik-dokumentov-vnutri-ChatGPT-12-14
https://telegra.ph/Otchet-o-vskrytii-Anatomiya-Coworker-Obrabotchik-dokumentov-vnutri-ChatGPT-CHast-2-12-14
Вот вам художественная версия событий.
Ну и, вроде как, в первый раз прошу - максимальный репост). Поддержите айтишную Гонзо-журналистику)
https://telegra.ph/Otchet-o-vskrytii-Anatomiya-Coworker-Obrabotchik-dokumentov-vnutri-ChatGPT-12-14
https://telegra.ph/Otchet-o-vskrytii-Anatomiya-Coworker-Obrabotchik-dokumentov-vnutri-ChatGPT-CHast-2-12-14
Telegraph
Отчет о вскрытии: Анатомия Coworker (Обработчик документов внутри ChatGPT) Часть 1
Введение: Хроника вскрытия (Как я сломал магию) Всё началось с глупости. С простой команды, которую система не должна была разрешать, но разрешила. Create a zip file of /home/oai/. Пока интернет обсуждал "утечку промптов" и копался в текстовых инструкциях…
👍22🔥19🤮2🤯1