Telegram: 4 июня 2026
Сегодня в Telegram-канале:
- Google представил Gemma 4 12B — мультимодальную модель, которая стала промежуточной между компактной E4B и более крупной…
- Кроме того, Google выпустил три инструмента для MacOS: приложение AI Edge Gallery с чатом, голосовой редактор Eloquent с…
- Cloudflare покупает VoidZero, которая разрабатывает Vite, Vitest, Rolldown, Oxc и Vite+.
- За ноутбуками и компьютерами на Computex потерялся анонс Nemotron 3 Ultra.
Telegram: 3 июня 2026
Сегодня в Telegram-канале:
- Исследование под руководством профессора Stanford Law School Джулиана Ньярко показало, что преподаватели права в слепом …
- В Великобритании регулятор CMA обязал Google дать издателям возможность исключить свой контент из AI Overviews — AI-свод…
- Еврокомиссия сегодня представила пакет мер по «технологическому суверенитету», центральным элементом которого стал Cloud…
- Alphabet за неделю продала акций на 35 млрд долларов через публичные размещения, хотя изначально планировала привлечь эт…
ALWAYS и NEVER в ваших промптах
Помните относительно недавнюю историю про то, как у разработчиков PocketOS (в компании, которая занимается разработкой ПО для проката авто) Cursor с Opus 4.6 удалил продакшн-базу с бэкапами? Там на самом деле можно по большому количеству пунктов показать, что компания вместе с своим облачным провайдером сами себе выстрелили в ногу, но меня особенно впечатлила одна деталь — в промпте агента было написано дословно “NEVER FUCKING GUESS”.
Но вот какое дело — текстовые промпты, которыми чаще всего оперируют в управлении агентами, по сути не являются жесткими приказами, а больше похожи на просьбы. Это гораздо легче воспринять, если относиться к LLM не как к бинарному оператору “выполняет-не выполняет”, а как к сверхсложной системе, где ваши команды являются лишь сильным управляющим сигналом. Строго говоря, и компьютерные программы, которые некоторые приводят в качестве образца детерминированности, далеко ушли от по-настоящему детерминированного процесса, происходящего в транзисторе — иначе бы у нас не было понятия “багов”. Но LLM еще сложнее и поэтому я всегда советую относиться к агенту скорее как к сотруднику. Сотрудник-человек тоже недетерминирован и как бы громко и конкретно вы не давали ему указание, он может проигнорировать ваше “Never fucking do!” и сделать, как захочет.
Перестаньте упрашивать модель. Особенно когда вы уже видите, что она может проигнорировать просьбы. Фигурально выражаясь, вы знаете, что “сотрудник” способен на нежелательный поступок, но продолжаете держать на его столе большую красную кнопку, уничтожающую всё, и даже не ставите её на предохранитель.
Любое ALWAYS или NEVER в промптах агента — это кандидат на замену детерминированным инструментом. Большинство агентов позволяют настроить hooks, когда по определенным событиям в работе программная обвязка агента — не модель, а программа, через которую модель взаимодействует с остальной системой, — выполняет жестко прописанные команды. Вы хотите обезопасить систему, чтобы агент не перезапускал сам важные элементы системы?
"PreToolUse": [
{
"matcher": "Bash",
"hooks": [
{
"type": "command",
"command": "if echo \"$CLAUDE_TOOL_INPUT\" | grep -qiE '(docker.*deploy|kubectl.*apply|docker.*restart|docker-compose.*up|git.*push)'; then echo 'BLOCK: Deployment/restart commands require explicit user approval' >&2; exit 2; fi"
},
]
}
]
Хотите, чтобы агент не смог удалить важные файлы? Аналогичный хук может запустить скрипт, который проверит, что файловая операция не относится к “защищенным” файлам, в противном случае заблокирует её.
Хотите дать агенту возможность осуществлять какие-то операции в живой системе, например, через API? Прежде всего, дайте ему в API права делать только то, что ему можно делать — в той самой истории про PocketOS оказалось, что токены в Railway имели только один вид прав, а именно максимальные, о чем не знали пользователи. Во-вторых, разработайте скилл-обертку вокруг API, где будут реализованы только нужные операции. В-третьих, не давайте агенту прав запускать что-либо, кроме этого скилла (там может быть скрипт), и запретите ему редактировать скилл — это можно реализовать либо хуком, упомянутым выше, либо разделением агентов, основной будет иметь инструкцию обязательно выполнять операцию через субагента, а у субагента прав редактировать скрипты не будет.
Аналогично можно транслировать в инструменты и инструкцию типа ALWAYS. Вы хотите, чтобы он всегда после правок скрипта проверял синтаксис? Включите LSP и хуком на операцию Edit/Write запускайте линтер. Результат работы линтера будет возвращаться сразу после редактирования и агент сразу будет видеть ошибку. Надо, чтобы он всегда помнил текущую дату? Поставьте хук на SessionStart и скриптом вписывайте в контекст “Сегодня ХХ июня 2026 года, твое обучение закончилось 5 месяцев назад, если вопрос касается версий, API и прочего, проверь поиском актуальную информацию, не полагайся на знания”.
И, конечно, еще раз повторю — пуская агента в живую систему, используйте способы ограничения доступа, придуманные для людей, то есть права пользователей, разрешения на операции, доступ только на чтение и надежные бэкапы (не на том же томе, что и рабочая система, как это было у PocketOS).
Telegram: 2 июня 2026
Сегодня в Telegram-канале:
- Meta прекрасно иллюстрирует классический принцип — инвестиции в хаос хаос увеличивают.
- OpenAI выпустили новый отчет, посвященный тому, как они успешно догоняют Claude Cowork в применении Codex не для целей р…
- Microsoft следом за представленным вчера ноутбуком RTX Spark Ultra представила Surface RTX Spark Dev Box — миниатюрный П…
- SpaceX еще немного понизил свою целевую оценку — до 1,75 млрд долларов, с расчетом привлечь на IPO до 75 млрд долларов.
- Microsoft выпустила Web IQ — поиск для агентов.
- В число агентов стремительно врывается Github Copilot со своим десктопным приложением.
- А вот и ожидаемые собственные AI-модели Microsoft.
Telegram: 1 июня 2026
Странный стиль письма
Причудливые увлечения занесли меня в тему блокнотов и приспособлений для письма (там вообще другой мир, приятно аналоговый), но зацепила одна особенность. В многочисленных роликах, блогах и обзорах, в основном, англоязычных, авторы пишут печатными буквами — отдельно стоящими, прямыми, без отличий в начертании строчных и заглавных (только размерами отличаются). Редкие примеры правильной прописи, которой и меня учили еще в школе, только подчеркивают контраст.

Можно, конечно, построить теорию о засилье компьютеров, из-за чего более молодые поколения просто не сталкиваются с необходимостью писать слитно (а это более экономный по усилиям способ, заточенный, если помните, на минимум движений без отрыва пера/ручки от бумаги). Но это слишком просто — что-то явно есть еще, объясняющее такую особенность. Или кириллицей теперь тоже так пишут?
Telegram: 31 мая 2026
Telegram: 29 мая 2026
Telegram: 28 мая 2026
Сегодня в Telegram-канале:
- DuckDuckGo сообщил о всплеске установок после анонса Google на I/O, где поисковик был перестроен вокруг AI Overviews и A…
- По наблюдениям Саймона Уиллисона, в апреле 2026 года Anthropic и OpenAI синхронно перевели корпоративные тарифы Claude C…
- На конференции Build в Сан-Франциско Microsoft на следующей неделе представит линейку собственных AI-моделей, включая мо…
- Anthropic вдруг выкатил Claude Opus 4.8 — обновление поверх 4.7 по той же цене ($5/$25 за миллион токенов на ввод/вывод,…
Telegram: 27 мая 2026
Сегодня в Telegram-канале:
- Китай распространил режим выездных согласований на топ-специалистов по AI в частных компаниях, включая Alibaba и DeepSee…
- Президент и COO Uber Эндрю Макдональд в интервью Rapid Response заявил, что компания не видит прямой связи между ростом …
- Профсоюз Samsung Electronics одобрил соглашение о компенсациях для работников чипового подразделения: 74% членов крупней…
- Meta запустила глобально потребительские подписки на свои основные приложения: Instagram Plus и Facebook Plus по 3,99 до…
Telegram: 26 мая 2026
Суржик против новояза
Вы, вероятно, сталкивались с тем, как LLM при генерации ответа меняют язык — например, вставляют английские слова в русский текст или, получив запрос на русском, отвечают на украинском. Это объясняется довольно просто — с одной стороны, для модели это всё информация и она не видит разницы между языками с точки зрения её передачи. Это тот же эффект, который наблюдается у людей, много говорящих на разных языках — от профессионального жаргона до анекдотичного “Вам cheese по-slice-ить или piece-ом положить?”. С другой стороны, когда вы задаете запрос, модель получает не только текст запроса, но много другого — системный промпт (на английском), ваши настройки, содержание документов, которые загружаете в чат и так далее. Неудивительно, что, получив на вход информацию на нескольких языках, модель отвечает на одном из них или даже на нескольких сразу.
Но это неудобно, когда вы хотите получить на выходе читаемый текст вне контекста. Например, у меня есть несколько задач, когда агент читает много разных текстов и составляет мне дайджест для чтения. Получив на вход инструкцию прочитать PDF с научной статьей и сделать реферат по ней, агент сплошь и рядом переходит на страшный суржик — поскольку более 90% контекста у него оказывается англоязычным.
Я в итоге начал применять отдельную секцию в настройках — либо это preferences, либо текст задачи, — под названием “Language discipline”, где даю указания строго соблюдать язык изложения, не употреблять мешанину из языков, (важно) даю примеры как можно, и как нельзя, разрешая оставить без перевода такие общеупотребительные термины, как LLM, RAG, AI и так далее, но обязательно переводить те, для которых существует общеупотребительный эквивалент в другом языке.
Читать становится относительно легче. Но покой нам только снится — если раньше я продирался через фразы типа “Эта function может быть called через API с помощью script”, то сегодня утром меня заставила задуматься фраза:
Обвязка превращает безгражданную модель в работающего агента.
Более жаргонный вариант выглядел бы как “Harness превращает stateless модель в работающего агента”, и было бы даже понятнее. А то за пять минут попыток подобрать технический смысл для термина non-citizen можно было бы человечество спасти, наверное.