Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный.
Англоязычные инженеры называют эту обвязку harness. Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.
Читать далееВсе началось с прикола, я сидел с друзьями и подумал, а вот было бы прикольно запихать разные модели нейросетей в один чат и заставить их думать, что они реальные люди и работают в корпорации. Весь смысл был в том, чтобы это были действительно разные модели и пользователь мог просто между ними переключаться по запросу. Для начала мне нужно было найти зоопарк апи ключей с бесплатными лимитами. Я прошерстил весь интернет и в итоге нашел относительно норм варианты: Groq для LLama, Google AI Studio для Gemma и Gemini. В целом в это время код был простой, правда все время происходил забавный баг, когда пользователь переключался между моделями, одна модель не хотела отдавать очередь другой и просто притворялась ею, но я в целом без трудностей поправил это через системный промт. Однако до конца у меня исправить это так и не получилось, видимо, мои модели слишком тупые.
Читать далееБизнесу, разработчикам и продуктовым командам уже недостаточно подключить одну нейросеть и считать задачу закрытой. Для текста лучше подходит одна модель, для кода — другая, для изображений — третья, для видео, аудио, 3D и эмбеддингов — отдельные классы решений. Поэтому на первый план выходит не просто API нейросеть, а единый слой доступа, где можно управлять разными моделями через один понятный интерфейс, один баланс и один набор правил интеграции.
AI API ключ нужен, чтобы приложение, сайт, CRM, бот, внутренний сервис или аналитическая система могли обращаться к моделям искусственного интеллекта без ручной работы. Вместо того чтобы каждый раз открывать веб-интерфейс нейросети, пользователь отправляет запрос программно: текст, изображение, аудио, видео, задачу на генерацию кода, поиск смысла в документах или создание 3D-объекта.
Главная ценность такого подхода — скорость внедрения. Команда получает API ИИ, подключает его к своему продукту и начинает строить сценарии: автоматические ответы клиентам, генерацию карточек товаров, проверку кода, создание изображений для витрин, обработку голосовых сообщений, подготовку видео, анализ документов, поиск похожих текстов и многое другое. При этом AI API доступ можно организовать так, чтобы не зависеть от одной модели и быстро переключаться между провайдерами.
Агрегатор ИИ API в России: https://api.ranvik.ru/
Читать далееЭта часть про то, как я пилю бэкенд, учусь на этом и получаю эмоциональные качели.
Для начала, напомню о себе: после 12 лет отсутствия в сфере я решил вернуться к своему базовому образованию – инженер-программист. Что-то приходится «вспоминать с нуля», но я не люблю начинать изучение полностью с теории, я больше экспериментатор.
Читать далееМне приходится периодически кататься на велике. В какой-то момент я решил, что просто кататься - это слишком скучно. Захотелось не просто ездить, но и как-то исследовать окружающий мир.
Я попробовал исследовать окрестности своего квартала на наличие источников WiFi излучения.
Читать далееПолгода использовал Claude, GPT и Cursor как полноценного второго разработчика на Rust в проде. Собрал семь категорий ошибок, которые модели стабильно делают и которые проходят cargo build, cargo test, иногда cargo clippy и при этом являются UB или скрытыми архитектурными ловушками. Lifetime laundering, std::sync::Mutex через .await, Drop у транзакций, unaligned read, async cancellation, orphan rule и массивы на стеке. Разбираю, почему именно Rust ломает LLM и что с этим делать.
Читать далее«Если что-то может пойти не так, это обязательно случится». Мы не пытаемся предотвратить отказ, мы проектируем систему так, чтобы отказ одного элемента не валил конструкцию целиком.
В предыдущих статьях мы разобрали AutoML на задаче о Титанике и показали систему мониторинга моделей. Это были туториалы по компонентам OutBoxML. Сегодня я хочу подняться на уровень выше и поговорить о принципах, на которых эти компоненты и вся система держатся. И поговорить про это через мой опыт в судостроении и страховании.
Читать далееПочему добавление второго consumer«а в очередь может привести к двойным списаниям? Разбираем на реальном кейсе: как один Topic стоил компании 312 дублей за час. »
Сравниваем поведение JMS, Kafka и RabbitMQ, показываем, почему ни одна очередь не даёт exactly‑once из коробки, и как идемпотентность, Dead Letter Queue и правильный выбор канала (команды vs события) делают интеграции надёжными.“
Готовые схемы, продакшен‑код на Java и чек‑лист, который стоит применить прямо сейчас!
Читать разборПрограммирование — это редко про «написать кнопку». Чаще это попытка перевести хаос бизнес-процессов, привычек пользователей и странных требований в систему, которая должна работать стабильно. В статье — реальные истории из легаси, enterprise и автоматизации: DOS-мышление в вебе, Excel как основа бизнеса, реверс-инжиниринг без документации и почему иногда лучший аналитик — оператор с цифровым блоком клавиатуры.
Читать далееПредставь: пятница, вечер. Ты запускаешь CI для последнего пулл-реквеста, идёшь наливать кофе, возвращаешься… а билд упал. Один тест. Ты перезапускаешь проходит. «Флаки», — вздыхаешь ты и ставишь лейбл flaky. На следующей неделе история повторяется. Потом ещё раз.
Мы привыкли, что нестабильные тесты — это неизбежное зло. Их ловят повторными прогонами, а если повезёт вырезают. Но знаешь, что реально бесит? В 80% случаев корень проблемы можно найти, просто посмотрев на код теста.
Я написал инструмент, который это делает автоматически. Без логов CI, без истории прогонов — только AST и машинное обучение.
Назвал его FlakyDetector. Первая версия была исследовательским прототипом (про него у меня выходила статья на Хабре). А теперь — это полноценный продукт: CLI, веб-дашборд, CI-интеграция и даже React-фронтенд. И да, он open source.
Давай разберёмся, как это устроено.
Читать далееБольшинство задач современной робототехники так или иначе завязаны на нейронных сетях: детекция объектов, оценка глубины, локализация, планирование. Всё это ресурсоёмко, и вопрос выбора компактного вычислителя (достаточно часто алгоритмы должны работать локально) встает довольно остро. На практике выбор сводится к трём классам устройств: NVIDIA Jetson, внешний ускоритель (один из самых популярных — Hailo) и китайский (не всегда, конечно, но в современных реалиях обычно китайский) SoC с интегрированным NPU. В этой статье я рассмотрю представителя третьего класса — Axera AX650N, а NVIDIA Jetson будет использоваться для сравнения, так как это единственное массовое edge-решение с универсальными вычислительными ядрами (CUDA).
Это первая часть цикла. Здесь я разберу аппаратную архитектуру самого AX650N — CPU, NPU, DSP, ISP, память — и поделюсь результатами первых тестов: YOLO, Depth Anything, SuperPoint и мультимодальный Qwen3. Подробные бенчмарки и сравнения — во второй части.
Я тестировал AX650N в рамках готового устройства от Sipeed — Maix4 Hat. Он состоит из двух частей: SoM, на котором расположены SoC и 8 GB RAM (2x4 GB, так как у AX650N два отдельных DDR-контроллера), и baseboard от Sipeed с минимальным количеством интерфейсов. Скромность интерфейсов объясняется просто: baseboard — это HAT для Raspberry Pi 5, подключающийся по PCIe 2.0. В такой конфигурации AX650N работает как внешний ML-ускоритель, аналогично Hailo. В рамках этой и последующих статей я буду использовать Maix4 Hat как самостоятельный микрокомпьютер.
Читать далееНа стенде ваши модели обучаются буквально на десятках картинок вместо тысяч, и дают не меньше 86% точности, при этом обходят YOLO — без GPU-кластеров и эмэль‑псевдомагии.
Мы разработали уникальный во всех смыслах слова стенд. И с развитием стенда ML-щики будут ....й не нужны, потому что никаких действий от ML-щиков внутри требоваться не будет. Положите в стенд изображения (десяток‑другой, вместо тысяч), понажимайте кнопки — получите результат.
Чтобы пользоваться нашим стендом, не нужно быть айтишником, а можно – быть кем угодно. Вы можете тренировать модель для себя. Айтишник может пригодиться на этапе наладки отправки данных с вашего приложения, камеры или чего угодно ещё в нашу систему, чтобы мгновенно получать ответ/результат. Либо для разметки данных, потому что у нас этого интерфейса пока еще нет.
Ку-ку!Исключения рождаются не только в основном коде, но и в обработчиках этих самых исключений. Зачастую вопросу не уделяется должного внимания. Действительно, что может пойти не так в блоке catch? Там ведь код тривиальный! Но это только на первый взгляд.
Например, безобидный LOG.warn("...") выливается в десяток вызовов нижележащих методов. И чем больше «наслоений» в библиотеке логгирования, тем выше вероятность сбоя. Всё бы ничего, если бы не одна особенность языка Java…
Читать далееКак получить p‑value ≈ 10⁻¹⁵⁴ там, где его на самом деле нет? Разбираем феномен псевдорепликации при анализе пропорций в single‑cell данных и учимся честно ловить биологический шум. Этот туториал посвящен тому, как работает квази‑биномиальная логистическая регрессия — один из наиболее используемых методов в биоинформатике для поиска клеточных популяций, которые растут или исчезают при старении и развитии заболеваний.
Читать далееВ апреле 2026 года пользователям iPhone стало недоступно пополнение Apple ID с баланса мобильного счета. Учитывая ориентированность устройств на платные сервисы, владельцы «яблок» могут столкнуться с неприятными неудобствами.
Однако не стоит отчаиваться: как и многие другие ограничения последних лет, проблема с оплатой сервисов Apple решается виртуальным «переездом». О том, как подготовить iPhone к смене региона Apple ID, какую страну лучше выбрать и как пополнять счет — разберемся вместе с вами прямо сейчас!
Читать далееПлагин для JetBrains-IDE, который встраивает полноценный Telegram прямо в редактор. Плюс шифрованный шеринг кода, подсветка синтаксиса в теме получателя и магия с метаданными в обычном тексте сообщения. Разбираю изнутри.
Читать далееФотография на паспорт, визу, загранпаспорт, анкету или другой документ кажется простой задачей только на первый взгляд. Нужно ровно встать, не улыбаться, убрать лишние тени, подобрать фон, соблюсти размер, сохранить естественные черты лица и не переборщить с обработкой. Раньше для этого почти всегда приходилось идти в фотоателье, платить за несколько кадров и надеяться, что результат устроит с первого раза.
Сегодня эту задачу можно решить проще: использовать нейросеть для фото на паспорт, загрузить обычный снимок с телефона и получить готовое изображение. ИИ умеет менять фон, выравнивать свет, улучшать резкость, кадрировать фото под нужные пропорции и готовить изображение для печати или загрузки в онлайн-форму.
Читать далееСвадебная фотография в 2026 году — это уже не только работа со светом и ракурсом, но и магия алгоритмов. Сегодня нейросети позволяют не просто отредактировать фото, а полностью переосмыслить кадр: сменить локацию на замок в Провансе, добавить на фото отсутствующих гостей или восстановить детали кружева на платье, которые «съела» камера.
Для невест и женихов нейросеть для свадебных фото дает возможность получить идеальный альбом без бесконечного ожидания ретуши, а для фотографов — способ автоматизировать рутину и добавить кадрам журнального лоска. В этой статье мы собрали ТОП-10 нейросетей, которые помогут создать свадебную эстетику уровня Vogue или восстановить архивные снимки родителей совершенно бесплатно.
Читать далееFlaky‑тесты сложно ловить даже привычными инженерными методами: они ломают CI, подрывают доверие к автотестам и часто воспроизводятся только тогда, когда уже никто не понимает почему. Кажется логичным поручить такую задачу LLM: показать модели код теста и попросить определить, насколько он подозрительный.
В статье разбираем исследование, где этот подход проверили на практике, и смотрим, почему хорошие метрики на датасете ещё не означают, что модель действительно понимает природу flaky‑поведения.
Читать разбор