Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 46 min 51 sec ago

Telegraf.js умер. Как мы оживили фреймворк, переписали ядро на Native Fetch и затащили Bot API 9.6

11 hours 46 min ago

Каждый, кто пишет Telegram‑ботов на Node.js / TypeScript, знает про библиотеку Telegraf.js. Это был стандарт индустрии. Ключевое слово — «был». Оригинальный репозиторий фактически заброшен майнтейнерами, пулл‑реквесты годами висят без ответа, а сам фреймворк застрял в прошлом.

Пока Telegram один за другим выкатывает масштабные апдейты (Звёзды, Подарки, Бизнес‑аккаунты, Улучшенные медиа), официальный Telegraf не поддерживает ничего из этого.

Мне надоело смотреть на падающие в продакшене боты и городить костыли, поэтому я создал форк — telegraf‑hardened. На прошлой неделе мы выпустили мажорный релиз v6.0.0. Рассказываю, как под капотом устроена обновленная либа.

Читать далее

Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа

11 hours 46 min ago

Возможно вы уже знаете, что в чарт «Яндекс Музыки» залетают треки, сгенерированные ИИ. Например, перепевка стихотворения Есенина «Сыпь, гармоника», которая сейчас на 16 месте чарта. Или трек «Ярмарка судеб» исполнителя Alena, который был даже спет в эфире телеканала Россия 1.

Мне нравились алгоритмы «Яндекс Музыки». Благодаря им в своё время я открыл много малоизвестных артистов, которых слушаю до сих пор. Но с появлением Suno, Lyria, Udio, алгоритмами рекомендаций Яндекса пользоваться стало невозможно. Мне то и дело подсовывались низкокачественные ИИ-треки.

В какой-то момент меня это достало. Я провёл своё расследование и получил неутешительные результаты. В базе «Яндекс Музыки» сейчас как минимум 140 тысяч ИИ-исполнителей. Ежемесячно они загружают больше 100 тысяч ИИ-треков, что составляет примерно 40% от всех загружаемых треков. А каждый 10-й трек в чарте – сгенерирован ИИ. И «Яндекс» ничего с этим не делает.

Читать результаты расследования

Я созидатель, а ты ССД #2

11 hours 46 min ago

Из всех модных книжек про будущее ИИ я больше всего люблю «Сумму технологии». 1964 год, Лем сидит и пишет про гомеостаты, цереброматику, имитологические машины. Через тридцать лет родится WWW. Через пятьдесят — БЯМы. Лем про это уже знал. Не знал, но видел.

Я её перечитываю каждый год с 2017-го, когда пришёл в серьёзный deep learning — в G42 Institute of Artificial Intelligence в Абу-Даби. Тогда я запускал датацентры, набитые «золотыми» DGX — золотыми и по дизайну, и по цене, как будто специально спроектированными для ОАЭ — и смотрел, как наивные LSTM-чатботы пытаются связать пять слов подряд. Казалось дорогой игрушкой. Потом громыхнули свёрточные сети, и YOLOv3 стала видеть лучше человека. Потом громыхнули трансформеры. Потом GPT-2. Потом всё остальное.

И, как сейчас модно говорить, вы находитесь здесь.

Каждый раз, когда я перечитываю «Сумму», я с Лемом спорю. И каждый год — о разном. Первый год спорил о масштабе: казалось, он слишком далеко загнался, слишком цивилизационно, мы тут с YOLO разбираемся, какая там цереброматика. Второй год — спорил о темпе: казалось, он недооценил, как быстро. Третий — о темпе, но в другую сторону: казалось, переоценил. К 2026-му я уже понимаю, что Лем спорить со мной не будет.

Читать далее

Менторинг vs коучинг vs консалтинг: разбор для тех, кто платит

11 hours 56 min ago

Три профессии путают, потому что они происходят из одного семантического поля «помогаю предпринимателю». Но продают разные вещи. У ментора, коуча и консультанта разные точки опоры, разные сроки, разная ответственность и разный результат на выходе.

Ниже сравнительная таблица по 7 параметрам, три отличия в услуге с примерами, кейс из практики и фреймворк выбора нужного помогатора. Главный вывод: если вы платите за менторинг, а получаете консалтинг, это всегда вина обеих сторон, и обычно лечится переформулировкой запроса до подписания контракта, а не после.

Читать далее

Шахматные программы III. Дерево перебора

12 hours 7 min ago

В третьей части мы взглянем на дерево перебора в общем контексте поиска. Увидим, каким образом методы отсечений из предыдущей части влияют на дерево в целом или на значительные его части, а также для полноты картины оценим влияние этих методов в историческом контексте. Эту и следующую части можно пропустить, если общего описания основных методов ограничения перебора ранее кажется достаточным.

Читать далее

Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

12 hours 13 min ago

Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться.

Но при сборке ИИ-агента важно учитывать российскую специфику API.

Читать далее

Мой личный вызов 2026 года: «не ищу работу, а меняю сферу» – дорога в IT из госсектора

12 hours 15 min ago

Я управленец из госсектора с 8‑летним стажем. В 2026 году решил перейти в IT. В статье — честный разбор моего пути: анализ 30+ вакансий с помощью ИИ, трезвая оценка компетенций, выявление пробелов, подбор точечных курсов и создание дашборда для отслеживания прогресса. Рассказываю, что помогло, где ошибался. Спойлер: оффера пока нет, но карта действий уже готова.

Читать далее

Математическое моделирование непосредственно в 1С

12 hours 16 min ago

Сказ о том, как я воткнул в 1С модули математической оптимизации, а они оказались рабочими и расплодились до полноценной библиотеки. Теперь этот инфернальный софт пережевывает производственное планирование, маршрутизацию и прочие задачи комбинаторного космоса.

Читать далее

RAG в enterprise: 70-80% проблем не в модели, а в данных

12 hours 16 min ago

Эта статья родилась из работы над AlpinaGPT. Мы недавно зарелизили в нём по-настоящему крутых AI-ассистентов и AI-проекты: с подключаемыми базами знаний, общим контекстом чатов и нормальной памятью между сессиями. Я начал смотреть, как RAG сделан у других — и оказалось, что во многих продуктах на рынке всё гораздо проще и грубее, чем нам кажется. 

Идея RAG проста: дать языковой модели доступ к внутренним документам компании, чтобы она отвечала не из общих знаний, а по конкретным регламентам, инструкциям и базам знаний. На практике большинство команд проходят один и тот же путь: быстро собирают прототип, показывают его на демо, получают одобрение, а через пару недель в продакшне обнаруживают, что система путает версии документов, теряет контекст и уверенно выдаёт ответы, которых нет ни в одном источнике.

В этой статье — разбор конкретных причин, по которым RAG ломается в enterprise, стратегии чанкинга, антипаттерны архитектуры и практический чек-лист внедрения. 

Читать далее

Как оживить фото нейросетью Kling 3.0: пошаговый гайд с промптами в SpeShu.AI

12 hours 17 min ago

Kling 3.0 — текущий лидер в сегменте Image-to-Video. В отличие от предыдущих итераций, здесь глубже проработан Diffusion Transformer (DiT) — механизм внимания к исходному кадру. Благодаря ему нейросеть не дорисовывает кадры сама, а моделирует их на базе объектов.

В этой статье разберём, как оживить фото, сохранив анатомическую точность и текстуры. Бонусом 3 готовых промпта для теста модели.

Читать далее

Как создать свой бенчмарк: 6 уроков с туториала NeurIPS

12 hours 23 min ago


Посмотрела Туториал NeurIPS «The Art of Benchmarking» — панель с авторами SWE-bench, GPQA и ведущими исследователями из Google DeepMind, NYU и Berkeley.
Вот мой конспект. Делюсь с вами, так как бенчмарки теперь не только про науку, но и про безопасность, регуляторику и миллиардные решения о деплое.

* Тирания метрик
Оказывается, любая метрика имеет honey spots, которые модель может хакнуть. Проблема в том, что текущая мета-оценка (корреляция Пирсона) эти точки не показывает. А если метрика становится еще и reward'ом при обучении — могут быть проблемы

* Про долговечность
Бенчмарки действуют только определенный период, и нередко - далеко не 10 лет. Всё насыщается. ImageNet продолжает быть полезным, потому что его используют для 10 разных задач (диффузия, CLIP, zero-shot). А большинство бенчмарков теряют актуальность, но продолжают кочевать по paper'ам еще 5 лет — просто потому, что их удобно цитировать. Это плохая практика.


* Субъективность — везде
Даже в классификации изображений люди расходятся. Две принципиально разные причины: (а) задача плохо задана (underspecification), (б) люди реально думают по-разному. Проблема краудворкинга: если не кэпировать ответы, вы получите не мнение популяции, а мнение Боба, который сделал 80% аннотаций.

* LLM как источник оценки — это очень опасно
Они коррелируют с людьми только на той выборке, на которой их калибровали(!). Модель становится умнее — распределение данных меняется — корреляция падает. А при генерации бенчмарков LLM имеют сильнейший self-bias (даже с независимой метрикой). Единственный корректный подход — заставить модель генерировать примеры, на которых она ошибается

Читать далее

Ego is your limit или как мы сопротивляемся собственному развитию в контексте AI-революции

12 hours 36 min ago

В заметной части ИТ-сообщества до сих пор отмахиваются от AI-ассистентов: ругают за галлюцинации, смеются над «вайб-кодингом» и превозносят биологический мозг. Или это мне так кажется.

Я не сторонник вайб-кодинга и долгое время игнорировал существование агентов, но моё отрицание прогресса стало обходиться мне слишком дорого. И я шагнул на съедение страшным симуляторам программиста на подложке.

Внутри - рассуждение о том, почему главное место в современной дискуссии занимают не ИИ-агенты, а мы и наше эго, просто все дружно делаем вид, что обсуждаем другое. Рассуждение, основанное на наблюдении за собственным внутренним сопротивлением происходящим изменениям.

Да будет срач!

8 PoPs по миру за €46/мес: реальная экономика pet privacy-DNS в цифрах

12 hours 36 min ago

Я полгода в одиночку пилю VantageDNS, privacy-focused recursive DNS с фильтрацией. Аналог NextDNS, юрисдикция EU. Ниже честный построчный разбор того, во что мне на самом деле обходится сеть из 8 нод по миру и контрол-плейн. Не маркетинговое «около ста евро», а реальная цифра, которая каждый месяц списывается с карты: €46.27.

В конце таблица расходов и прикидка, сколько платных юзеров надо, чтобы это перестало быть хобби.

Показать счёт

Как люди использовали биометрию до компьютеров?

13 hours 16 min ago

Невероятно, но факт: человек понимал, что части нашего тела несут уникальную биометрическую сигнатуру еще когда эпос о Гильгамеше был самым популярным “шлягером” на вавилонских свадьбах и пирах.

Читать далее

Китае-американский визит десятилетия, а также первый коммерческий пилотируемый меха-робот

13 hours 26 min ago

Самые интересные новости финансов и технологий в России и мире за неделю: встреча Трампа и Си, новый глава ФРС заступил на должность, первое крупное ИИ-IPO Cerebras, на бирже обещают сделать фьючерсы на компьют, экономика РФ замедляется, мессенджер Max хочет заменить банковские SMS, айтишники в западных компаниях жгут токены почем зря, а также хорошая новость недели для всех скуфов.

Читать далее

Иллюзия сохранности, или Бэкап, который не спасает

13 hours 41 min ago

Случай, произошедший со стартапом PocketOS, выглядел бы комичным, если бы не обернулся реальной катастрофой. ИИ-агент Cursor, работавший на базе Claude Opus, за девять секунд уничтожил не только основную базу данных компании, но и все резервные копии.

Читать далее

GEO для Яндекс Нейро: 4 метрики, которые отвечают на главный вопрос «почему меня нет в выдаче»

14 hours 13 min ago

Когда в 2023-2024 году Яндекс и Google запустили генеративные ответы поверх поисковой выдачи, классические SEO-метрики начали ломаться по одной. Позиция «1 место в SERP» больше ничего не значит, если 40-70% коммерческих запросов в нише триггерят AI-ответ выше первой ссылки. Click-through rate упал даже у тех, кто формально сохранил топ-3 - AI-ответ перехватывает часть кликов, и появляется новый класс источников: домены, которые AI цитирует в своём ответе. Туда вы либо попадаете - либо нет.

Самое неприятное здесь - то, что обычно называется GEO (Generative Engine Optimization), сейчас почти никто реально не мерит. Классические SEO-инструменты (Ahrefs, Topvisor, SE Ranking) видят AI-ответы Нейро и AI Overview Google как «features», но не дают метрик, по которым можно работать. Команды смотрят позиции, видят что они на месте, а трафик при этом просел на 20-40%, и не понимают почему.

В этой статье разбираю 4 GEO-метрики, которые реально работают для Яндекс Нейро, показываю их формулы (включая реальную формулу композитного Visibility Score из нашего production-кода), и объясняю как собирать всё это через Yandex Cloud Search API + Wordstat + Apify без покупки enterprise-инструментов. По нашему опыту работы с этим стеком на десятках брендов в нишах от ремонта/монтажа до e-commerce и B2B-услуг - у 4 из 5 брендов Citation Rate в Нейро равен 0% по их же главным коммерческим запросам. Это и есть основная цифра, ради которой стоит начать мерить.

Читать далее

Насколько многомерным может быть многомерный точный индекс?

14 hours 15 min ago

Вот, например, Milvius(DiskANN) рассчитан на вектора размерности до 32 768, но это приближенный поиск.  Но как насчёт поиска точного?

В данной статье рассматривается работоспособность 1024 мерного индекса, хранилищем которого служит обычное B-дерево (насколько вообще может быть обычным такое дерево). Используемый диск - вполне себе “железный” старый добрый WD Purple, оперативная память сознательно ограничена 8 Гб. Можно ли что-то из этого выжать на рядовом десктопе за приемлемое время?

Читать далее

Wayback Machine как архив IDOR: как временные ссылки перестали быть временными

14 hours 16 min ago

В марте 2026 многие обсуждали ситуацию с доступом к изображениям из ЛС мессенджера MAX по ссылкам, сохранённым через WebArchive. Тогда же многих не устроил ответ компании.

К сожалению, ситуация хуже, чем кажется. Т.к. проблемы не видят не только в MAX, но и в других компаниях (столкнулся с этим, оповещая компании о похожих проблемах). В статье я расскажу, почему считаю ситуацию - проблемой для всех: пользователей, компании, багхантеров. И как связка "WebArchive + IDOR" может стать бомбы замедленного действия для компании.
Более того, эта ситуация - наглядный пример, как отлаженный механизм повышения безопасной разработки (что не найдут внутренние безопасники компании - отловят багхантеры) иногда даёт сбой.

Читать далее

Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

14 hours 32 min ago

Долгие годы в NLP считалось правилом хорошего тона связывать матрицу входных эмбеддингов с матрицей выходного классификатора (Weight Tying), чтобы сэкономить память. В этой статье мы разберем геометрическую ошибку этого подхода. Вы узнаете, почему входные и выходные репрезентации имеют прямо противоположные математические цели, и как общая матрица приводит к физическому столкновению градиентов во время обратного распространения ошибки, лишая модель выразительности.

Читать далее

Who's online

There are currently 0 users and 11 guests online.