Схематичное изображение ИИ, анализирующего картинку с помощью визуальных меток — точек и рамок, как будто ведёт пальцем по изображению
Схематичное изображение ИИ, анализирующего картинку с помощью визуальных меток — точек и рамок, как будто ведёт пальцем по изображению

Теперь модель не просто видит, а мыслит через изображение — полезный контекст для коллеги, следящего за развитием ИИ.

DeepSeek научился «думать» по картинкам Ход истории и ключевые факты

Компания DeepSeek запустила режим Vision в своём чате, добавив возможность анализа изображений. Теперь модель может не просто распознавать картинки, но и рассуждать о них, используя так называемые визуальные примитивы — точки, рамки и метки, которые она накладывает на изображение, подобно тому, как человек водит пальцем по строчкам при счёте. Этот подход помогает избежать неточностей, возникающих при словесном описании сложных сцен.

Технология основана на модели DeepSeek-V4-Flash. Чтобы снизить вычислительные затраты, разработчики сжимают визуальную память: каждые четыре визуальных токена объединяются в одну запись. Это делает обработку изображений более эффективной и дешёвой по сравнению с другими мультимодальными моделями.

По результатам тестов в задачах подсчёта объектов и пространственного мышления модель сопоставима с GPT-5.4, Claude Sonnet 4.6 и Gemini 3 Flash. Однако команда подчёркивает, что это узкий набор тестов, заточенный под их разработку. Полные веса модели пока не опубликованы.

Факты

  • 18 июня 2026 года DeepSeek запустил режим Vision в приложении и на веб-версии
  • Модель использует подход «мышление визуальными примитивами» — ставит метки на изображения и рассуждает, как человек, ведущий пальцем по строчкам
  • Технология основана на сжатии визуальной памяти: каждые четыре визуальных токена схлопываются в одну запись
  • На задачах подсчёта и пространственного мышления модель сравнима с GPT-5.4, Claude Sonnet 4.6 и Gemini 3 Flash
  • Полные веса модели пока не опубликованы

Визуальное объяснение новостей от Canto. Инструменты AI могут помогать в производстве. Редакционная политика