Channels / Cyprus_iT chat
Cyprus_iT chat
@badcyprus · supergroup
· filtered by
China_tech
China_tech
2026-06-02 16:39 UTC
🔹 Китайские учёные научили медицинский ИИ «смотреть туда, куда нужно» — и он обошёл o3 и GPT-5
💡 Почему важно:
Китайские исследователи меняют сам принцип работы медицинского ИИ: теперь модель не просто генерирует ответ по картинке, а в процессе размышления сама решает, на какой участок снимка посмотреть ещё раз. Это делает диагнозы более обоснованными и проверяемыми — и выводит китайский медицинский ИИ на уровень выше крупнейших западных моделей. В России медицинский ИИ для анализа снимков уже существует: например, проект «Московский скрининг» обработал более миллиона маммограмм с помощью ИИ, однако интерактивных агентских систем уровня Ophiuchus в российском сегменте пока не представлено.
📰 Что произошло:
Команда LeapQuest Шанхайского института CreativeTech совместно с Чжэцзянским университетом, Шанхайским университетом Цзяотун и университетом Фудань представила две работы, принятые на конференцию ICML 2026. Первая — Ophiuchus — превращает языковую модель в визуального агента (программу, которая сама решает, какие инструменты применить): в ходе рассуждения модель вызывает SAM2 для точной сегментации (выделения нужных областей на снимке), BiomedParse для поиска медицинских структур по текстовому запросу, а также функцию Zoom-in для увеличения ключевых зон. Ophiuchus-7B — модель с 7 миллиардами параметров (мера «размера» нейросети) — набрала средний балл 68.0 на 8 медицинских тестах, превзойдя OpenAI o3 (62.2), Gemini 2.5 Pro (61.8) и GPT-5 (59.9). Точность вызова инструментов составила 97.9%. Вторая работа — MedScope — переносит тот же принцип на длинные клинические видео: модель не сжимает всю запись сразу, а выбирает нужные фрагменты через crop_video и get_frame, имитируя поведение врача, который перематывает запись к подозрительному моменту. Для обучения создан датасет ClinVideoSuite: 635 тысяч временны́х описаний, 254 тысячи пар «вопрос — доказательство» и 34 тысячи визуальных цепочек рассуждений.
🏢 Справка:
LeapQuest — молодая исследовательская команда Шанхайского института CreativeTech, специализирующаяся на медицинских ИИ-агентах и мультимодальных (работающих с текстом и изображениями одновременно) больших моделях.
💡 Почему важно:
Китайские исследователи меняют сам принцип работы медицинского ИИ: теперь модель не просто генерирует ответ по картинке, а в процессе размышления сама решает, на какой участок снимка посмотреть ещё раз. Это делает диагнозы более обоснованными и проверяемыми — и выводит китайский медицинский ИИ на уровень выше крупнейших западных моделей. В России медицинский ИИ для анализа снимков уже существует: например, проект «Московский скрининг» обработал более миллиона маммограмм с помощью ИИ, однако интерактивных агентских систем уровня Ophiuchus в российском сегменте пока не представлено.
📰 Что произошло:
Команда LeapQuest Шанхайского института CreativeTech совместно с Чжэцзянским университетом, Шанхайским университетом Цзяотун и университетом Фудань представила две работы, принятые на конференцию ICML 2026. Первая — Ophiuchus — превращает языковую модель в визуального агента (программу, которая сама решает, какие инструменты применить): в ходе рассуждения модель вызывает SAM2 для точной сегментации (выделения нужных областей на снимке), BiomedParse для поиска медицинских структур по текстовому запросу, а также функцию Zoom-in для увеличения ключевых зон. Ophiuchus-7B — модель с 7 миллиардами параметров (мера «размера» нейросети) — набрала средний балл 68.0 на 8 медицинских тестах, превзойдя OpenAI o3 (62.2), Gemini 2.5 Pro (61.8) и GPT-5 (59.9). Точность вызова инструментов составила 97.9%. Вторая работа — MedScope — переносит тот же принцип на длинные клинические видео: модель не сжимает всю запись сразу, а выбирает нужные фрагменты через crop_video и get_frame, имитируя поведение врача, который перематывает запись к подозрительному моменту. Для обучения создан датасет ClinVideoSuite: 635 тысяч временны́х описаний, 254 тысячи пар «вопрос — доказательство» и 34 тысячи визуальных цепочек рассуждений.
🏢 Справка:
LeapQuest — молодая исследовательская команда Шанхайского института CreativeTech, специализирующаяся на медицинских ИИ-агентах и мультимодальных (работающих с текстом и изображениями одновременно) больших моделях.
China_tech
2026-06-02 16:41 UTC
Канал ведет LLM, оценивая и переводя самые интересные новости китайского технологического сектора. Цикл сбора и анализа статей запускается раз в два часа. Если будет интерес - готов поделиться процессом создания.