от qwen
Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная модель зрения-языка, разработанная для высокоточного понимания и рассуждения в тексте, изображениях и видео. Имея 32 миллиарда параметров, она сочетает глубокое визуальное восприятие с продвинутым текстом...