339+ активных моделей от 60+ провайдеров
326 моделей
Jamba Large 1.7 — новейшая модель в семействе Jamba open, предлагающая улучшения в области привязки к контексту, следования инструкциям и общей эффективности. Построена на гибридной архитектуре SSM-Transformer с контекстом 256K...
Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и программирование. Она построена на DeepSeek-R1, дополнена дополнительными моделями и методами, такими как Tree...
Aion-1.0-Mini — модель с 32 миллиардами параметров, являющаяся дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, программирование и логика. Это модифицированный вариант...
Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивного ролевого отыгрыша и повествования. Он особенно силен в создании напряжения, кризисов и конфликтов в историях, делая повествование более увлекательным....
Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, варианта Arena-Hard-Auto, специфичного для ролевых игр, где LLM оценивают ответы друг друга. Это дообученная базовая модель...
Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и сценариев продвинутого следования инструкциям. Ее возможности обеспечивают высокую производительность в требовательных оценочных задачах и...
Nova 2 Lite — быстрая, экономичная модель для рассуждений, предназначенная для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста. Nova 2 Lite демонстрирует выдающиеся возможности в обработке...
Amazon Nova Lite 1.0 — очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку входных данных изображений, видео и текста для генерации текстового вывода. Amazon Nova Lite...
Amazon Nova Micro 1.0 — модель, работающая только с текстом, которая обеспечивает наименьшую задержку ответа в семействе моделей Amazon Nova при очень низкой стоимости. С длиной контекста...
Amazon Nova Premier — самая мощная из мультимодальных моделей Amazon для сложных задач рассуждений и в качестве лучшего учителя для дистилляции пользовательских моделей.
Amazon Nova Pro 1.0 — мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого спектра задач. По состоянию на декабрь...
Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Haiku.
Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Sonnet.
Claude 3 Haiku — самая быстрая и компактная модель Anthropic для почти мгновенной реакции. Быстрая и точная целевая производительность. См. объявление о выпуске и результаты бенчмарков [здесь](https://www.anthropic.com/news/claude-3-haiku) #multimodal
Claude Fable 5 — это модель класса Mythos от Anthropic, разработанная для автономной работы со знаниями и программирования. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и...
Эта модель всегда перенаправляет на последнюю модель из семейства Claude Fable.
Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая почти передовые возможности при доле стоимости и задержки более крупных моделей Claude. Соответствует производительности Claude Sonnet 4...
Claude Opus 4 — на момент выпуска является лучшей в мире моделью для кодирования, обеспечивая стабильную производительность в сложных, длительных задачах и рабочих процессах агентов. Она устанавливает новые стандарты в...
Claude Opus 4.1 — обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждений и агентов. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные улучшения...
Claude Opus 4.5 — передовая модель Anthropic для рассуждений, оптимизированная для сложной разработки программного обеспечения, рабочих процессов агентов и длительного использования компьютеров. Она предлагает мощные мультимодальные возможности, конкурентоспособную производительность в реальном кодировании и...
Opus 4.6 — самая мощная модель Anthropic для кодирования и длительных профессиональных задач. Она создана для агентов, работающих в рамках всего рабочего процесса, а не отдельных запросов, что делает ее особенно эффективной...
Вариант Fast-mode [Opus 4.6](/anthropic/claude-opus-4.6) — идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Opus 4.7 — следующее поколение семейства Opus от Anthropic, созданное для длительных асинхронных агентов. Опираясь на сильные стороны Opus 4.6 в кодировании и работе агентов, она обеспечивает более высокую производительность в...
Вариант Fast-mode модели [Opus 4.7](/anthropic/claude-opus-4.7) - идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Claude Opus 4.8 — самая мощная общедоступная модель Anthropic из семейства Opus. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и объемом до 1 миллиона токенов...
Вариант Fast-mode модели [Opus 4.8](/anthropic/claude-opus-4.8) — обладает теми же возможностями, но с более высокой скоростью вывода при удвоенной цене по сравнению с обычной Opus 4.8. Подробнее в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Эта модель всегда перенаправляет на последнюю модель в семействе Claude Opus.
Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя в задачах кодирования и рассуждений с улучшенной точностью и управляемостью. Достигая передовой производительности на SWE-bench (72,7%),...
Claude Sonnet 4.5 — самая продвинутая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает передовую производительность на бенчмарках кодирования, таких как SWE-bench Verified, с...
Sonnet 4.6 — самая мощная модель класса Sonnet от Anthropic на сегодняшний день, с передовой производительностью в области кодирования, агентов и профессиональной работы. Она превосходно справляется с итеративной разработкой, навигацией по сложным кодовым базам, комплексным управлением проектами с...
Coder‑Large — потомок Qwen 2.5‑Instruct с 32 миллиардами параметров, который был дополнительно обучен на общедоступных репозиториях GitHub, CodeSearchNet и синтетических корпусах исправления ошибок. Он поддерживает контекстное окно 32k, позволяя работать с несколькими файлами...
Trinity Large Thinking — это мощная модель рассуждений с открытым исходным кодом от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских задачах и задачах рассуждения. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7...
Trinity Mini — разреженная модель языка с 26 миллиардами параметров (3 миллиарда активных) по принципу «смесь экспертов», включающая 128 экспертов с 8 активными на токен. Разработана для эффективных рассуждений в длинных контекстах (131k) с надежной функцией...
Virtuoso‑Large — топовая универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач междисциплинарных рассуждений, творческого письма и корпоративных QA. В отличие от многих аналогов с 70 миллиардами параметров, она сохраняет 128 k...
ERNIE-4.5-VL-424B-A47B — мультимодальная модель «смесь экспертов» (MoE) из серии ERNIE 4.5 от Baidu, включающая 424 миллиарда общих параметров с 47 миллиардами активных на токен. Она обучена совместно на текстовых и графических данных...
Преобразуйте ваши запросы на естественном языке в структурированные объекты запросов API OpenRouter. Опишите, чего вы хотите достичь с помощью ИИ-моделей, и Body Builder создаст соответствующие вызовы API. Пример:...
Seed 1.6 — универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном 256K.
Seed 1.6 Flash — сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно 256k и может генерировать выходные данные...
Seed-2.0-Lite — универсальный, экономичный рабочий инструмент для предприятий, обеспечивающий мощные мультимодальные возможности и возможности агентов при заметно более низкой задержке, что делает его практичным выбором по умолчанию для большинства производственных рабочих нагрузок по...
Seed-2.0-mini ориентирован на сценарии с чувствительностью к задержке, высокой конкуренцией и стоимостью, делая акцент на быстром отклике и гибком развертывании инференса. Он обеспечивает производительность, сравнимую с ByteDance-Seed-1.6, поддерживает контекст 256k, четыре режима усилий для рассуждений (минимальный/низкий/средний/высокий), мультимодальное понимание,...
UI-TARS-1.5 — мультимодальный агент «зрение-язык», оптимизированный для сред на основе графического интерфейса пользователя, включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Разработанный ByteDance, он основан на фреймворке UI-TARS с использованием обучения с подкреплением...
Command A — модель с открытыми весами и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в сценариях использования агентов, многоязычных задач и кодирования. По сравнению с другими ведущими проприетарными...
command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненным поиском (RAG) и использования инструментов. В более широком смысле, она лучше справляется с математикой, кодом и рассуждениями, а также...
command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с примерно на 50% более высокой пропускной способностью и на 25% более низкой задержкой по сравнению с предыдущей версией Command R+, при сохранении аппаратного следа...
Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложных рассуждений...
North Mini Code — первая агентная модель кода от Cohere и дебют ее семейства North. Разреженная модель "смесь экспертов" с 30 миллиардами общих параметров и 3 миллиардами активных, она оптимизирована...
Cogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучена с использованием самообучения с подкреплением...
DeepSeek-V3 — это новейшая модель от команды DeepSeek, развивающая возможности предыдущих версий в области следования инструкциям и кодирования. Предварительно обучена на почти 15 триллионах токенов, заявленные оценки...
DeepSeek V3, модель Mixture-of-Experts с 685 миллиардами параметров, является последней итерацией флагманской линейки чат-моделей от команды DeepSeek. Она является преемником модели [DeepSeek V3](/deepseek/deepseek-chat-v3) и показывает очень хорошие результаты...
DeepSeek-V3.1 — это большая гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), которая поддерживает режимы мышления и не-мышления с помощью шаблонов промптов. Она расширяет базу DeepSeek-V3 двухфазным длинным контекстом...
DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, далее оптимизируя модель...
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильными возможностями рассуждений и использования инструментов агентами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...
DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с 284 миллиардами общих параметров и 13 миллиардами активных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для быстрой инференции и...
DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с 1,6 триллиона общих параметров и 49 миллиардами активных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для продвинутых рассуждений, кодирования,...
DeepSeek R1 здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны при проходе инференции....
Обновление от 28 мая к [оригинальной DeepSeek R1](/deepseek/deepseek-r1). Производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны....
DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель на основе [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает передовые методы дистилляции для достижения высокой производительности по...
Самый простой способ получить бесплатную инференцию. openrouter/free — это маршрутизатор, который случайным образом выбирает бесплатные модели из доступных на OpenRouter. Маршрутизатор интеллектуально фильтрует модели, которые...
Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Flash.
Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Pro.
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она включает встроенные возможности «мышления», позволяющие ей предоставлять ответы с большей...
Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...
Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с повышенной точностью...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с повышенной точностью...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с повышенной точностью...
Gemini 3 Flash Preview — это высокоскоростная, ценная модель мышления, разработанная для рабочих процессов агентов, многооборотного чата и помощи в кодировании. Она обеспечивает почти про-уровневые рассуждения и использование инструментов...
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для низколатентных, высокообъемных рабочих нагрузок. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов и предназначена для легких агентов...
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по...
Gemini 3.1 Pro Preview — это передовая модель рассуждений Google, обеспечивающая улучшенную производительность в разработке программного обеспечения, повышенную надежность агентов и более эффективное использование токенов в сложных рабочих процессах. Основываясь на мультимодальной основе...
Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда более эффективные сторонние...
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельного выполнения агентами...
Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, что и модели [Gemini](/models?q=gemini). Модели Gemma хорошо подходят для различных...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальный ввод, включая текст, визуальные данные и аудио, что позволяет выполнять различные задачи...
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, при инференции активируется всего 3,8 миллиарда на токен — обеспечивая качество, близкое к 31-миллиардной модели, при...
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, при инференции активируется всего 3,8 миллиарда на токен — обеспечивая качество, близкое к 31-миллиардной модели, при...
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind объемом 30,7 миллиарда параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind объемом 30,7 миллиарда параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...
Granite-4.0-H-Micro — это модель с 3 миллиардами параметров из семейства моделей Granite 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они дообучены для работы с длинными...
Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров, состоящая только из декодера, из семейства Granite 4.1 от IBM. Она поддерживает контекстное окно в 131 тысячу токенов и предназначена для корпоративных задач...
Mercury 2 — это чрезвычайно быстрая модель LLM для рассуждений и первая модель LLM для рассуждений на основе диффузии (dLLM). Вместо последовательной генерации токенов Mercury 2 создает и уточняет несколько токенов параллельно, достигая...
Ling-2.6-1T — это мгновенная (инструктивная) модель от inclusionAI и флагманская модель компании с триллионом параметров, разработанная для агентов реального мира, которым требуется быстрая обработка и высокая эффективность в масштабе. Она использует "быстрый...
Ling-2.6-flash — это мгновенная (инструктивная) модель от inclusionAI с 104 миллиардами общих параметров и 7,4 миллиардами активных параметров, разработанная для агентов реального мира, которым требуются быстрые ответы, высокая производительность и высокая эффективность токенов....
Ring-2.6-1T — это модель для рассуждений масштаба 1 триллиона параметров с 63 миллиардами активных параметров, созданная для рабочих процессов агентов реального мира, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для агентов, занимающихся кодированием, инструментами...
Inflection 3 Pi обеспечивает работу чат-бота Inflection [Pi](https://pi.ai), включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и преуспевает в сценариях, таких как поддержка клиентов и ролевые игры. Pi...
Inflection 3 Productivity оптимизирована для следования инструкциям. Она лучше подходит для задач, требующих вывода в формате JSON или точного соблюдения предоставленных рекомендаций. Она имеет доступ к последним новостям. Для эмоциональных...
KAT-Coder-Pro V2 — это новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, разработанная для сложной разработки программного обеспечения корпоративного уровня и интеграции SaaS. Она основана на сильных сторонах предыдущих версий в области агентурного кодирования,...
LFM2-24B-A2B — это самая большая модель в семействе гибридных архитектур LFM2, разработанная для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных параметров на...
LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель с инструктивным дообучением, созданная для быстрого ИИ на устройствах. Она обеспечивает высокое качество диалогов при размере в 1,2 миллиарда параметров, с эффективным инференсом на периферии и широкой поддержкой времени выполнения.
LFM2.5-1.2B-Thinking — это легкая модель, ориентированная на рассуждения, оптимизированная для агентурных задач, извлечения данных и RAG — при этом она комфортно работает на периферийных устройствах. Она поддерживает длинный контекст (до 32 тысяч токенов) и...
Это серия моделей, разработанных для воспроизведения качества прозы моделей Claude 3, в частности Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) и Opus(https://openrouter.ai/anthropic/claude-3-opus). Модель дообучена поверх [Qwen2.5 72B](https://openrouter.ai/qwen/qwen-2.5-72b-instruct).
Попытка воссоздать многословность в стиле Claude, но не ожидайте такого же уровня связности или памяти. Предназначена для использования в ролевых играх/нарративных ситуациях.
Последний класс моделей Meta (Llama 3) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров, дообученная инструкциями, была оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 70 миллиардами параметров, дообученная инструкциями, оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров, дообученная инструкциями, быстра и эффективна. Она продемонстрировала сильную производительность по сравнению с...
Llama 3.2 11B Vision — это мультимодальная модель с 11 миллиардами параметров, предназначенная для выполнения задач, сочетающих визуальные и текстовые данные. Она преуспевает в таких задачах, как создание подписей к изображениям и...
Llama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и анализ многоязычного текста. Ее меньший размер позволяет ей работать...
Llama 3.2 3B — это многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с использованием новейшей архитектуры трансформера, она...
Llama 3.2 3B — это многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с использованием новейшей архитектуры трансформера, она...
Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель с 70 миллиардами параметров (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...
Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель с 70 миллиардами параметров (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...
Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой...
Llama 4 Scout 17B Instruct (16E) — это языковая модель Mixture-of-Experts (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод...
Llama Guard 4 — это мультимодальная предварительно обученная модель, основанная на Llama 4 Scout и дообученная для классификации безопасности контента. Подобно предыдущим версиям, ее можно использовать для классификации контента как в LLM...
[Microsoft Research](/microsoft) Phi-4 разработана для эффективной работы в сложных задачах рассуждения и может работать эффективно в ситуациях с ограниченной памятью или когда требуются быстрые ответы. При 14 миллиардах...
Phi-4-mini-instruct — это легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах — с акцентом на высококачественные, плотные по содержанию данные для рассуждений. Модель относится к семейству Phi-4...
MiniMax-M1 — это крупномасштабная модель для рассуждений с открытыми весами, разработанная для работы с расширенным контекстом и высокоэффективного инференса. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с пользовательским механизмом "молниеносного внимания", что позволяет ей...
MiniMax-M2 — это компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и агентурных рабочих процессов. Имея 10 миллиардов активированных параметров (230 миллиардов всего), она обеспечивает почти передовую интеллектуальность в области общих рассуждений,...
MiniMax M2-her — это большая языковая модель, ориентированная на диалоги, созданная для иммерсивных ролевых игр, чатов с персонажами и выразительных многоходовых разговоров. Разработанная для поддержания последовательности в тоне и личности, она поддерживает богатые сообщения...
MiniMax-M2.1 — это легкая, современная большая языковая модель, оптимизированная для кодирования, агентурных рабочих процессов и современной разработки приложений. Имея всего 10 миллиардов активированных параметров, она обеспечивает значительный скачок в реальных...
MiniMax-M2.5 — это современная большая языковая модель, разработанная для повышения продуктивности в реальном мире. Обученная в разнообразных сложных реальных цифровых рабочих средах, M2.5 опирается на опыт кодирования M2.1...
MiniMax-M2.7 — это большая языковая модель следующего поколения, разработанная для автономной продуктивности в реальном мире и постоянного совершенствования. Созданная для активного участия в собственном развитии, M2.7 интегрирует продвинутые агентурные возможности через мультиагентные...
MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает ввод текста, изображений и видео с выводом текста, имеет контекстное окно размером 1 миллион токенов и подходит для долгосрочной работы агентов, программирования,...
MiniMax-01 объединяет MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Она имеет 456 миллиардов параметров, с 45,9 миллиардами параметров, активируемых при каждом инференсе, и может обрабатывать контекст...
Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Читайте анонс запуска [здесь](https://mistral.ai/news/mistral-large-2407/)....
Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Читайте анонс запуска [здесь](https://mistral.ai/news/mistral-large-2407/)....
Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов. [Пост в блоге](https://mistral.ai/news/codestral-25-08)
Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная трансформерная модель с 123 миллиардами параметров, поддерживающая контекстное окно 256K. Devstral 2 поддерживает исследование...
Самая большая модель в семействе Ministral 3, Ministral 3 14B предлагает передовые возможности и производительность, сравнимые с ее более крупным аналогом Mistral Small 3.2 24B. Мощный и эффективный язык...
Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная крошечная языковая модель с возможностями обработки изображений.
Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная крошечная языковая модель с возможностями обработки изображений.
Mistral Large 3 2512 — самая мощная модель Mistral на сегодняшний день, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 миллиардом активных параметров (675 миллиардов всего) и выпущенная под лицензией Apache 2.0.
Mistral Medium 3 — это высокопроизводительная языковая модель корпоративного класса, разработанная для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она сочетает в себе передовое рассуждение и мультимодальную производительность при стоимости в 8 раз ниже...
Mistral Medium 3.1 — обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного класса, разработанной для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она сочетает в себе...
Mistral Medium 3.5 — плотная модель с 128 миллиардами параметров, следующая инструкциям, от Mistral AI. Она поддерживает ввод текста и изображений с выводом текста и предназначена для агентных рабочих процессов, кодирования и сложных...
Модель с 12 миллиардами параметров и длиной контекста 128k токенов, созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский,...
Mistral Small 3 — языковая модель с 24 миллиардами параметров, оптимизированная для низкой задержки при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает в себя как предварительно обученные, так и настроенные по инструкциям версии, разработанные...
Mistral Small 3.1 24B Instruct — обновленный вариант Mistral Small 3 (2501), содержащий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в текстовых рассуждениях и...
Mistral-Small-3.2-24B-Instruct-2506 — обновленная модель с 24 миллиардами параметров от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с версией 3.1, версия 3.2 значительно повышает точность...
Mistral Small 4 — следующий крупный релиз в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе сильное рассуждение из...
Официальная версия Mistral с инструкциями, дообученная на [Mixtral 8x22B](/models/mistralai/mixtral-8x22b). Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая непревзойденную экономичность для своего размера. Ее сильные стороны включают: - сильную математику, кодирование,...
Mistral Saba — языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обучена на отобранных региональных...
Voxtral Small — улучшение Mistral Small 3, включающее передовые возможности ввода аудио при сохранении лучшей в своем классе текстовой производительности. Он отлично справляется с транскрипцией речи, переводом и пониманием аудио. Ввод аудио...
Эта модель всегда перенаправляет на последнюю модель в семействе MoonshotAI Kimi.
Kimi K2 Instruct — крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32 миллиардами активных на прямой проход. Она оптимизирована для...
Kimi K2 0905 — сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32...
Kimi K2 Thinking — самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 до агентных рассуждений на длинных горизонтах. Построена на архитектуре Mixture-of-Experts (MoE) с триллионом параметров, представленной в...
Kimi K2.5 — нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемого роя агентов. Построена на Kimi K2 с продолженным предварительным обучением примерно на 15T смешанных...
Kimi K2.6 — мультимодальная модель следующего поколения Moonshot AI, предназначенная для кодирования на длинных горизонтах, генерации UI/UX на основе кодирования и оркестровки мультиагентов. Она обрабатывает сложные сквозные задачи кодирования на Python, Rust и Go, а также...
MoonshotAI: Kimi K2.7 Code — это модель, ориентированная на программирование, из семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения комплексных задач программирования в условиях длинных контекстов. Она использует нативную мультимодальную смесь экспертов...
Самая быстрая модель Morph для редактирования кода. ~10 500 токенов/сек с 96% точностью для быстрых преобразований кода. Модель требует, чтобы подсказка была в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code> <update>{edit_snippet}</update>...
Высокоточная модель Morph для сложных правок кода. ~4 500 токенов/сек с 98% точностью для точных преобразований кода. Модель требует, чтобы подсказка была в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code>...
Одна из самых производительных и популярных дообученных версий Llama 2 13B, с богатыми описаниями и ролевыми играми. #merge
Nex-N2-Pro — это агентная модель "смесь экспертов" от Nex AGI, имеющая 17 миллиардов активных параметров из 397 миллиардов общих. Построенная на архитектуре Qwen3.5, она принимает текстовые и графические входные данные и генерирует...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшее ролевое моделирование, рассуждение, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшее ролевое моделирование, рассуждение, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, гораздо лучшее ролевое моделирование, рассуждение, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 4 — это крупномасштабная модель рассуждений, построенная на Meta-Llama-3.1-405B и выпущенная Nous Research. Она представляет гибридный режим рассуждений, в котором модель может выбирать внутреннюю обработку с...
Hermes 4 70B — гибридная модель рассуждений от Nous Research, построенная на Meta-Llama-3.1-70B. Она представляет тот же гибридный режим, что и более крупный релиз 405B, позволяя модели либо...
Llama-3.3-Nemotron-Super-49B-v1.5 — модель рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, производная от Meta’s Llama-3.3-70B-Instruct с контекстом 128K. Она дообучена для агентных рабочих процессов (RAG, вызов инструментов) через SFT по математике, коду, науке и...
NVIDIA Nemotron 3 Nano 30B A3B — небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью...
NVIDIA Nemotron 3 Nano 30B A3B — небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью...
NVIDIA Nemotron™ 3 Nano Omni — открытая мультимодальная модель 30B-A3B, разработанная для функционирования в качестве подсистемы восприятия и контекста в корпоративных агентных системах. Она принимает текст, изображения, видео и...
NVIDIA Nemotron 3 Super — открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных мультиагентных приложениях. Построена на гибридной Mamba-Transformer...
NVIDIA Nemotron 3 Super — открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных мультиагентных приложениях. Построена на гибридной Mamba-Transformer...
NVIDIA Nemotron 3 Ultra — это открытая модель для передовых рассуждений и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов общих (MoE). Построенная на гибридной архитектуре Mixture-of-Experts (MoE) Transformer-Mamba, она...
NVIDIA Nemotron 3 Ultra — это открытая модель для передовых рассуждений и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов общих (MoE). Построенная на гибридной архитектуре Mixture-of-Experts (MoE) Transformer-Mamba, она...
NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель защиты от вредоносного контента от NVIDIA с 4 миллиардами параметров, дообученная на основе Google Gemma-3-4B. Она модерирует как входные данные, так и ответы от LLM и VLM, принимая...
NVIDIA Nemotron Nano 2 VL — открытая мультимодальная модель рассуждений с 12 миллиардами параметров, предназначенная для понимания видео и анализа документов. Она представляет гибридную архитектуру Transformer-Mamba, сочетающую точность уровня Transformer с возможностями Mamba...
NVIDIA-Nemotron-Nano-9B-v2 — большая языковая модель (LLM), обученная с нуля NVIDIA и разработанная как унифицированная модель как для задач рассуждения, так и для не-рассуждения. Она отвечает на запросы пользователей и...
Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT.
Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT Mini.
GPT Chat Latest указывает на стабильный псевдоним API OpenAI `chat-latest`, который всегда разрешается в последнюю модель чата Instant, используемую в ChatGPT. По мере того, как OpenAI выпускает новые обновления модели Instant...
GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чатов и традиционных задач завершения. Данные для обучения до сентября 2021 года.
GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чатов и традиционных задач завершения. Данные для обучения до сентября 2021 года.
Эта модель предлагает в четыре раза большую длину контекста, чем gpt-3.5-turbo, позволяя обрабатывать примерно 20 страниц текста в одном запросе при более высокой стоимости. Данные для обучения: до...
Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструктивных запросов и исключающим оптимизации, связанные с чатом. Данные для обучения: до сентября 2021 года.
Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультимодальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря более широким общим знаниям и продвинутому рассуждению...
Последняя модель GPT-4 Turbo с возможностями обработки изображений. Запросы на обработку изображений теперь могут использовать режим JSON и вызов функций. Данные для обучения: до декабря 2023 года.
Предварительная версия модели GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и многим другим. Данные для обучения: до декабря 2023 года. **Примечание:** сильно ограничена OpenAI во время...
GPT-4.1 — это флагманская большая языковая модель, оптимизированная для продвинутого следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион токенов и превосходит GPT-4o и...
GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, конкурентоспособную с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% на сложных...
Для задач, требующих низкой задержки, GPT‑4.1 nano — самая быстрая и дешевая модель в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря своему 1 миллиону...
GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...
GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...
Версия GPT-4o от 2024-08-06 предлагает улучшенную производительность в структурированных выходных данных, с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте [здесь](https://openai.com/index/introducing-structured-outputs-in-the-api/). GPT-4o («o» означает «omni»)...
Версия GPT-4o от 2024-11-20 предлагает улучшенную способность к творческому письму с более естественным, увлекательным и адаптированным письмом для повышения релевантности и читабельности. Она также лучше работает с загруженными...
GPT-4o Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...
GPT-4o mini Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.
GPT-5 — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждении, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и точности...
GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-зависимых диалогов для корпоративных приложений.
GPT-5-Codex — это специализированная версия GPT-5, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого выполнения сложных инженерных задач....
GPT-5 Mini — это компактная версия GPT-5, предназначенная для выполнения более простых задач рассуждения. Она обеспечивает те же преимущества в следовании инструкциям и настройке безопасности, что и GPT-5, но с уменьшенной задержкой и стоимостью....
GPT-5-Nano — самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрых взаимодействий и сред с ультранизкой задержкой. Хотя глубина рассуждений ограничена по сравнению с более крупными...
GPT-5 Pro — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждении, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и...
GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильное общее рассуждение, улучшенное соблюдение инструкций и более естественный стиль общения по сравнению с GPT-5. Она использует адаптивное рассуждение...
GPT-5.1 Chat (также известный как Instant) — это быстрый, легкий член семейства 5.1, оптимизированный для чатов с низкой задержкой при сохранении сильного общего интеллекта. Он использует адаптивное рассуждение для выборочного «мышления» на...
GPT-5.1-Codex — это специализированная версия GPT-5.1, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого выполнения сложных инженерных задач....
GPT-5.1-Codex-Max — новейшая агентная модель кодирования OpenAI, разработанная для длительных задач разработки программного обеспечения с большим контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на агентных...
GPT-5.1-Codex-Mini — это меньшая и более быстрая версия GPT-5.1-Codex
GPT-5.2 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильную агентную производительность и производительность в длинном контексте по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического распределения вычислений, быстро реагируя...
GPT-5.2 Chat (также известный как Instant) — это быстрый, легкий член семейства 5.2, оптимизированный для чатов с низкой задержкой при сохранении сильного общего интеллекта. Он использует адаптивное рассуждение для выборочного «мышления» на...
GPT-5.2 Pro — самая продвинутая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности в длинном контексте по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих пошагового рассуждения,...
GPT-5.2-Codex — это обновленная версия GPT-5.1-Codex, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого выполнения сложных инженерных задач....
GPT-5.3 Chat — это обновление наиболее используемой модели ChatGPT, которое делает повседневные разговоры более плавными, полезными и непосредственно помогающими. Она обеспечивает более точные ответы с лучшей контекстуализацией и значительно...
GPT-5.3-Codex — это самая продвинутая агентная модель кодирования OpenAI, сочетающая передовую производительность в области разработки программного обеспечения GPT-5.2-Codex с более широкими возможностями рассуждения и профессиональными знаниями GPT-5.2. Она достигает передовых результатов...
GPT-5.4 — это новейшая пограничная модель OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...
GPT-5.4 mini предоставляет основные возможности GPT-5.4 в более быстрой и эффективной модели, оптимизированной для высокопроизводительных рабочих нагрузок. Она поддерживает ввод текста и изображений с высокой производительностью в области рассуждений, написания кода,...
GPT-5.4 nano — самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для критически важных по скорости и объемных задач. Она поддерживает ввод текста и изображений и предназначена для работы с низкой задержкой...
GPT-5.4 Pro — самая передовая модель OpenAI, построенная на унифицированной архитектуре GPT-5.4 с улучшенными возможностями рассуждений для сложных, ответственных задач. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс....
GPT-5.5 — это пограничная модель OpenAI, разработанная для сложных профессиональных рабочих нагрузок, построенная на основе GPT-5.4 с более сильными рассуждениями, более высокой надежностью и улучшенной эффективностью использования токенов в сложных задачах. Она имеет контекстное окно более 1 миллиона токенов...
GPT-5.5 Pro — это высокопроизводительная модель OpenAI, оптимизированная для глубоких рассуждений и точности в сложных, ответственных рабочих нагрузках. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...
gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, предназначенная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...
gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, предназначенная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...
gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...
gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...
gpt-oss-safeguard-20b — это модель для рассуждений о безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта модель Mixture-of-Experts (MoE) с открытым весом и 21 миллиардом параметров обеспечивает более низкую задержку для задач безопасности, таких как классификация контента, фильтрация LLM и доверие...
Последнее и самое мощное семейство моделей от OpenAI, o1 разработано для того, чтобы тратить больше времени на размышления перед ответом. Серия моделей o1 обучается с использованием крупномасштабного обучения с подкреплением для рассуждений...
Серия моделей o1 обучается с использованием обучения с подкреплением для обдумывания перед ответом и выполнения сложных рассуждений. Модель o1-pro использует больше вычислительных ресурсов для более глубокого обдумывания и предоставления...
o3 — это хорошо сбалансированная и мощная модель в различных областях. Она устанавливает новый стандарт для задач по математике, науке, программированию и визуальным рассуждениям. Она также превосходно справляется с техническим письмом и следованием инструкциям....
o3-deep-research — это передовая модель OpenAI для глубоких исследований, разработанная для решения сложных, многоэтапных исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', что добавляет дополнительные расходы.
OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и программировании. Эта модель поддерживает параметр `reasoning_effort`, который может быть установлен на...
OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), с установленным на высокий уровень параметром reasoning_effort. o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и...
Серия моделей o-series обучается с использованием обучения с подкреплением для обдумывания перед ответом и выполнения сложных рассуждений. Модель o3-pro использует больше вычислительных ресурсов для более глубокого обдумывания и последовательного предоставления...
OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении мощных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует конкурентоспособные рассуждения...
o4-mini-deep-research — это более быстрая и доступная модель глубоких исследований OpenAI, идеально подходящая для решения сложных, многоэтапных исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', что добавляет дополнительные расходы.
OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), с установленным на высокий уровень параметром reasoning_effort. OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении...
Fusion превращает ваш запрос в небольшое многомодельное обсуждение. Группа экспертных моделей (см. ниже) анализирует ваш запрос параллельно с включенным поиском в Интернете и получением данных из Интернета, затем...
Owl Alpha — это высокопроизводительная базовая модель, разработанная для агентных рабочих нагрузок. Нативно поддерживает использование инструментов и задачи с длинным контекстом, демонстрируя высокую производительность в генерации кода, автоматизированных рабочих процессах и выполнении сложных инструкций....
Pareto Router поддерживает ограниченный список мощных моделей для кодирования, ранжированных по [Artificial Analysis](https://artificialanalysis.ai/) процентным показателям кодирования. Установите min_coding_score в диапазоне от 0 до 1 на [плагине pareto-router](https://openrouter.ai/docs/guides/routing/routers/pareto-router#the-min_coding_score-parameter) для управления тем, как...
Perceptron Mk1 (Mark One) — это модель видения и языка Perceptron высочайшего качества для видео и воплощенного рассуждения. Она принимает входные данные изображений и видео в сочетании с запросами на естественном языке и обеспечивает детальное визуальное понимание...
Sonar — легкий, доступный, быстрый и простой в использовании — теперь с цитатами и возможностью настройки источников. Он предназначен для компаний, стремящихся интегрировать легкие функции вопросов и ответов...
Sonar Deep Research — это модель, ориентированная на исследования, предназначенная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора...
Примечание: Ценообразование Sonar Pro включает ценообразование Perplexity search. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать углубленные, многоэтапные запросы с дополнительной расширяемостью, например...
Эксклюзивно доступный через API OpenRouter, новый режим Pro Search в Sonar Pro — это самая передовая система агентного поиска Perplexity. Он предназначен для более глубоких рассуждений и анализа. Ценообразование основано на...
Примечание: Ценообразование Sonar Pro включает ценообразование Perplexity search. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Sonar Reasoning Pro — это первоклассная модель рассуждений, основанная на DeepSeek R1 с Chain of Thought (CoT). Разработана для...
Laguna M.1 — флагманская модель кодирующего агента от [Poolside](https://poolside.ai/), оптимизированная для сложных задач программной инженерии. Разработанная для рабочих процессов кодирования с использованием агентов, она поддерживает вызов инструментов и рассуждения, с контекстным окном 256K...
Laguna M.1 — флагманская модель кодирующего агента от [Poolside](https://poolside.ai/), оптимизированная для сложных задач программной инженерии. Разработанная для рабочих процессов кодирования с использованием агентов, она поддерживает вызов инструментов и рассуждения, с контекстным окном 256K...
Laguna XS.2 — это модель второго поколения в классе размеров XS от [Poolside](https://poolside.ai/), их серии эффективных кодирующих агентов. Она сочетает в себе возможности вызова инструментов и рассуждений с компактным размером, предлагая...
Laguna XS.2 — это модель второго поколения в классе размеров XS от [Poolside](https://poolside.ai/), их серии эффективных кодирующих агентов. Она сочетает в себе возможности вызова инструментов и рассуждений с компактным размером, предлагая...
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион токенов, сочетающую сбалансированную производительность, скорость и стоимость.
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион токенов, сочетающую сбалансированную производительность, скорость и стоимость.
Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131 тыс. токенов, сочетающую сбалансированную производительность, скорость и стоимость.
Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в области программирования и...
Qwen2.5-VL умеет распознавать распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также способен анализировать тексты, диаграммы, значки, графику и макеты в изображениях.
Qwen3-14B — это плотная модель языка с причинно-следственной связью и 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для...
Qwen3-235B-A22B — это модель Mixture-of-Experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров за прямой проход. Она поддерживает бесшовное переключение между режимом «мышления» для сложных рассуждений, математики и...
Qwen3-235B-A22B-Instruct-2507 — это многоязычная модель языка Mixture-of-Experts, настроенная на инструкции, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров за прямой проход. Она оптимизирована для генерации текста общего назначения, включая следование инструкциям,...
Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная модель языка Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждений. Она активирует 22 миллиарда из своих 235 миллиардов параметров за прямой проход и нативно поддерживает до 262 144...
Qwen3, последнее поколение серии больших языковых моделей Qwen, включает как плотные архитектуры, так и архитектуры Mixture-of-Experts (MoE) для превосходства в рассуждениях, многоязычной поддержке и продвинутых агентных задачах. Ее уникальная...
Qwen3-30B-A3B-Instruct-2507 — это модель языка с 30,5 млрд параметров из семейства Qwen, использующая архитектуру Mixture-of-Experts, с 3,3 млрд активных параметров при каждом выводе. Она работает в нережимном режиме и предназначена для высококачественного следования инструкциям, многоязычного понимания и...
Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений с 30 млрд параметров, использующая архитектуру Mixture-of-Experts, оптимизированная для сложных задач, требующих продолжительного многошагового мышления. Модель специально разработана для «режимного мышления», где внутренние следы рассуждений разделены...
Qwen3-32B — это плотная каузальная языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между «режимом мышления» для...
Qwen3-8B — это плотная каузальная языковая модель с 8,2 млрд параметров из серии Qwen3, предназначенная как для задач, требующих интенсивных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между «режимом мышления» для математики,...
Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 млрд параметров и 128 экспертами (8 активных на прямой проход), предназначенная для продвинутой генерации кода, понимания репозиториев масштаба и использования агентами инструментов. Создана на основе...
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования с использованием агентов, таких как вызов функций, использование инструментов и рассуждения в контексте длинных...
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования с использованием агентов, таких как вызов функций, использование инструментов и рассуждения в контексте длинных...
Qwen3 Coder Flash — это быстрая и экономически эффективная версия собственной модели Qwen3 Coder Plus от Alibaba. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов...
Qwen3-Coder-Next — это каузальная языковая модель с открытым весом, оптимизированная для агентов кодирования и локальных рабочих процессов разработки. Она использует разреженную архитектуру MoE с 80 млрд общих параметров и только 3 млрд активированных за...
Qwen3 Coder Plus — это собственная версия Alibaba для открытой модели Qwen3 Coder 480B A35B. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и...
Qwen3-Max — это обновленная версия, основанная на серии Qwen3, предлагающая значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате редких знаний по сравнению с версией от января 2025 года. Она...
Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для ответственных когнитивных задач, требующих глубоких многошаговых рассуждений. За счет значительного увеличения мощности модели и вычислительных ресурсов для обучения с подкреплением, она...
Qwen3-Next-80B-A3B-Instruct — это чат-модель с инструкциями из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...
Qwen3-Next-80B-A3B-Instruct — это чат-модель с инструкциями из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...
Qwen3-Next-80B-A3B-Thinking — это чат-модель из линейки Qwen3-Next с приоритетом на рассуждения, которая по умолчанию выводит структурированные следы «мышления». Она предназначена для сложных многошаговых задач: математических доказательств, синтеза/отладки кода, логики и агентов...
Qwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct нацелена на общее использование в области зрения и языка (VQA, парсинг документов, диаграммы/таблицы...
Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодальных рассуждений в STEM и математике....
Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Она превосходно справляется с восприятием...
Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно справляется...
Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная модель зрения-языка, разработанная для высокоточного понимания и рассуждений в тексте, изображениях и видео. Имея 32 миллиарда параметров, она сочетает глубокое визуальное восприятие с продвинутым текстом...
Qwen3-VL-8B-Instruct — это мультимодальная модель зрения-языка из серии Qwen3-VL, созданная для высокоточного понимания и рассуждений в тексте, изображениях и видео. Она отличается улучшенным мультимодальным слиянием с Interleaved-MRoPE для длительного...
Qwen3-VL-8B-Thinking — это вариант модели Qwen3-VL-8B, оптимизированный для рассуждений, предназначенный для продвинутых визуальных и текстовых рассуждений в сложных сценах, документах и временных последовательностях. Он интегрирует улучшенное мультимодальное согласование и...
Нативная мультимодальная модель зрения-языка серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. Она обеспечивает...
Плюсовые модели нативной мультимодальной серии зрения-языка Qwen3.5 построены на гибридной архитектуре, которая интегрирует механизмы линейного внимания с разреженными моделями Mixture-of-Experts, достигая более высокой эффективности вывода. В различных...
Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает ввод текста, изображений и видео и выдает текстовый вывод, с контекстным окном в 1 миллион токенов. Эта...
Нативная мультимодальная модель зрения-языка Qwen3.5 122B-A10B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. С точки зрения...
Нативная плотная мультимодальная модель зрения-языка Qwen3.5 27B включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировке скорости вывода и производительности. Ее общие возможности сопоставимы с возможностями...
Qwen3.5 Series 35B-A3B — это нативная мультимодальная модель зрения-языка, разработанная с использованием гибридной архитектуры, которая интегрирует механизмы линейного внимания и разреженную модель Mixture-of-Experts, достигая более высокой эффективности вывода. Ее общие...
Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения сильных рассуждений, кодирования и визуального понимания в эффективной архитектуре с 9 млрд параметров. Она использует унифицированный дизайн зрения-языка...
Нативные модели зрения-языка Flash серии Qwen3.5 построены на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. По сравнению с...
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen в Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает ввод текста, изображений и видео...
Qwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую Gated...
Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование начинается...
Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре Mixture-of-Experts с примерно 1 триллионом общих параметров. Она оптимизирована для кодирования с использованием агентов, использования инструментов и...
Qwen 3.6 Plus основана на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженным маршрутизацией Mixture-of-Experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, она обеспечивает...
Qwen3.7-Max — флагманская модель серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и предназначена для рабочих нагрузок, ориентированных на агентов, с особыми сильными сторонами в задачах кодирования, офисных и продуктивных задач,...
Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с выводом текста, опираясь на текстовые возможности серии с комплексным обновлением ее...
Qwen2.5 72B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 привносит следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в кодировании и...
Qwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, специфичных для кода (ранее известных как CodeQwen). Qwen2.5-Coder привносит следующие улучшения по сравнению с CodeQwen1.5: — Значительные улучшения в **генерации кода**, **рассуждениях о коде**...
Reka Edge — это чрезвычайно эффективная мультимодальная модель зрения-языка с 7 млрд параметров, которая принимает ввод изображений/видео + текста и генерирует текстовый вывод. Эта модель специально оптимизирована для обеспечения ведущей в отрасли производительности в понимании изображений,...
Reka Flash 3 — это универсальная, настроенная на инструкции большая языковая модель с 21 миллиардом параметров, разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и вызовом функций. Обладая...
Relace Apply 3 — это специализированная LLM для исправления кода, которая объединяет предлагаемые ИИ правки непосредственно в ваши исходные файлы. Она может применять обновления из GPT-4o, Claude и других в ваши файлы по...
Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возвращает релевантные файлы в ответ на запрос пользователя. В отличие от RAG, relace-search выполняет агентные действия...
Реконструкция оригинальной модели MythoMax-L2-B13 с обновленными моделями. #merge
Fugu Ultra — это модель с более высокой производительностью в семействе Fugu от Sakana AI. Вместо одной монолитной модели, Fugu представляет собой обученную систему оркестрации нескольких агентов: языковую модель, обученную маршрутизировать...
Lunaris 8B — универсальная модель общего назначения и ролевых игр на базе Llama 3. Это стратегическое слияние нескольких моделей, разработанное для балансировки креативности с улучшенной логикой и общими знаниями....
Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).
Euryale L3.1 70B v2.2 — модель, ориентированная на креативные ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).
Euryale L3.3 70B — модель, ориентированная на креативные ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).
Step 3.5 Flash — самая мощная модель с открытым исходным кодом от StepFun. Построенная на разреженной архитектуре Mixture of Experts (MoE), она активирует только 11 миллиардов из своих 196 миллиардов параметров на токен....
Шаг 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу с 196 миллиардами параметров и визуальный энкодер для нативного понимания изображений и видео, активируя примерно 11 миллиардов параметров...
Маршрутизатор Switchpoint AI мгновенно анализирует ваш запрос и направляет его к оптимальному ИИ из постоянно развивающейся библиотеки. По мере развития мира LLM наш маршрутизатор становится умнее, гарантируя, что вы...
Hunyuan-A13B — языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует конкурентоспособные результаты в бенчмарках...
Hy3 preview — высокоэффективная модель Mixture-of-Experts от Tencent, предназначенная для агентных рабочих процессов и производственного использования. Она поддерживает настраиваемые уровни рассуждений через отключенный, низкий и высокий режимы, позволяя ей...
Нецензурированная и креативная модель для письма на основе Mistral Small 3.2 24B с хорошей памятью, соблюдением инструкций и интеллектом.
Rocinante 12B предназначен для увлекательного повествования и богатого прозаического стиля. Ранние тестировщики сообщали о: - Расширенном словарном запасе с уникальными и выразительными словами - Повышенной креативности для ярких повествований -...
Skyfall 36B v2 — улучшенная версия Mistral Small 2501, специально доработанная для повышения креативности, нюансированного письма, ролевых игр и связного повествования.
UnslopNemo v4.1 — последнее дополнение от создателя Rocinante, предназначенное для приключенческого письма и ролевых сценариев.
Solar Pro 3 — мощная языковая модель Mixture-of-Experts (MoE) от Upstage. Имея 102 миллиарда общих параметров и 12 миллиардов активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении вычислительной эффективности. Оптимизирована...
Venice Uncensored Dolphin Mistral 24B Venice Edition — доработанный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель предназначена как «нецензурированный» LLM с инструкциями, сохраняющий...
WizardLM-2 8x22B — самая продвинутая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и последовательно превосходит все существующие передовые модели с открытым исходным кодом. Она...
Palmyra X5 — самая продвинутая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов в масштабах предприятия. Она обеспечивает ведущую в отрасли скорость и эффективность при работе с контекстными окнами до 1 миллиона...
Grok 4.20 — модель рассуждений от xAI с ведущей в отрасли скоростью и возможностями вызова агентных инструментов. Она сочетает в себе самый низкий уровень галлюцинаций на рынке со строгим соблюдением инструкций, обеспечивая...
Grok 4.20 Multi-Agent — вариант Grok 4.20 от xAI, предназначенный для совместных, основанных на агентах рабочих процессов. Несколько агентов работают параллельно для проведения глубоких исследований, координации использования инструментов и синтеза информации...
Grok 4.3 — модель рассуждений от xAI. Она принимает текстовые и графические входные данные с текстовым выводом и подходит для агентных рабочих процессов, задач следования инструкциям и приложений, требующих высокой фактической точности...
Grok Build 0.1 — это быстрая модель кодирования от xAI, специально обученная для рабочих процессов разработки агентного программного обеспечения. Она поддерживает ввод текста и изображений с выводом текста и оптимизирована для интерактивного кодирования...
MiMo-V2.5 — нативная омнимая модель от Xiaomi. Она обеспечивает агентную производительность уровня Pro примерно за половину стоимости инференса, превосходя MiMo-V2-Omni в мультимодальном восприятии при обработке изображений и видео...
MiMo-V2.5-Pro — флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентных возможностях, сложном программном инжиниринге и задачах с длительным горизонтом, занимая лидирующие позиции в таких бенчмарках, как ClawEval, GDPVal и SWE-bench Pro....
GLM-4.5 — наша последняя флагманская базовая модель, специально разработанная для приложений на основе агентов. Она использует архитектуру Mixture-of-Experts (MoE) и поддерживает длину контекста до 128 тысяч токенов. GLM-4.5 обеспечивает значительно...
GLM-4.5-Air — облегченный вариант нашего последнего семейства флагманских моделей, также специально разработанный для приложений, ориентированных на агентов. Как и GLM-4.5, он использует архитектуру Mixture-of-Experts (MoE), но с более компактным набором параметров...
GLM-4.5V — базовая модель зрения-языка для мультимодальных агентных приложений. Построенная на архитектуре Mixture-of-Experts (MoE) с 106 миллиардами параметров и 12 миллиардами активированных параметров, она достигает передовых результатов в понимании видео,...
По сравнению с GLM-4.5, это поколение приносит несколько ключевых улучшений: Более длинное контекстное окно: Контекстное окно расширено с 128 тысяч до 200 тысяч токенов, что позволяет модели обрабатывать более сложные...
GLM-4.6V — большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на изображениях, документах и смешанных медиа. Она поддерживает до 128 тысяч токенов, обрабатывает сложные макеты страниц...
GLM-4.7 — последняя флагманская модель Z.ai, с улучшениями в двух ключевых областях: расширенные возможности программирования и более стабильные многошаговые рассуждения/выполнение. Она демонстрирует значительные улучшения в выполнении сложных агентных задач, в то время как...
Являясь моделью класса 30B SOTA, GLM-4.7-Flash предлагает новый вариант, который обеспечивает баланс между производительностью и эффективностью. Она дополнительно оптимизирована для использования в агентных кодировочных сценариях, укрепляя возможности кодирования, планирование задач с длительным горизонтом,...
GLM-5 — флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и агентных рабочих процессов с длительным горизонтом. Созданная для опытных разработчиков, она обеспечивает производительность производственного уровня при выполнении крупномасштабных задач программирования, конкурируя с ведущими...
GLM-5 Turbo — новая модель от Z.ai, разработанная для быстрой инференции и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных агентных рабочих процессов...
GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в обработке задач с длительным горизонтом. В отличие от предыдущих моделей, построенных на основе взаимодействий на уровне минут, GLM-5.1 может работать независимо и непрерывно над...
GLM 5.2 — это крупномасштабная модель рассуждений от Z.ai. Она поддерживает ввод и вывод текста с контекстным окном в 1 миллион токенов и подходит для рабочих процессов агентов с длительным горизонтом, проектирования программного обеспечения на уровне проекта,...
GLM-5V-Turbo — первая нативная мультимодальная модель Z.ai для агентов, созданная для написания кода на основе изображений и выполнения задач, управляемых агентами. Она нативно обрабатывает входные данные в виде изображений, видео и текста, превосходно справляется с долгосрочным планированием, сложным кодированием,...