пятница, 30 августа 2024 г.

Alibaba выпустила семейство языковых моделей vision language Qwen2-VL на базе Qwen-2. Семейство Qwen2-VL включает три модели: Qwen2-VL-72B, Qwen2-VL-2B и Qwen2-VL-7B. Qwen2-VL-2B и Qwen2-VL-7B доступны под лицензией Apache 2.0, а Qwen2-VL-72B через официальный API.Meer tonen Qwen2-VL-72B превосходит OpenAI GPT-4o-0513 и Claude 3.5 Sonnet в большинстве тестов. Qwen2-VL может понимать видео продолжительностью более 20 минут и отвечать на вопросы на основе видео. Модель Qwen2-VL-7B превосходит OpenAI GPT-4o mini в большинстве тестов и поддерживает входы изображений, нескольких изображений и видеосигнала. Qwen2-VL-2B предназначена для использования на смартфонах и обеспечивает высокую производительность при работе с изображениями, видео и восприятии многоязычных текстов. Модели Qwen2-VL-7B и Qwen2-VL-2B с открытым исходным кодом интегрированы с Hugging Face Transformers, vLLM и другими сторонними платформами.
https://vk.com/rutechspot#7b1b96738b7871adca92564f2f41f3d3

Комментариев нет:

Отправить комментарий