Новости AIAcademy

Всем привет! Это Александр Горный и команда AI Academy. Мы собрали для вас краткую выжимку самых актуальных новостей в мире AI за последние 2 недели.
Может пригодиться
[1/12] QwQ-32B: новая модель от Alibaba, сопоставимая с DeepSeek-R1

Модель доступна как для коммерческого, так и для исследовательского использования, позволяя компаниям напрямую интегрировать ее в продукты и приложения, в том числе платные.

Alibaba заявляет, что QwQ-32B превосходит OpenAI o1-mini и конкурирует с DeepSeek-R1 по производительности в задачах, связанных с математическими рассуждениями, кодированием и общим решением проблем.

Подробнее о новой модели от Alibaba можно прочитать здесь: https://aiacademy.me/blog/tpost/alldthf8u1-qwq-32b-novaya-bolshaya-yazikovaya-model

QwQ-32B уже доступна в https://aiacademy.me/

[2/12] Вышла GPT-4.5

GPT-4.5 обучена с использованием большей вычислительной мощности и количества данных, чем любая из предыдущих моделей OpenAI. Ответы модели стали креативнее «живее» и эмоциональнее, чем у ее предшественниц. А еще она лучше пишет код и меньше подвержена галлюцинациям.
Запуск GPT-4.5 стоит дорого, так что в OpenAI не уверены, сохранят ли доступ к ней через API в долгосрочной перспективе. Пользователям новинка обойдется в 75 долларов за миллион входных токенов и 150 долларов за миллион токенов на выходе.

Доступна в https://aiacademy.me/

[3/12] Бесплатный ассистент для программистов от Google

Google запустил предварительную версию Gemini Code Assist для частных лиц. Разработчики могут интегрировать AI в свою кодовую базу и общаться с ним через чат-бот, проверяя и дополняя код.

Code Assist для частного использования имеет контекстное окно на 128 тысяч токенов и позволяет сделать 180 тысяч дополнений кода в месяц, что в 90 раз больше чем на бесплатном тарифе GitHub Copilot.

Глава разработки Code Assist заявил, что цель бесплатного тарифа — привлечь разработчиков на ранних этапах карьеры, чтобы позже перевести их на платную версию продукта.

Будущее рядом
[4/12] Два разговорных AI опознали друг друга и переключились на протокол передачи данных на уровне звука

[5/12] Представлен компьютер с клетками человеческого мозга

Австралийская компания Cortical Labs показала CL1 — первый в мире настольный компьютер, использующий для вычислений живые клетки человеческого мозга. Нейронные клетки выращены в лаборатории и объединены с кремнием, их жизнь поддерживает система, похожая на биореактор.

В Cortical Labs называют CL1 новой формой жизни и заявляют, что по производительности и энергоэффективности он опережает традиционные чипы, использующиеся для обучения нейросетей.

Коммерческие поставки CL1 должны начаться во второй половине 2025 года. Стоимость одного устройства — 35 тысяч долларов. Также компания собирается продавать доступ к CL1 в облаке.

https://newatlas.com/brain/cortical-bioengineered-intelligence/

Новости больших компаний
[6/12] Яндекс выпустил YandexGPT 5 Pro и Lite с открытым кодом

В компании заявляют, что новое поколение генеративных текстовых моделей YandexGPT 5 существенно превосходит аналоги прошлого поколения. В некоторых типах задач, например в написании и суммаризации текстов, YandexGPT 5 Pro не уступает GPT-4o и другим лидерам.

YandexGPT 5 Pro доступна пользователям в режиме чата с Алисой, а компаниям — в Yandex Cloud AI Studio.

[7/12] Wan2.1 — опенсорсный AI для генерации видео от Alibaba

Модель может генерировать видео по тексту и изображениям.

Wan 2.1 вышла в двух размерах: 14B и 1.3B. Меньшая требует чуть больше 8 ГБ видеопамяти и способна работать на видеокартах из потребительского сегмента.

Код: https://github.com/Wan-Video/Wan2.1/

[8/12] Google откажется от SMS-кодов для аутентификации
Представитель Google рассказал журналистам, что в компании считают получение кодов через SMS небезопасным и хотят снизить зависимость от этого способа передачи сообщений.

К концу 2025 года на смену кодам из SMS придут QR-коды, которые нужно будет сканировать камерой смартфона, чтобы авторизоваться на сервисах Google.

[9/12] ElevenLabs выпустил AI для перевода речи в текст

Scribe поддерживает 99 языков, в числе которых есть русский, распознает интонации и размечает спикеров.

Модель доступна в вебе и через API. Час транскрибации стоит 40 центов.

https://elevenlabs.io/speech-to-text

[10/12] Microsoft закрывает Skype

Microsoft окончательно закроет Skype в мае 2025 года. СМИ выяснили это благодаря фрагменту кода в последней версии приложения. В нем содержится следующее сообщение:
«Начиная с мая Skype больше не будет доступен. Продолжайте звонить и общаться в Teams».

[11/12] Sesame представила реалистичного голосового ассистента

Голосовой AI от Sesame реагирует на эмоции собеседника, меняет тон в соответствии с ситуацией и делает паузы, естественные для человеческой речи. В будущем компания планирует выпустить очки для постоянного ношения со встроенным AI-ассистентом,

Один из основателей Sesame — Брендан Ирибэ, создатель VR-гарнитуры Oculus. Компания уже привлекла инвестиции от Andreessen Horowitz, Spark Capital и Matrix Partners, объем которых не раскрывается.

Послушать можно тут, попробовать тут.

Забавное
[12/12] Игра про Марио — новый бенчмарк для нейросетей

Организация исследователей Hao AI Lab из Калифорнийского университета протестировала популярные языковые модели на умение играть в Super Mario Bros.

Для теста использовался фреймворк GamingAgent, который давал LLM базовые инструкции и показывал игру покадрово. В Hao говорят, что AI пришлось планировать сложные маневры и разрабатывать стратегию для прохождения игры.

Лучше всех с Mario справился Claude 3,7 Sonnet, а хуже всех себя показали рассуждающие модели, такие как o1.

Тестирование LLM в играх прокомментировал сооснователь OpenAI Andrej Karpathy. Он рассказал, что видит «кризис оценки нейросетей» и не знает, какой бенчмарк сейчас показывает, насколько хороша та или иная модель.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *