Всем привет! Это Александр Горный и команда AI Academy. Мы собрали для вас краткую выжимку самых актуальных новостей в мире AI за последние 2 недели.
Может пригодиться
[1/12] GPT-4o обновилась |
В OpenAI говорят что тексты стали креативнее и естественнее. Также GPT-4o теперь лучше работает с загруженными файлами, давая на вопросы по ним более подробные ответы. Уже появилась у нас в aiacademy.me. |
[2/12] В WhatsApp появится бесплатная расшифровка голосовых сообщений |
Функция станет доступна всем пользователям в ближайшие недели. Заявлена поддержка русского языка. https://faq.whatsapp.com/241617298315321 |
[3/12] Google Play назвал лучшие приложения и игры 2024 года |
Лучшее приложение года — платформа для планирования мероприятий Partiful. Лучшая игра года — AFK Journey. Лучшее мультиплатформенное приложение — клиент видеостриминга Max. Лучшая мультиплатформенная игра года — Clash of Clans. https://blog.google/products/google-play/google-play-best-apps-games-2024/ |
[4/12] Вышла Suno v4 |
Качество музыки повысилось, а тексты песен и обложки к ним стали креативнее. Попробовать можно здесь: https://suno.com/ |
Будущее рядом |
[5/12] OpenAI делает AI-агента, который сможет управлять компьютером |
Агент с рабочим названием Operator сможет управлять компьютером для выполнения действий от имени человека, таких как написание кода или бронирование билетов и отелей. Источники Bloomberg говорят, что предварительная версия Operator выйдет в январе следующего года. Недавно аналогичного AI-агента представил Anthropic и мы об этом писали. |
[6/12] Китайская компания DEEP Robotics показала робота, способного быстро передвигаться по пересеченной местности
[7/12] Стартап Tessl привлек 125 миллионов на создание AI для написания и поддержки кода |
Основная идея лондонского стартапа в том, чтобы разработчики и их команды, в том числе, непишущие код менеджеры, давали AI спецификацию на естественном языке, а он писал за них код. По мере необходимости спецификацию можно менять, а Tessl будет автоматически поддерживать код, генерируя обновления. В первое время Tessl будет работать с Java, Javascript и Python, позже добавится больше языков. Основатель стартапа считает, что его продукт сможет интегрироваться с другими AI-ассистентами для разработчиков, такими как Cursor, Magic и Copilot и обновлять код, который они написали. |
В недавнем раунде Tessl, по данным разных источников, оценили в 500 -750 миллионов долларов.
[8/12] ChatGPT превзошел врачей в диагностике заболеваний |
Медицинский журнал JAMA Network Open опубликовал результаты исследования возможностей ChatGPT в диагностике заболеваний. В эксперименте приняли участие врачи из США, которым нужно было рассмотреть 105 реальных. ранее нигде не опубликованных случаев. Врачи, использовавшие ChatGPT в процессе постановки диагноза, в среднем получили 76 баллов из 100, а врачи, которым не разрешили применять чат-бот, получили 74 балла. |
Успешнее всех в эксперименте оказался сам ChatGPT, который без помощи человека ставил диагноз на основе медицинского отчета о здоровье пациента. Он набрал 90 баллов.
Новости больших компаний
[9/12] ElevenLabs запустил возможность создания голосовых чат-ботов |
Чат-боты работают на основе сторонней LLM Gemini, GPT, Claude или собственной модели создателя.
Для бота можно задать тон ответов, настроить голос и загрузить собственную базу знаний.
Кроме того, AI сможет собирать данные клиентов, которые с ним общаются, такие как имя и email.
[10/12] Mistral выпустил модель Pixtral Large и обновил Le Chat |
Pixtral Large кроме текста распознает изображения и PDF. Контекстное окно новой модели — 128 тысяч токенов. В некоторых тестах Pixtral Large обходит Claude Sonnet 3.5 и GPT-4o. Для исследовательских целей новинка доступна бесплатно, для остальных — за деньги.
Чат-бот Le Chat теперь может искать информацию в интернете и генерировать картинки через модель Flux. Также появился режим Canvas, который позволяет выделять отдельные фрагменты текста или кода и задавать по ним вопросы нейросети.
https://mistral.ai/news/pixtral-large/
[11/12] В Китае выпустили конкурента модели o1 от OpenAI |
Компания DeepSeek выпустила предварительную версию модели рассуждений DeepSeek-R1, которая, по их словам, составит конкуренцию модели o1 от OpenAI. Сейчас в DeepSeek утверждают что предварительная версия их модели работает наравне с o1-preview. В DeepSeek обещают открыть исходный код DeepSeek-R1 и сделать для нее API. https://techcrunch.com/2024/11/20/a-chinese-lab-has-released-a-model-to-rival-openais-o1/ |
Забавное
[12/12] Роботы смогли договориться |
Робот из клиники позвонил пациенту, чтобы напомнить о записи и попал на его телефонного робота. Судя по стенограмме, машины смогли договориться без вмешательства человека. |
На этом все! До новых встреч!