Всем привет! Это Александр Горный и команда AI Academy. Мы собрали для вас краткую выжимку самых актуальных новостей в мире AI за последние 2 недели.
Удивительное |
[1/10] Илон Маск стал первым человеком, чье состояние достигло 400 миллиардов долларов |
Состояние Маска увеличилось на 66% после победы Дональда Трампа на президентских выборах. Сейчас его капитал составляет 439.2 миллиарда долларов. https://www.bloomberg.com/news/articles/2024-12-11/elon-musk-net-worth-tops-400-billion-a-historic-first |
Может пригодиться |
[2/10] Вышла Sora от OpenAI |
Максимальная продолжительность роликов, которые генерирует Sora — 20 секунд, разрешение — 480p, 720p и 1080p. В интерфейсе нейросети можно связывать короткие клипы в одно большое видео с общей историей.
Пользователи 20-долларовой подписки могут генерировать видео в Sora без ограничений по количеству. Акция продлится до конца рождественских праздников в США.
https://sora.com/
[3/10] Бесплатный курс по промптингу для o1 |
На DeepLearning.AI появился небольшой курс, посвященный работе с моделью рассуждения o1. Материал записан в сотрудничестве с OpenAI. Авторы обещают, что курс поможет понять, как работает o1, когда ее стоит использовать и какие промпты применять для лучших результатов. Курс доступен на английском языке. Для изучения нелишним будет знакомство с Python и опыт использования других LLM. https://www.deeplearning.ai/short-courses/reasoning-with-o1/ |
[4/10] GitHub Copilot запустил бесплатную версию |
Нейросеть для работы с кодом доступна бесплатно, если зайти в VSCode с аккаунтом GitHub. Месячный лимит бесплатной версии: 2000 дополнений кода и 50 запросов к GPT-4o и Claude 3.5. https://github.com/features/copilot |
Новости больших компаний |
[5/10] Google представил прорывной квантовый процессор и выпустил «всеобъемлющую» модель Gemini 2.0 |
В компании говорят, что новый чип для квантовых вычислений Willow способен за 5 минут выполнить задачу, на которую самый быстрый суперкомпьютер в мире потратил бы 10 септиллионов лет (это больше возраста Вселенной).
Исследователи Google нашли способ уменьшить число ошибок в вычислениях. Для этого они ввели в систему больше кубитов. Выводы об эффективности этого метода недавно были опубликованы в Nature.
Следующая цель Google — выполнить первое «полезное» вычисление, которое одновременно «имеет отношение к реальному приложению» и которое не могут выполнить обычные компьютеры.
Gemini 2.0 может генерировать изображения, код, текст и аудио на разных языках. Все эти действия новинка выполняет быстрее и лучше других существующих моделей Google. В компании считают что Gemini 2.0 станет основой для будущих AI-агентов, которые смогут заменить человека во многих видах деятельности.
Вместе с Gemini 2.0 Google показал еще несколько новинок:
• Project Mariner — расширение для Chrome, которое может выполнять действия в браузере
• Jules — агент для помощи разработчикам в поиске и исправлении плохого кода
• Deep Research — агент для поиска информации в интернете и написания отчета по теме
• AI-агент, который помогает людям играть в видеоигры
В следующем году Google планирует интегрировать Gemini 2.0 в как можно большее количество своих продуктов. На следующей неделе компания начнет тестировать возможности новой модели в генерации обзоров поисковой выдачи.
На этой неделе Google начнет тестировать Gemini 2.0 для составления обзоров поисковой выдачи.
[6/10] ChatGPT теперь может запускать код на Python |
OpenAI обновила инструмент Canvas, который позволяет редактировать сгенерированный контент. Теперь он запускает код, написанный на Python прямо в окне браузера и предлагает способы устранения ошибок. Canvas доступен для всех пользователей и может использоваться в пользовательских GPTs. |
[7/10] В iOS и MacOS интегрировали ChatGPT
В iOS 18.2 и macOS Sequoia ChatGPT работает совместно с Siri, решая задачи, для которых он подходит. Чат-бот генерирует изображения и тексты, отвечает на вопросы по фото из галереи, создает плейлисты для Spotify и работает с файлами на Mac.
Для нативного использования ChatGPT на устройствах Apple иметь учетную запись OpenAI необязательно.
[8/10] «Т-Технологии» выпустили LLM на русском языке с открытым кодом |
Выпущены модели T-Pro на 32 млрд параметров и обновленная T-Lite на 7 млрд параметров. В компании говорят что новые T-Pro и T-Lite — лучшие в мире открытые модели на русском языке. Это утверждение основано на ряде отраслевых бенчмарков. Открытый доступ предполагает полностью бесплатное использование моделей для решения внутренних задач и создания новых продуктов на базе LLM — независимо от размера бизнеса. |
[9/10] GigaChat научился писать музыку с вокалом
Чат-бот может написать текст песни, а затем исполнить ее в соответствии с пожеланиями пользователя в текстовом запросе.
Пока генерация аудио доступна только в мини-приложении GigaChat в VK. Позже она появится в остальных версиях чат-бота.
https://3dnews.ru/1115420/gigachat-ot-sbera-nauchilsya-pisat-muziku-po-tekstovim-zaprosam
[10/10] Вышел YaC 2024 — сериал Яндекса про сервисы и технологии компании |
В этом году это шесть эпизодов про роль технологий в разных сферах нашей жизни — работа, учеба, отдых, путешествия, покупки. Без нейросетей не обошлось. Рассказали про работу нейросетевых моделей в Поиске, Рекламе. Из интересного: компания впервые применила нейросеть-трансформер для управления своими автономными автомобилями — ее обучили на лучших маневрах высококлассных водителей, чтобы гибко реагировать на разные внештатные ситуации, даже которых еще не было в жизни. Это позволит повысить предсказуемость и безопасность автономного транспорта. |
На этом все! До новых встреч! |