ИИ-агенты, мультимодальный Phi-3 представлены на выставке Microsoft Build 2024

Май 22, 2024

  • Microsoft представила Team Copilot, инструмент для совместной работы, на конференции разработчиков Build
  • Copilot Studio может создавать агентов искусственного интеллекта для автоматизации функций в приложениях
  • Phi-3 Vision расширяет семейство малых языковых моделей Phi-3 за счет изображений и аудиомодальностей

Сатья Наделла использовал свой основной доклад в первый день конференции для разработчиков Build от Microsoft, чтобы объявить о некоторых новых интересных разработках в области искусственного интеллекта, которые скоро станут общедоступными.

Microsoft Build - это ежегодная конференция, на которой разработчики получают возможность ознакомиться с последними разработками в Windows 11 и Microsoft 365. В первый день было представлено несколько интересных инструментов генеративного ИИ.

Команда Copilot

В 2023 году Microsoft выпустила свой Copilot чат-бот, предоставляющий интеллектуальную помощь в режиме реального времени при работе с инструментами Microsoft 365, такими как Word, Excel, PowerPoint, Outlook или Teams.

Наделла объявил о значительном обновлении ИИ в Team Copilot. Команда Copilot расширяется Copilot Из индивидуального личного помощника вы превращаетесь в часть команды, улучшая взаимодействие и управление проектами.

Если вы работаете в команде, используя Microsoft Teams, Microsoft Loop или Microsoft Planner, Team Copilot может способствовать проведению совещаний, управляя повесткой дня и делая заметки. Он может выделять важную информацию, отслеживать действия и решать нерешенные вопросы.

Он даже может выступать в роли менеджера проекта, назначая задания, отслеживая сроки и уведомляя членов команды о необходимости их участия.

Пользовательские агенты второго пилота

Microsoft Copilot Студия позволит вам создавать собственных вторых пилотов, которые действуют как агенты, работающие самостоятельно после того, как вы дадите им указания.

Используя подсказки на естественном языке, вы просто описываете, что должен делать агент, а затем развертываете его на различных платформах.

Microsoft утверждает, что эти агенты могут:

  • Автоматизируйте длительные бизнес-процессы
  • Рассуждайте о действиях и вводимых пользователем данных
  • Используйте память для привнесения контекста
  • Учитесь на основе отзывов пользователей
  • Записывайте просьбы об исключениях и обращайтесь за помощью.

Примером полезности такого агента может служить второй пилот, который, по словам Microsoft, может "выполнять весь процесс выполнения заказа - от приема заказа, его обработки, выдачи интеллектуальных рекомендаций и замены отсутствующих на складе товаров до доставки его клиенту".

Эта функция позволяет создавать виртуальных сотрудников для выполнения таких рутинных задач, как мониторинг электронной почты, ввод данных или другие повторяющиеся задачи, не увеличивая численность персонала.

Фи-3 Вижн

Microsoft добавила мультимодальную модель с 4,2B параметрами в свой Фи-3 семейство малых языковых моделей (SLM). Phi-3 Vision - это недорогая модель с низкой задержкой, обладающая возможностями аудио и зрения и контекстным окном 128k.

Эти небольшие модели предназначены для решений на устройствах, где ограничения по скорости, стоимости, вычислительным ресурсам и возможностям подключения к Интернету делают большие модели непрактичными. SLM Phi-3 демонстрируют превосходные способности к рассуждениям и превосходят несколько более крупных моделей.

Мультимодальные рассуждения на устройстве открывают широкие возможности для применения в здравоохранении, образовании и сельском хозяйстве, особенно в сельской местности, где нет доступа к интернету.

Вы можете попробовать Phi-3 Vision здесь. Он отлично справляется с анализом изображений, извлечением текста и даже переводом.

Результаты бенчмарка Phi-3 Vision в сравнении с другими моделями ИИ. Источник: Microsoft

Усовершенствованная паста

В Windows 11 появился более интеллектуальный способ копирования и вставки. Новая функция Advanced Paste дает вам больше возможностей для данных, которые вы копируете в буфер обмена. При нажатии клавиш Windows Key + Shift + V вам будут предложены варианты вставки в виде обычного текста, в виде разметки или в виде JSON.

Вы также можете ввести описание того, как будет обработан скопированный текст перед вставкой.

Вам понадобится OpenAI Чтобы воспользоваться этой функцией, необходимо иметь в своем аккаунте ключ API и кредиты. Это просто избавит вас от необходимости вставлять текст в ChatGPT и предложите ему отформатировать его там, а затем скопируйте и вставьте его обратно в документ.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения