Facebook создает ИИ для поиска телефона по звуку — Роботех

Facebook создает ИИ для поиска телефона по звуку

Исследователи Facebook создали новый инструмент с открытым исходным кодом под названием SoundSpaces, предназначенный для так называемого «воплощенного ИИ». Вместо использования статических наборов данных, как в большинстве традиционных методов ИИ, воплощенный ИИ отдает предпочтение подходу, который использует обучение с подкреплением, при котором роботы учатся на своем взаимодействии с реальным, физическим миром. 

В этом случае SoundSpaces позволяет разработчикам обучать виртуальные воплощенные системы искусственного интеллекта в трехмерных средах, представляющих внутренние пространства, с очень реалистичной акустикой, которая может имитировать любой источник звука — например, в двухэтажном доме или на этаже офиса. 

Включение распознавания звука в обучение позволяет системам искусственного интеллекта правильно определять различные звуки, а также угадывать, откуда исходит звук, а затем использовать услышанное в качестве цели, излучающей звук.

В алгоритм подаются данные, полученные при моделировании акустики помещения; например, он может моделировать акустические свойства определенных поверхностей, понимать, как звуки движутся через определенную геометрию комнаты, или предвидеть, как звук распространяется через стены. Поэтому, услышав звук, система ИИ может определить, находится ли излучающий объект далеко или близко, влево или вправо, а затем двигаться к источнику.

Исследовательская группа Facebook поручила системе искусственного интеллекта найти путь в заданной среде, чтобы найти излучающий звук объект, например телефонный звонок, без указания алгоритму какой-либо конкретной цели. Другими словами, виртуальный помощник способен «слышать» и «видеть», а также связываться с различными сенсорными данными для достижения цели, определяемой его собственным восприятием.

Параллельно исследователи выпустили новый инструмент под названием SemanticMapNet, чтобы научить виртуальных помощников исследовать, наблюдать и запоминать неизвестное пространство и таким образом создавать трехмерную карту своего окружения, которую системы могут использовать для выполнения будущих задач.

«Нам пришлось научить ИИ создавать карту пространства сверху вниз, а также создавать эпизодические воспоминания и пространственно-семантические представления трехмерных пространств, чтобы он действительно мог запоминать, где находятся предметы», — сообщил ZDNet научный сотрудник Facebook AI Research Кристен Грауман.

Таким образом, SemanticMapNet позволит роботам сообщать, заперли ли они входную дверь или сколько стульев осталось в конференц-зале на шестом этаже. 

Благодаря протоколу, называемому «подход с прогнозированием занятости», система ИИ может эффективно предсказывать части карты, которые она не наблюдает напрямую. Например, глядя в столовую, робот может предвидеть, что за столом есть свободное пространство или что частично видимая стена простирается до коридора, который находится вне поля зрения.

Новые инструменты, разработанные командой ИИ Facebook, доступны на AI Habitat, платформе моделирования компании, которая предназначена для обучения воплощенных систем ИИ в реалистичных трехмерных средах.

Напомним, что компания Facebook также работает над тем, чтобы научить искусственный интеллект распознавать поддельные видео.

Add a Comment

Ваш e-mail не будет опубликован. Обязательные поля помечены *