Агентство кибербезопасности

Рисунок по пересказу и рецепт по фото: нейросети стремительно постигают реальность

Опубликовано at 12:38
443 0

Нейросети учатся чему-то новому каждый день, и навыки, которые они приобретают, становятся все более изощренными. Совместный проект специалистов из Microsoft, университета Олбани и китайской команды JD AI Research позволил научить искусственный интеллект по текстовому описанию создавать рисунок.

То есть, нейросеть читает  «кот играет с мячиком», осознает смысл этой фразы и рисует картинку, ему соответствующую (эксперты АКБ отмечают, что было бы интересно посмотреть, как нейросеть реагирует на более абстрактные словесные конструкции).

Главной проблемой для специалистов было, естественно, нахождение способа, как ИИ  должен выработать связь между словом и изображением и «понимать», как именно взаимодействуют между собой описываемые объекты. Для этого специалистам пришлось создать двухкомпонентную нейросеть, ее еще называют состязательной. Одна часть – генерирует изображение, другая – оценивает насколько они соответствуют описанию.

В настоящее время, по словам специалистов, у нейросети получаются не слишком четкие, часто расплывчатые  изображения и периодически ученые получают и вовсе ошибочные результаты. Однако начало положено.

Еще одно, более курьезное достижение нейросетей (от Facebook): как разобрать блюдо на ингредиенты, «глядя» на его изображение. Особенностью ИИ-алгоритма Recipe1M стал генеративный подход при распознавании изображения. По заявлению разработчиков, нейросеть не только определяет видимые ингредиенты, сравнивая их с уже имеющейся базой данных, но и прогнозирует полный состав блюда, а также способ его приготовления на основе внешнего вида продуктов, подвергнутых разным видам обработки. Затем кодировщик ингредиентов и декодер команд генерируют заголовок для рецепта и выводят итоговый результат в виде инструкции по приготовлению на экран гаджета.

Следует отметить, что по сравнению с базовыми алгоритмами распознавания Recipe1M «предсказывает» неочевидные составляющие готовых продуктов — например, масло в составе круассанов. В перспективе разработчики планируют добавить к списку кулинарных умений нейросети и другие полезные опции — например, счётчик калорий. Очевидно также, что представленный вид обучения ИИ может использоваться для любой задачи, которая требует прогнозирования структурированного текста на основе анализа изображения. А это далеко не только рецепты.

Читайте также на АКБ другие материалы про подвиги машинного обучения:

Нейросеть Google с нуля научилась играть в Quake III и разгромила людей: но стала «лучшим напарником»

Нейросеть воссоздает лицо человека по голосу

Нейросеть Google достраивает движение по первому и последнему кадру

Нейросети сегодня: неэкологично и очень удобно для фейков

Робот из Провиденса нарисовал Мону Лизу и пишет на десяти языках

Related Post

Агентство кибербезопасности

Расплодилось G-Ad’ов: через рекламу Google продвигают вредоносные сайты

Опубликовано - 13.02.2019 0
Рекламными объявлениями Google стали рассадником для злоумышленников, которые продвигают вредоносные сайты под личиной крупных банков. Мошенники обещает пользователям большой выигрыш…
Агентство кибербезопасности

Ирония судьбы – Макафи взломали под Новый год

Энтузиаст криптовалюты и пионер кибербезопасности Джон Макафи заявил, что его учетная запись Twitter была скомпрометирована неизвестным преступником, который использовал его…
Агентство кибербезопасности

Умный с китайцем — братья навек: КНР выводит на еврорынок мегаплатформу RootCloud

Китайская компания Irootech представила новую платформу RootCloud для промышленных умных устройств. В ее структуре заложен достаточно многообразный потенциал, чтобы китайцы…