Синтетические медиа и дипфейки

Новости

Синтетические медиа — это медиа, созданные или модифицированные программами, основанными на искусственном интеллекте и машинном обучении. Другими словами, это медиа, создаваемые с помощью технологий. Синтетических медиа сегодня включают музыку, написанную искусственным интеллектом, генерацию текста, изображения и видео, синтез голоса и другое. 

Появление и развитие синтетических медиа влечет за собой множество проблем. Они нарушают наш способ видения мира и ставят под сомнение факты, наше восприятие изображений, звуков, наши чувства, постепенно изменяя восприятие тел и их цифровой репрезентации. 

Очевидно, что эта технология вызывает также и много этических вопросов, от потенциальных нарушений прав на использование изображения до распространения фейковых новостей и мошенничества. 

Самый известный синоним синтетических медиа — deep fake. Термин deep fake — микс словосочетаний «deep learning» и «fake» — впервые появился в конце 2017 года. С помощью технологии глубокого обучения и генеративно-состязательной сети (GAN) deep fakes обычно накладывают лицо одного человека на лицо другого человека, часто в режиме реального времени. Это позволяет относительно быстро и легко создавать видео, которые манипулируют тем, что мы видим и слышим.

Какие виды синтетические медиа существуют?

  • замена лиц: лицо одного человека заменяется или реконструируется ключевыми чертами лица или лицом другого человека. Изменение лиц с помощью фильтров уже давно используется в социальных сетях. Так, например, фильтры для улучшения лица появились в Snapchat уже в 2014 году. 
  • синхронизация губ (lip sync): техника для воспроизведения движений рта и мимики, чтобы человек на видео говорил что-то своим голосом. Алгоритмы искусственного интеллекта могут обрабатывать существующее видео говорящего человека и изменять движения губ на видео в соответствии с новым звуком. 
  • клонирование голоса: это алгоритм глубокого обучения, который генерирует синтетический голос на основе существующих записей голоса человека. С помощью этой технологии создается своего рода голосовой шрифт для человека, который затем используется для генерации речи. Существует множество приложений и облачных сервисов для разработки синтетического голоса, например, Microsoft Custom Voice, Lyrebird AI, iSpeech и VOCALiD.
  • генерация изображений: метод использования технологии компьютерного зрения, глубокого обучения и генеративных состязательных сетей (GAN) для синтеза новых изображений. С помощью этой технологии можно создавать компьютерное изображение человека или любого объекта, который не является реальным. Примеры от команды NVIDIA на сайте ThisPersonDoesnotExist.com. 
  • генерация текста: метод автоматического создания текста, написания рассказов, прозы и поэзии, создания конспектов длинных документов с помощью рекуррентных нейронных сетей (RNN) и генеративных состязательных сетей (GAN). Так, например, GPT-3 OpenAI может генерировать любой текст, включая табулатуры гитары или компьютерный код.

Польза и вред синтетических медиа

С одной стороны, появление синтетических медиа воспринимается как катастрофа: дипфейки, настоящий маркер эпохи постправды, еще больше подрывают доверие к демократическим институтам и ставят под угрозу безопасность людей. Дипфейки могут использоваться различными государственными и негосударственными акторами для разжигания межнациональной розни и социальной вражды, пропаганды против меньшинств или призывов к насилию. 

С другой стороны, синтетические медиа можно использовать в обучении, архитектуре, кинопроизводстве, журналистике и медицине. Так, например, люди, потерявшие голос из-за тяжелых заболеваний, могут вновь заговорить с помощью специальных приложений, а дипфейки могут оживить исторических персонажей, чтобы сделать процесс обучения более увлекательным. Синтетические медиа порождают новые идеи и условия для расширения прав и возможностей в разных сферах жизни, от искусства и общественной безопасности до инклюзии и бизнеса.

Пока что дипфейки не вызывали политических, экономических или социальных катастроф, даже во время пандемии Covid-19. В то же время распространение синтетических медиа требует незамедлительной разработки и продвижения правил их идентификации и регулирования их использования.

Обложка: https://render.betaworks.com/

Оцените статью
Digital Skills Coalition Belarus