Бум на нейросети, несмотря на затишье, никуда не исчез. По-прежнему появляются новые, интересные ИИ-сервисы, облегчающие работу и творчество в разных сферах. В статье рассказываем о новинках этой осени, которые пригодятся при создании различных креативов — не только в арбитраже, но и в творческой жизни.
HeyGen — качественные дипфейки на иностранных языках
HeyGen — генеративная нейросеть от компании OpenAI для распознавания в видео речи и перевода ее на другой язык. Это не основная функция сервиса, но именно благодаря ей HeyGen стал популярен.
Основанная пару лет назад Джошуа Сюй и Уэйном Ляном, платформа под названием Movio предназначалась для создания видео с AI-аватарами и наложенными голосами. Эта концепция сохранилась, только позже добавили инструменты озвучивания текстов на разных языках, распознавания голоса и создания дипфейков с сохранением мимики персонажа. В сентябре 2023 года уже под названием HeyGen разработчики представили расширенную по функционалу бета-версию.
Особенности HeyGen
- Создание видео под различные задачи — рекламу, презентации, обучалки, ролики для соцсетей;
- Выбор аватара для ролика из предлагаемых вариантов 100+ рас, возрастов и имиджей. Под каждый аватар разработаны уникальные эмоции, мимика и жесты;
- Выбор более чем 50 голосов с переводом на популярные языки и диалекты. Среди доступных языков: английский, французский, немецкий, испанский, итальянский, голландский, португальский, китайский, японский и хинди.
Возможности перевода и озвучивания на русском пока нет, но с русского на другие языки переводить можно.
Также пользователи получают следующие возможности:
- Настройка скорости, тональности и голосовой интонации с дополнительным выбором пауз и ударений в речи;
- Подбор фона из коллекции HeyGen или использование собственного, загруженного с компьютера;
- Добавление музыки — собственной или выбранной в библиотеке сервиса;
- Добавление логотипов, титров, водяных знаков и прочих креативных деталей, которые уникализируют видео;
- Сохранение видео, в том числе в HD-качестве с разрешением в 1080 пикселей. Получение встраиваемой ссылки для сайта или шеринга в соцсетях.
Как работать с HeyGen
Начать работу с видео можно бесплатно, кликнув по кнопке «Try HeyGen for Free», после чего нужно создать емейл-аккаунт или авторизоваться с помощью Google, Facebook* или системы единого входа Single Sign-On.
Интерфейс дашборда HeyGen прост и незамысловат, все названия меню интуитивно понятны даже для плохо владеющего английским человека. В верхней части располагаются четыре активных меню, с помощью которых можно создать аватар или сгенерировать видеокреатив — Instant Avatar, Photo Avatar, Template, AI Script.
Основная работа с видео ведется в меню Template. При клике на команду на экране появляются форма для создания горизонтального/вертикального видео. Одновременно можно выбрать формат ролика — рекламный, презентационный, новостной, коммерческий и так далее. После выбора основных настроек сервис перенаправляет во встроенный видеоредактор для работы с конкретным роликом. Здесь можно выбирать варианты перевода, загружать собственные аудиоскрипты, добавлять паузы и пользоваться другими способами монтажа, в том числе с помощью ИИ.
Преимущество HeyGen в том, что тут есть множество дополнительных инструментов работы с голосом и визуалом. Например, команда Clone voice позволяет дублировать собственный голос на все основные языки AI-сервиса. Функционал TalkingPhoto помогает «оживлять» статичные фото, что удобно при создании анимированных аватаров. Также HeyGen дает возможность при помощи облачной платформы Zapier интегрировать создаваемые креативы с сотнями приложений, систем, социальных сетей, CRM и так далее.
Тарифы HeyGen
Бесплатная версия сервиса позволяет работать с двумя роликами по 30 секунд или с одним роликом продолжительностью в 59 секунд. На это есть два условных кредита, каждый кредит — минута сгенерированного видео.
Планы Creator и Business предлагают разное количество ежемесячных кредитов — от 15 до 300 по разным ценам. Самый дешевый вариант использования 15 кредитов плана Creator обойдется в $24 в месяц, дорогой — 300 кредитов плана Business — в $720 ежемесячно. При выборе годового тарифа действует скидка в 20%.
В HeyGen есть также индивидуальное предложение Enterprise с кастомизированным набором инструментов.
При оплате сервиса понадобится карта иностранного банка, российские карты не поддерживаются.
Преимущества и недостатки HeyGen
К плюсам сервиса относятся:
- Легкость монтажа. Разобраться с настройками при создании видео может любой человек, минимально владеющий английским языком;.
- Высокое качество получаемых креативов. На выходе пользователи получают видеоролики с чистым звуком и хорошей дикцией ведущего;
- Приличная вариативность настроек. Большое число настраиваемых шаблонов дикторов с разными характеристиками голосов и фонов позволяют делать весьма профессиональные видео.
Среди минусов пользователи отмечают:
- Относительную механистичность голосов. При использовании шаблонов заметна легкая голосовая искусственность, особенно в длинных роликах;
- Отсутствие детальной прорисовки эмоций на лицах. При внимательном разглядывании лиц пользователи отмечают статичность мимики, что приводит к безэмоциональности в отдельных эпизодах;
- Долгое ожидание результатов. Процесс генерации роликов даже на платных тарифах может занимать до нескольких часов. Это вызвано, скорее всего, пиковыми нагрузками серверов.
Вывод
HeyGen довольно быстро стала популярной нейросетью. Особенно ее оценили блогеры и любители необычных креативов. Однако многих людей отпугивает прайс на использование: $24 в месяц на генерацию 15 минут видео — это затраты для обычных пользователей.
Шедеврум — рисуем и сочиняем тексты вместе с Яндексом
Русскоязычный Шедеврум от Яндекса в виде прототипа появился еще в апреле 2023 года. В первые месяцы после презентации было много критики в адрес сервиса. Однако нейросеть постоянно обновлялась, и осенний релиз представляет Шедеврум как уже полноценный инструмент для создания изображений, текста и видео.
Бесплатный AI от Яндекса работает на основе технологии каскадной диффузии: создает базовое изображение и затем постепенно добавляет на него детали, согласно заданному промпту. На выходе получаются четыре разные изображения на выбор.
С момента запуска Шедеврум задумывался как большое сообщество пользователей, которые не только могут создавать контент, но и публиковать его в общей ленте. При этом людям предлагалось оценивать и комментировать креативы, подписываться друг на друга. Таким образом, нейросеть от Яндекса фактически строит социальную сеть вокруг своего ИИ.
Летом 2023 года к Шедевруму подключили YandexGPT — языковую модель, которая генерирует текст по запросу. В августе нейросеть «научилась» склеивать несколько изображений в видеоролики.
Особенности Шедеврум от Яндекса
Для создания собственных креативов приложение Шедеврум необходимо скачать из Google Play или AppStore. В браузере можно только просматривать чужие изображения и лайкать их.
Как выглядит приложение при запросе
Приложение позволяет генерировать картинки с разрешением 1024х1024, самостоятельно установить желаемое разрешение и соотношение сторон не получится. Однако в окне ввода промпта есть модифицирующие подсказки — «профессиональное фото», «реалистично», «яркое освещение», «в стиле Дали» и так далее.
Языковая модель YandexGPT при генерации текста работает так же, как и в сервисе Алиса, только в нейросети Шедеврум в обязательном порядке появляется еще и заголовок. Сразу предлагается на выбор несколько сгенерированных под текстовый запрос изображений.
При создании видео можно генерировать короткий ролик длиной в 4 секунды с частотой 24 fps. В процессе создания Шедеврум просит описать основную идею и предлагает 4 кадра на выбор. Одновременно пользователь должен определиться с типом анимации, который «оживит» кадр — таймлапс, приближение, панорама, полет, подъем, вращение или постепенное изменение рисунка. Инструменты создания видео сейчас, впрочем, доступны небольшому числу активных пользователей нейросети.
Весь создаваемый контент появляется в общей ленте, любую картинку, в том числе чужую, можно сохранить, нажав на троеточие и выбрав соответствующий пункт.
Как и в любой другой нейросети, в Шедеврум есть ограничения. Запрещены при генерации промпты с указанием конкретных личностей, упоминание политики или религии, а также эротика, насилие и жестокость. Для генерации текста нейросети требуется не более 5-10 секунд, изображения формируются в течение минуты.
Как запустить Шедеврум
После скачивания приложения на устройство нужно войти в него под учетной записью Яндекс.
На главной странице появится общая лента постов с опубликованными креативами других пользователей. Все записи можно отсортировать по дате или популярности, в режиме подписки показываются только посты авторов, на которых оформлена подписка.
Для создания креатива нужно кликнуть на кнопку с «+» в нижней части приложения, после чего выбрать пункт «изображение» или «текст». В появившемся окне нейросеть предлагает написать запрос для изображения или текста. При клике на знак вопроса появляются подсказки, которые можно листать пальцем влево.
В случае, если полученный креатив не нравится, можно нажать на кнопку «Перегенерировать» и уточнить запрос в поле редактора промпта. Неудачные изображения удаляются при клике на иконку «Корзина».
Достоинства и недостатки Шедеврум
К плюсам популярной нейросети от Яндекса относится:
- Доступность и простота в работе. Интерфейс сервиса максимально упрощен и понятен даже тем, кто никогда не пользовался технологиями AI. Дополнительное преимущество в появляющихся на экране подсказках при создании иллюстрации или текста;
- Созданное комьюнити вокруг нейросети. Попытку превращения Шедеврума в соцсеть можно считать удачной — люди с удовольствием занимаются творчеством, лайкая и комментируя работы друг друга;
- Бесплатность сервиса. Все инструменты Шедеврума доступны бесплатно без всяких ограничений.
Недостатки Шедеврума:
- Ошибки при генерации. Как и любая другая нейросеть, разработка от Яндекса выдает некорректные в деталях изображения;
- Слабая прорисовка деталей. При сильной детализации промптов возрастает риск ошибок. Это касается не только изображений с конечностями, но и, например, надписей;
- Перекос в сторону абстракции. Шедеврум неплохо генерирует абстрактно-сюрреалистические или рисованные изображения, но с реализмом нередко возникают проблемы.
Выводы
Социально-творческий замах Шедеврума неплохой: сервис предлагает людям соцсеть с возможностью генерации креативов в трех форматах. Но объективно: пока что AI от Яндекса отстает в качестве получаемых изображений от русскоязычного аналога Kandinsky от Сбера и тем более от популярнейшего Midjourney. Тем не менее это единственный на осень 2023 года многопрофильный ИИ-сервис в Рунете с довольно простым инструментарием.
Создаем короткометражки вместе с Runway Gen-2
Runway Gen-2 — это нейросеть для генерации видео от разработчиков популярной Stable Diffusion, сервиса, который позволяет генерировать качественные изображения разных форматов, в том числе реалистичные.
Первая версия AI-видеоплатформы позволяла преображать исходные изображения и загруженные ролики, в обновленной версии можно создавать видео по текстовому запросу с нуля.
Особенности Runway Gen-2
Сервис дает возможность создавать профессиональные, иногда весьма реалистичные ролики. Из дополнительных функций можно выбрать наложение маски, добавление стилизации под задаваемый шаблон. Среди инструментов также есть раскадровка, рендеринг и кастомизация.
Особенность сервиса в том, что сгенерированные видео на бесплатном тарифе не превышают 4 секунд по продолжительности, а сами запросы не могут быть длиннее 320 символов. На платных тарифах длина видео увеличивается до 15 секунд.
Пользоваться Runway Gen-2 можно как в браузерной версии, так и приложении под iOS.
Как пользоваться Runway Gen-2
В браузерной версии для регистрации нужно кликнуть Try runway for free, после чего создать аккаунт или авторизоваться через Google, Apple-аккаунт или Single Sign-On.
Интерфейс дашборда интуитивно прост и понятен. Слева расположена панель инструментов, среди которых меню для создания видео, изображений и 3D-объектов. В центральной части собрано несколько кнопок с основными инструментами — генерации ролика с загруженной картинки-референса, видео или текстового промпта. Популярные инструменты также вынесены в отдельную панель с иконками.
В нижней части экрана в разделе Discover and Remix размещены расположенные плиткой примеры вдохновляющих роликов.
Для создания видео нужно выбрать меню «Start with Image» или «Start with Text», после чего необходимо ввести в поле «Text» запрос. В поле «Image» выбирается картинка для референса, а через меню «Image+Description» к иллюстрации-референсу добавляется текстовое описание.
При клике на иконку дополнительных настроек открываются команды:
- Seed — число, определяющее случайность генерации в одном стиле. Номера успешно сгенерированных видео можно сохранять для повторения в будущем;
- Interpolate — инструмент сглаживания кадров на видео для увеличения плавности;
- Upscale — функция улучшения разрешения видео для большей четкости и детализации;
- Remove watermark — снятие вотермарки на готовом видео.
В настройках Runway Gen-2 также есть инструменты детального редактирования:
- Inpainting — удаляет из видео ненужные объекты;
- Remove Background — работает с фоном видео.
Тарифы Runway Gen-2
В бесплатной версии сервис предлагает 125 кредитов для трех проектов общим размером до 5 Гб без возможности удаления вотермарок. Одна секунда генерации равна 5 кредитам.
Тариф «Standard» стоимостью $12 в месяц или $144 в год открывает дополнительные возможности: 625 кредитов для неограниченного числа проектов с общим размером видео до 100 Гб.
Тариф «Pro» стоимостью $28 в месяц или $336 ежегодно открывает еще больше возможностей — 2 250 кредитов при загрузке видео на 500 Гб, а также ряд дополнительных опций при редактировании и экспорте роликов.
Тариф «Unlimited» по цене в $76 в месяц и $912 в год позволяет снять все ограничения в редактировании, бонусом даются ежемесячно возобновляемые 2 250 кредитов.
Преимущества и недостатки Runway Gen-2
К плюсам нейросети относится:
- Простота и удобство работы. Интерфейс ИИ-сервиса интуитивно понятен всем, кто минимально владеет английским языком, а доступ к инструментам открыт как через боковое меню, так и через интерактивные кнопки дашборда;
- Большое количество инструментов для редактирования. Runway Gen-2 предлагает приличный набор полезных опций для генерации роликов как с текстового запроса, так и с загруженных референсов-иллюстраций или собственных видео;
- Неплохое качество готового материала. Умелое использование промптов, референсов и тонких настроек позволяет создавать полноценные ролики — не только развлекательные, но и рекламные, презентационные и другие.
Среди минусов Runway Gen-2 пользователи отмечают:
- Проблемы с детализацией. Несмотря на общее высокое качество генерируемого видео, возникают сложности с прорисовкой отдельных деталей интерьера и сложных, многоплановых действий;
- Трудности в прорисовке конечностей. Есть сложности и с детализацией человеческих конечностей. Также иногда в роликах генерируются лишние, не прописанные в промпте, объекты или дубли персонажей.
Вывод
Чтобы использовать Runway Gen-2 полноценно, нужно перейти хотя бы на стандартный тариф. Это позволит более или менее свободно экспериментировать с видео, получая в результате приближенный к задумке вариант ролика. В целом, сервис по уже реализованному функционалу смотрится солидно.
Общаемся с Giga-ботом от Сбера в мессенджере
GigaChat bot — это нейросетевой чат-бот от Сбербанка, недавно запущенный в Telegram.
Свой фирменный AI-сервис в Telegram крупная российская корпорация презентовала в апреле 2023 года. Спустя полгода по просьбам пользователей она реализовала идею в популярном мессенджере. Сервис до сих пор находится в бета-тестировании, хотя открыт для всех.
Особенности GigaChat bot
Нейросеть задумывалась разработчиками Сбера, как полноценный сервис, способный в перспективе конкурировать с ChatGPT. Функционал у него довольно обширный:
- Сбор информации по запросу через разные поисковики;
- Ответы на вопросы пользователей и ведение полноценного диалога;
- Создание и редактирование изображений;
- Помощь в написании программного кода;
- Генерация по запросу информационных и коммерческих текстов.
Многофункциональность GigaChat обеспечена его мультимодальным нейросетевым ядром на базе созданной модели NeONKA. Сама NeONKA состоит из нескольких модулей:
- RuGPT-3.5 — русскоязычный аналог GPT-3.5 от Open AI, генерирующий тексты и способный поддержать диалог с человеком в свободной форме;
- FRED-T5 — уникальная модель, которая после тестирования продемонстрировала хорошее понимание русского языка;
- RuCLIP — модель, которая отвечает за русскоязычную семантику близких по смыслу картинок и текстов;
- Kandinsky 2.1 — популярная в России нейросеть для генерации изображений.
В отличие от официальной браузерной версии GigaChat, требующей авторизации с помощью Сбера ID, бот в Telegram доступен для всех зарегистрированных в мессенджере пользователей.
Как пользоваться GigaChat bot
Чтобы начать работу с ботом, нужно кликнуть по кнопке «Запустить». GigaChat bot открывает несколько команд:
- «Напиши» — для генерации оригинального текста;
- «Объясни» — для поиска информации по запросу;
- «Расскажи вкратце» — для тезисного пересказа текста;
- «Нарисуй» — для создания изображения.
Через меню чат-бота доступны дополнительные управляющие команды:
- /restart — для перезапуска диалога;
- /about — для получения информации о боте;
- /add — для добавления бота в другой чат;
- /support — для связи со службой поддержки.
Преимущества и недостатки GigaChat bot
К плюсам бота относится:
- Простота и легкость взаимодействия. Как и при взаимодействии с любым ботом в Telegram, трудностей в управлении не возникает — достаточно точно вводить команды и четко формулировать запросы;
- Поддержка иностранных языков при общении. Хотя официально об этом не говорится, но GigaChat bot без проблем поддерживает диалог на иностранном языке. И не только на международном английском, понимает он и экзотику японских иероглифов, и белорусскую мову, и многие другие языки мира, хотя иногда возникают трудности с корректностью ответов.
Среди недостатков сервиса можно выделить:
Логические и фактические ошибки в ответах. Пользователи отмечают, что при специфических запросах алгоритм нейросети начинает путаться и выдавать неверные ответы. Чаще всего ошибки возникают при запросах программного кода;
Жесткие алгоритмы фильтрации при запросах. Эксперименты пользователей с ботом показывают, что нередко алгоритм маркирует в качестве запрещенных тем довольно невинные запросы, хоть и хитро сформулированные. Таким образом, получить бан в GigaChat bot можно в течение нескольких минут, и обойти его не получится — для дальнейшей работы ИИ отправляет в официальную браузерную версию.
Вывод
GigaChat bot от Сбера по функционалу не уступает официальной браузерной версии, но сохраняет несовершенство бета-версии, воспроизводя ошибки и логические нестыковки в ответах. И хотя разработчики заявляют о стремлении приблизиться к идеалу англоязычной AI-модели ChatGPT, очевидно, что работы на этом пути предстоит еще немало.
*запрещенная в РФ организация
Самого бота они релизнули когда?)
Ок, напишу – “лучшее в мире”
Скорее, тут просто можно написать, что после тестирования был высокий уровень понимания русского языка
без сравнения)
Источник