Адрес для входа в РФ: exler.wiki
Billie Jean курильщика
25.07.2018 11:04
14064
Комментарии (21)
Это же сколько времени на подобный ролик надо угрохать, а? Или такие вещи делаются с помощью технологий голосового распознавания? Но даже если есть готовые ролики с готовыми временными отметками, смонтировать такое - это же адский труд!
Войдите, чтобы оставить комментарий.
Судя по количеству подобных произведений, мне всё-таки кажется, что кто-то обкатывает нейросети нового поколения.
Круто! Только Автотьюна многовато, голос как у робота Вертера стал.
А вот как вам такой вариант? Голоса ведущих аукционов по продаже скота в США наложили на рэперскую музыку. Получилось весьма неплохо, а по сравнению с многими русскими рэперами так вообще шедеврально.
А вот как вам такой вариант? Голоса ведущих аукционов по продаже скота в США наложили на рэперскую музыку. Получилось весьма неплохо, а по сравнению с многими русскими рэперами так вообще шедеврально.
Думаю, это все делается на компутере. Есть еще самый крутий ролик по этой технологии, где из ммм...фильмов для взрослых сделали Скерцо Баха. В опасении бана не выкладываю, гуглите на ключевое слово pornchestra (porn+orchestra). Сделано с точки зрения звука более безупречно, ибо это ″инструментал″ и потому не надо подбирать слова. Здесь из-за изменения тембра ″буратинка″ изрядная присутствует
ХХХ-Фактор 😉
Гм, Fucktor?
Гм, Fucktor?
Есть еще вот такой "жанр" -- тут уж точно надо вручную все делать:
когда подтягивают частоту, очень механически звучит.
Когда не меняют, звучит более аутентично, но мелодия конечно не та. Вот, наверное, самое старье:
Когда не меняют, звучит более аутентично, но мелодия конечно не та. Вот, наверное, самое старье:
Мне больше этот видео-ремикс нравится:
Это от того же чувака, что и Гавану с Трампом сделал.
У него, видимо, все речи Трампа распарсены, так что он любое видео собрать может.
П.С. И да, Гавану если не видели - смотрите - она вообще шедевр.
У него, видимо, все речи Трампа распарсены, так что он любое видео собрать может.
П.С. И да, Гавану если не видели - смотрите - она вообще шедевр.
Шикарно, правда шедевр, спасибо.
чувак, видимо, сильно любит своего президента
По-моему, это видео уже в блоге было, разве нет? 😄
Да, было. Но и пересмотреть не грех 😄
Сорос платит.
Он еще и танцует (с)
Уверен, что это продукт автоматического софта, дошлифованный вручную. Очень похоже на панно, изображающее лицо из фото из фотоальбома.
Оригинальная песня делится на фрагменты по сколько-то там миллисекунд. Их оказывается, положим, неколько тысяч. Берется архив выступлений Трампа и тоже делится на фрагменты. Их там оказывается несколько миллионов. Далее для каждого фрагмента из песни находится похожий из выступлений трампа, по "рисунку". Скорее всего, фрагменты еще и с наложением друг на друга идут. Положим, для 80% фрагментов оригинальной песни удается найти похожее с точностью 50%, а на остальное ничего нормального не находится. Тут вступает ручная работа. Где-то подтягивают тембр, где-то меняют кривую высоты тона. Эти ручные изменения слышны неплохо, но поскольку это только 20%, то распределенные вместе с частями, где изменений нет, норм.
Вообще президентов снимают так много, что со временем лицо можно найти во всех возможных углах и освещениях. Это позволяет построить 3d-модель лица, и "достроить" недостающее с высоким качеством. Как только будет 100% покрытие, берется почти любой фильм с актером похожего телосложения, и заменяется лицо - для каждого кадра определяется, под каким углом и освещением нужно вытащить образец, совмещаются по точкам. Задача тоже на полную автоматику. Ну вот и с аудио такая же фигня.
Оригинальная песня делится на фрагменты по сколько-то там миллисекунд. Их оказывается, положим, неколько тысяч. Берется архив выступлений Трампа и тоже делится на фрагменты. Их там оказывается несколько миллионов. Далее для каждого фрагмента из песни находится похожий из выступлений трампа, по "рисунку". Скорее всего, фрагменты еще и с наложением друг на друга идут. Положим, для 80% фрагментов оригинальной песни удается найти похожее с точностью 50%, а на остальное ничего нормального не находится. Тут вступает ручная работа. Где-то подтягивают тембр, где-то меняют кривую высоты тона. Эти ручные изменения слышны неплохо, но поскольку это только 20%, то распределенные вместе с частями, где изменений нет, норм.
Вообще президентов снимают так много, что со временем лицо можно найти во всех возможных углах и освещениях. Это позволяет построить 3d-модель лица, и "достроить" недостающее с высоким качеством. Как только будет 100% покрытие, берется почти любой фильм с актером похожего телосложения, и заменяется лицо - для каждого кадра определяется, под каким углом и освещением нужно вытащить образец, совмещаются по точкам. Задача тоже на полную автоматику. Ну вот и с аудио такая же фигня.
Ясно, спасибо.
— Высочайшее достижение нейтронной мегалоплазмы! — провозгласил он. — ротор поля наподобие дивергенции градуирует себя вдоль спина и там, внутре, обращает материю вопроса в спиритуальные электрические вихри, из коих и возникает синекдоха отвечания...
И внутри у нее неонка!
И внутри у нее неонка!
Всё проще. Берете песню и разбиваете на слова. Ищете в текстах выступлений "модели" нужные слова. Если не находите все слова, разбиваете ненайденные по слогам и ищете их. Находите соответствующие видеролики, в них находите нужные фрагменты. В видеоредакторе бросаете на одну дорожку звук исходной песни, на другие дорожки помещаете найденные фрагменты. Подгоняете по графику звуковой дорожки. Подрезаете, сжимаете - растягиваете под темп исходной песни. Нормализуете уровни звука.
Работа кропотливая, но не сверхсложная.
Работа кропотливая, но не сверхсложная.
Я именно так и описал, только вы оперируете словами и слогами, а их из звуковой дорожки не вытащить. Ну, то есть, для одного выступления вручную вытащить можно, а для многих сотен и автоматически - нельзя. Аудиопоток нельзя разбить на слова без автоматического распознавания слов в аудиопотоке, чтобы с таймкодами они были. А со слогами - еще сложнее. Их просто не выковырять. Люди говорят так, что слог может быть искажен довольно сильно, а слушатель это даже не поймет. А компу будет очень даже не все равно. В системах распознавания оперируют словами, а не слогами.
Тем же вопросом задаюсь после этого ролика:
Может быть там все-таки много обмана? Кто заметит, если видеоряд будет левый?
Может быть там все-таки много обмана? Кто заметит, если видеоряд будет левый?
Да уж, офигеть.
Теги
Информация
Что ещё почитать
Плохие парни до конца
29.07.2024
28
Обзор умных часов Huawei Watch GT 5
03.12.2024
96