а г кузнецова / смешные картинки, мемы и приколы на JoyReactor

Уй^емб/е родители Учеников и учениц 5’"в''[
Т6МА НАЦ)£Го экстренного СОБРАНИЯ — кп> Будет ИЗГеСН
В текущем ууееном Году ? Гусев оаллся н-4 второй Гол, поэтому г4№Айге с Намч решм, нал кен булут_
издевА-ться лети Беи.
следующий год ",duran art,Смешные комиксы,веб-комиксы с юмором и их переводы

$ПРоСтнТЕ , ЧП)? ЗАче* ЪооЬ-В КЛАСС€ йЗГой? ПоВепте МНС, В К А ЖАОм КЛАСС с есть ИЗГо&, ОН СЛУЖИТ ГроМо- оТЪо<Ъор\ ЦСГЛТИВА, ШГои НбоСхоЛим ¿АороВъи АТ*оС9£Ре ВНУТРИ КоЛ-ЛекТИВА Г Мк Вы /иоЖ^те ТАКое 1АН- а Ян’ Ш %е КЛАССНЫЙ РУКО- ЦоЛиТЕль 1 А ЩС я СИОЛоЫЧКА. Мтн жесторм, при рол а в н»х$

ну. ¿опус™», tuteen Mi vico*, * W', ¿e-n, своего gugeeyr и суаут его тгшу> .
ПОНАДОБИТСЯ riofroiqi, IzAX'P’Ofo н)
Iac. Чы не будете hakaihíatti CQof° реянья, если оиттаВиТ №еглнК<Цг
HAÁH нЫоА, НО сулете ГРоВоАМ
CeceAU, £014 он oGUAM НОГО-TV Другого, Т>?кс САПоГ 6УАУ А6ЛА71 я.
ТАКЖЕ Я

$£с/)й все тЛК, Мб Ш ори-Cdfaeте,ть пУсЛ Лет* 0*01* кыбьРУт изгол. ,--------—‘ 1с/\ АСОл тескля Р Роблес А \ Мго*ет^и. КоГАА изг<эи Кбочевилен , МОГУТ росгрл-&А-71 Ал Йоте дети. оНИ бУ-АУг УНЬХСЛЪ ДРУГ ДРУГА; подталкивая 5-/о уче- г— Ников К 36АНи(о ИЗГоЛ. /---' и Эти КоМПАРКСИ 6УДУТ ГУ iT~$

$9 СЛИЧАЛ, F> KMccç Êcti Парта Buis PCCíHok! Но он У НАС отличник'а на еимли в. списке Эмилии Hí tofo Хачышова ? Ьоодце-ть с /л )/ Арт/рчьком ¿се (у / \ Х°Т71т АТУЖИ71 ! S / \А рот АНитиНЩ ^ \cfif ИА Уме' „ КПЩоВА ßCGAs т+АЁт!,duran art,Смешные комиксы,веб-комиксы с юмором и их переводы$

$ГоСНоАА ( Тихо I №H£ KAXé-ТСЯ Mbl He Злмечлем СЛОНА g ко мн Are 1 ßti, простите, Lf(,u РоЛ1/ггели ? Кристины петровом п.„ нетро&о* ? олимп^а^н^!/ кГАнлбчцы к спортсменка ; АГА. НАШ гАочл '/ШС WtLorrtO n\ IJ »,duran art,Смешные комиксы,веб-комиксы с юмором и их переводы$

$о еоо о о о 00 О О о и *06*0000 1ь 111 А Кто Sot ÏTD ? lit/ видели ero роемое п&-гцо!? <4о foré »Г это HAU)A Aoní * ßc€ ще-НАс-ТАиНАЮ НА АНнНбШНнке1. ß СЛУШАЛ, один МАЛЬЧИК ШМК,АЛ \ Ил уроке музыки, \ Хлыщи БетуовенА, rglí л И OH ТАК Ж [kiA на что не / ИАме КАЮ, Но если Постыть в eu$

ГоСпоДА, 'Ллхо1. ПОСмоТрИтВ ИА се.6* — ГАШ ТАКоь Пример мы Хотим пометь споим rféTTW 2 щ/ не Жи-ßoiHue, мы люди'. h мы, как взрослые, л°п.*цы дроСитъ &ыз°в природным инстинктам', объяснен
детям ГГ° ТРАВЛА - 370 плохо, что ßce лроди РАЗИИ6
и Никто не }лелухиалет выть изгоем. Чть скАжете?
НТО ЗА

£сли это &л¿активное решенье,-г& так тему и
£ыту. но если спросите меня _ згго Бесполезная Ълтея. глАЗ°м Не моргнете / появится изсои, лт> ь Не оннлн. зря &ы /лепя не послушали ,,г,duran art,Смешные комиксы,веб-комиксы с юмором и их переводы

$/Наталья паВлоина ,р слышала, у вас ( И2Гоя нет? л в Noer' КЛАССЕ их AgAf \ не х©7Vire одного &м~п, ? ОН ЛАикльТСА,г ^ Mt Л* те х <£Г& К НАМ / «АЛА СКАК у Заика ! какой помк*У трми/его! I ) СЫНУ. fTü€ Го1Ь&А é/ИУ ПЛАфГГЪ Y706 не ко ям Acçone^i Ър€А/йГ^ ПоСоКАао: К-К-К OHGoi m,duran$

Новый ИИ от "Microsoft" может имитировать голос любого человека с помощью 3 секунд аудиозаписи

Модель преобразования текста в речь может так же сохранять эмоциональный тон диктора и акустическое окружение.

г Вас беспокоят из ' службы безопасности . Сбербанка... >,наука и техника,технологии,Microsoft,Майкрософт,нейросети,VALL-E,DeepFakes,Deepfake,deep fakes,длиннопост,длиннотекст

Исследователи "Microsoft" анонсировали новую модель ИИ для преобразования текста в речь под названием "VALL-E", которая может точно имитировать голос человека, после того как ей предоставят трехсекундный образец аудиозаписи. Как только она запоминает конкретный голос, "VALL-E" может синтезировать аудиозапись того, как этот человек говорит что угодно, и сделать это таким образом, чтобы сохранить эмоциональный тон говорящего.

Его создатели предполагают, что "VALL-E" может быть использован для высококачественных приложений преобразования текста в речь, редактирования речи, когда запись человека может быть отредактирована и изменена на основе текстовой расшифровки (заставляя его говорить то, чего он изначально не говорил), и создания аудиоконтента в сочетании с другими генеративными моделями ИИ, такими как GPT-3.

"Microsoft" называет "VALL-E" "нейронным языковым кодеком" ("neural codec language model"). Она основана на технологии под названием "EnCodec", которую "Meta" анонсировала в октябре 2022 года. В отличие от других методов преобразования текста в речь, которые обычно синтезируют речь путем манипулирования волновыми формами, "VALL-E" генерирует дискретные коды "аудиокодеков" из текста и акустических образцов. По сути, он анализирует, как звучит человек, разбивает эту информацию на дискретные компоненты (называемые "лексемами") благодаря "EnCodec" и использует обучающие данные для соответствия тому "знанию" о том, как бы звучал этот голос, если бы он произносил другие фразы за пределами трехсекундного образца. Или, как "Microsoft" выражается в документе "VALL-E":

«Для синтеза персонализированной речи (например, "нулевого TTS" ("zero-shot TTS")) "VALL-E" генерирует соответствующие акустические лексемы на основе акустических лексем 3-секундной записи и образца фонемы, которые ограничивают информацию о дикторе и содержании соответственно. Наконец, сгенерированные акустические лексемы используются для синтеза конечной формы сигнала с помощью соответствующего декодера нейронного кодека».

"Microsoft" обучила возможности синтеза речи "VALL-E" на аудиотеке, собранной компанией "Meta", под названием "LibriLight". Она содержит 60 000 часов англоязычной речи от более чем 7 000 дикторов, в основном взятых из аудиокниг "LibriVox", являющихся общественным достоянием. Чтобы "VALL-E" выдал хороший результат, голос в трехсекундном образце должен точно соответствовать голосу в обучающих данных.

На сайте, посвященном примерам "VALL-E", "Microsoft" предоставляет десятки аудиопримеров модели ИИ в действии. Среди примеров "Speaker Prompt" – это трехсекундная аудиозапись, предоставленная "VALL-E", которую он должен имитировать. "Базовая истина" – это уже существующая запись того же диктора, произносящего определенную фразу для сравнения (своего рода "контроль" в эксперименте). "Базовая линия" – это пример синтеза, обеспечиваемого обычным методом синтеза текста в речь, а образец "VALL-E" – это результат работы модели "VALL-E".

Personalized
Speech
VALL-E
Text Prompt
Text for synthesis
>1
i|m|i
t
I*
4
Acoustic Prompt
3-second enrolled recording,наука и техника,технологии,Microsoft,Майкрософт,нейросети,VALL-E,DeepFakes,Deepfake,deep fakes,длиннопост,длиннотекст

Блок-схема "VALL-E", предоставленная исследователями "Microsoft".

При использовании "VALL-E" для получения этих результатов исследователи передали в "VALL-E" только трехсекундный образец "Speaker Prompt" и текстовую строку (то, что они хотели, чтобы сказал голос), и сравнивали образец "Ground Truth" с образцом "VALL-E". В некоторых случаях эти два образца очень близки. Некоторые результаты "VALL-E" кажутся сгенерированными компьютером, но другие могут быть приняты за речь человека, что и является целью модели.

Помимо сохранения тембра голоса и эмоционального тона диктора, "VALL-E" может также имитировать "акустическую среду" аудиообразца. Например, если образец получен из телефонного разговора, то в синтезированном аудиовыходе будут имитироваться акустические и частотные свойства телефонного разговора. Образцы "Microsoft" (в разделе "Синтез разнообразия") демонстрируют, что "VALL-E" может генерировать вариации тона голоса, изменяя случайное "зерно", используемое в процессе генерации.

Возможно, из-за способности "VALL-E" потенциально быть использованным для обмана, "Microsoft" не предоставила код "VALL-E" для экспериментов другим, поэтому возможность непосредственно проверить возможности "VALL-E" – отсутствует. Исследователи, похоже, осознают потенциальный социальный вред, который может принести эта технология. В заключении статьи они пишут:

«Поскольку "VALL-E" может синтезировать речь, которая сохраняет звучание диктора, это может нести потенциальные риски неправильного использования модели, такие как подмена идентификации голоса или выдача себя за конкретного диктора. Чтобы снизить такие риски, можно построить модель обнаружения, позволяющую определить, был ли аудиоклип синтезирован "VALL-E". Мы также будем применять принципы "Microsoft AI Principles" на практике при дальнейшей разработке моделей».