„Společně s pirátskými analytiky jsem oslovila přední české a zahraniční experty specializující se na analýzu zvuku a rozpoznávání takzvaného deepfake - podvrhu vytvořeného umělou inteligencí. Celkově jsme tímto získali 7 posudků - od amerických společností Resemble, Hive a VeriVox, švýcarské společnosti Aurigin, polské společnosti WEimpact vedoucí projekt Stenograf, české společnosti Phonexia, která spolupracuje rovněž s policií a nakonec posudek i od týmu profesora Černockého z VUT v Brně. Vyzývám tímto Pavla Matochu a Romana Bradáče, aby v reakci na tyto posudky okamžitě odstoupili z volby do Rady ČT. Chtěla bych zde připomenout, že sami zástupci hnutí ANO veřejně uvedli, že pokud se potvrdí, že nahrávka je autentická, tak pánové Bradáč a Matocha nemohou být zvoleni do Rady České televize,” uvádí Andrea Hoffmannová.
Čtyři z těchto posudků dospěly k závěru, že je nahrávka téměř jistě autentická, dva z těchto posudků uvádějí, že jde pravděpodobně o autentickou nahrávku a jeden tým expertů vyhodnotil osm různých konfigurací nahrávky a ve většině případů opět dospěl k závěru, že jde spíše o autentickou nahrávku.
„Obsah nahrávky je velmi závažný a mohl se týkat volby generálního ředitele České televize v roce 2023. Oslovili jsme opravdu velký počet expertů a je pravděpodobné, že další posudky k nám ještě dorazí. Postupně všechny tyto analýzy předáváme NCOZ, která se okolnostmi nahrávky zabývá na základě dříve podaného trestního oznámení”, uvádí analytik Pirátů Janusz Konieczny.
Piráti přikládají některé citace z doručených posudků:
- Resemble.AI
„Nebyly zjištěny žádné jasné známky digitálního spojování nebo umělé manipulace. Problémy s kvalitou zvuku se zdají být spíše způsobeny vlivy prostředí než výsledkem digitální úpravy. Analýza zvuku naznačuje, že nahrávka je pravděpodobně skutečná, s celkovým skóre 0,326, což je výrazně pod prahovou hodnotou pro obsah generovaný umělou inteligencí. Řečové vzorce, včetně přirozených výplňových slov a tempa, jsou v souladu s lidskou řečí. Nejsou zde žádné slyšitelné známky asistence umělé inteligence, jako je robotická intonace nebo nepřirozené pauzy."
- Phonexia
Specializovaný software určil, že nahrávka je „spíše autentická”.
- Stenograf.io
„Nahrávka byla pravděpodobně pořízena skrytým hlasovým diktafonem. Nahrávka nebyla sestříhaná. Fázový spektrogram je spojitý a neobsahuje nelinearity, které by mohly vzniknout v důsledku manipulace nebo přimíchávání šumu do nahrávky."
- Verivox.studio
„Řečové vzorce odpovídají přirozeným charakteristikám lidského hlasu. Nebyly zjištěny žádné významné anomálie. Zvuk vykazuje přirozené akustické vlastnosti odpovídající skutečné lidské řeči. Frekvenční rozložení sleduje očekávané vzorce pro vokální produkci s vhodnými harmonickými strukturami a přirozenými variacemi výšky tónu a energie. Nebyly zjištěny žádné artefakty ani anomálie charakteristické pro syntetickou generaci. Časová dynamika a spektrální vývoj odpovídají autentickým hlasovým nahrávkám.
- Aurigin.ai
Analýza dospěla k závěru, že nahrávka je autentická a k tomu uvádí: „Nebyly zjištěny žádné segmenty generované umělou inteligencí”.
- Thehive.ai
Tato analýza opět konstatuje, že se pravděpodobně jedná o autentickou nahrávku: „Tento záznam pravděpodobně neobsahuje obsah generovaný umělou inteligencí.”
- Tým profesora Jana Černockého z VUT v Brně
„Zkusili jsme tedy 6 různých detektorů v celkem 8 konfiguracích, přičemž nám v pěti případech vychází, že by se mělo jednat spíše o reálnou nahrávku, ve třech případech naopak detektory považují nahrávku za spíše deepfake. Potvrdily se tedy obavy z mého úvodního e-mailu, a že není možné kvalifikovaně rozhodnout, zda se jedná o deep-fake nebo bona-fide řeč pouze na základě výstupů detektorů. ”