Internet

Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí

youtube logo final
Foto: pixabay.com, Tag: YouTube

YouTube pohání nové vylepšené algoritmy, které zachycují nemravná nebo škodlivá videa. Všichni dobře víme, že se na video-portálu občas objeví zavádějící nebo škodlivý obsah. YouTube se s tímto obsahem dalo do boje už před několika lety. Nový škodlivý obsah má ale problém – inzerenti budou spokojeni.

V důsledku probíhající práce na vylepšení automatizovaných algoritmů video-server snížil o 80 % shlédnutí na obsah, který je poté odstraněn kvůli porušení zásad komunity. V kostce se za posledních 18 měsíců snížil počet zhlédnutí videí, které jsou později odstraněny. Nové algoritmy odstranily více jak dvojnásobek komentářů, které porušovaly zásady. Automatizovaně bylo odstraněno přes 100 000 videí a 17 000 kanálů na YouTubu.

Výkyvy v číslech po odstranění jsou částečně způsobeny odstraněním starších komentářů, videí a kanálů, které byly dříve dostupné. V dubnu 2019 interní sekce YouTube oznámila, že pracuje na aktualizaci zásad obtěžování, včetně obtěžování tvůrců. V příštích měsících se video-portál podělí o pokrok v této práci. Na algoritmy navazuje i Content ID – tedy speciální algoritmus určující ve zvukové nebo video stopě porušení autorských práv.

Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí

Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí

Používání automatizovaných algoritmů k označení závadného obsahu

YouTube interně definovalo zásady a spoléhá na kombinaci lidí a technologií (automatizovaných algoritmů). Pro přesnější označení se někdy používá HASH (digitální otisky stopy). Jedná se o zachycení kopie již nahraného souboru. U některého obsahu, jako jsou obrázky sexuálního zneužívání dětí (CSAI) a videa o náboru teroristů, přispívají do sdílených průmyslových databází hashů, aby zvýšili objem obsahu, který algoritmické stroje mohou při nahrávání zachytit.

V roce 2017 YouTube rozšířilo technologie strojového učení, aby pomohlo odhalit potenciálně porušující obsah a odeslat jej k lidské kontrole. Strojové učení je vhodné k detekci vzorců, které pomáhají najít obsah podobný (ale ne úplně stejný) jako obsah, který byl již odstraněn. A to ještě předtím, než je na video-portálu veřejný. Tyto systémy jsou zvláště účinné při označování obsahu, který často vypadá stejně – jako je spam nebo obsah pro dospělé.

Stroje mohou také pomoci označit nenávistné výroky a další porušující obsah, ale tyto kategorie jsou velmi závislé na kontextu a zdůrazňují důležitost lidského přezkumu pro konečné rozhodnutí. Více než 87 % z 9 milionů videí, které YouTube odstranilo ve druhém čtvrtletí roku 2019, bylo poprvé označeno automatizovanými systémy.

Do těchto automatizovaných detekčních systémů významně YouTube investuje a týmy inženýrů je neustále aktualizují a zlepšují každý měsíc. Například aktualizace systémů detekce nevyžádané pošty ve druhém čtvrtletí roku 2019 vedla k více než 50 % nárůstu počtu kanálů, které byly odstraněny kvůli porušení zásad týkajících se spamu.

Odstraňování obsahu ještě před jeho zobrazením

Softwarový inženýři se snaží zajistit to, aby obsah, který porušuje pravidla serveru YT, nebyl před odstraněním celý prohlížen nebo dokonce zobrazen. Vylepšení v automatizovaných systémech označování spamu nebo škodlivého obsahu pomohlo detekovat a zkontrolovat obsah ještě předtím, než je označen komunitou YouTube. Server zaměřující se na sdílení obsahu rovněž uznává, že nejlepším způsobem, jak rychle odstranit obsah, je předvídat problémy dříve, než se objeví.

V lednu roku 2018 interní pracovníci spustili zpravodajský tým, který monitoruje zprávy, sociální média a zprávy uživatelů. Je nutné zjistit nové trendy obklopující nevhodný obsah, a snažit se zajistit, aby je týmy byly připraveny je řešit dříve, než se stanou větším problémem. YouTube je nadále odhodláno snižovat publikaci videím, která porušují zásady komunity. V celé společnosti Google pověřili přes 10 000 lidí detekováním, kontrolou a odebíráním obsahu, který porušuje zásady video-serveru.

MŮŽE SE VÁM TAKÉ LÍBIT ▼

Komentuj ▼

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Více článků ► Internet