Algoritmus

youtube web logo

Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí

YouTube pohání nové vylepšené algoritmy, které zachycují nemravná nebo škodlivá videa. Všichni dobře víme, že se na video-portálu občas objeví zavádějící nebo škodlivý obsah. YouTube se s tímto obsahem dalo do boje už před několika lety. Nový škodlivý obsah má ale problém – inzerenti budou spokojeni.

V důsledku probíhající práce na vylepšení automatizovaných algoritmů video-server snížil o 80 % shlédnutí na obsah, který je poté odstraněn kvůli porušení zásad komunity. V kostce se za posledních 18 měsíců snížil počet zhlédnutí videí, které jsou později odstraněny. Nové algoritmy odstranily více jak dvojnásobek komentářů, které porušovaly zásady. Automatizovaně bylo odstraněno přes 100 000 videí a 17 000 kanálů na YouTubu.

Výkyvy v číslech po odstranění jsou částečně způsobeny odstraněním starších komentářů, videí a kanálů, které byly dříve dostupné. V dubnu 2019 interní sekce YouTube oznámila, že pracuje na aktualizaci zásad obtěžování, včetně obtěžování tvůrců. V příštích měsících se video-portál podělí o pokrok v této práci. Na algoritmy navazuje i Content ID – tedy speciální algoritmus určující ve zvukové nebo video stopě porušení autorských práv.

Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí
Algoritmy automatizovaně smažou na YouTube přes sto tisíc videí

Používání automatizovaných algoritmů k označení závadného obsahu

YouTube interně definovalo zásady a spoléhá na kombinaci lidí a technologií (automatizovaných algoritmů). Pro přesnější označení se někdy používá HASH (digitální otisky stopy). Jedná se o zachycení kopie již nahraného souboru. U některého obsahu, jako jsou obrázky sexuálního zneužívání dětí (CSAI) a videa o náboru teroristů, přispívají do sdílených průmyslových databází hashů, aby zvýšili objem obsahu, který algoritmické stroje mohou při nahrávání zachytit.

V roce 2017 YouTube rozšířilo technologie strojového učení, aby pomohlo odhalit potenciálně porušující obsah a odeslat jej k lidské kontrole. Strojové učení je vhodné k detekci vzorců, které pomáhají najít obsah podobný (ale ne úplně stejný) jako obsah, který byl již odstraněn. A to ještě předtím, než je na video-portálu veřejný. Tyto systémy jsou zvláště účinné při označování obsahu, který často vypadá stejně – jako je spam nebo obsah pro dospělé.

Stroje mohou také pomoci označit nenávistné výroky a další porušující obsah, ale tyto kategorie jsou velmi závislé na kontextu a zdůrazňují důležitost lidského přezkumu pro konečné rozhodnutí. Více než 87 % z 9 milionů videí, které YouTube odstranilo ve druhém čtvrtletí roku 2019, bylo poprvé označeno automatizovanými systémy.

Do těchto automatizovaných detekčních systémů významně YouTube investuje a týmy inženýrů je neustále aktualizují a zlepšují každý měsíc. Například aktualizace systémů detekce nevyžádané pošty ve druhém čtvrtletí roku 2019 vedla k více než 50 % nárůstu počtu kanálů, které byly odstraněny kvůli porušení zásad týkajících se spamu.

Odstraňování obsahu ještě před jeho zobrazením

Softwarový inženýři se snaží zajistit to, aby obsah, který porušuje pravidla serveru YT, nebyl před odstraněním celý prohlížen nebo dokonce zobrazen. Vylepšení v automatizovaných systémech označování spamu nebo škodlivého obsahu pomohlo detekovat a zkontrolovat obsah ještě předtím, než je označen komunitou YouTube. Server zaměřující se na sdílení obsahu rovněž uznává, že nejlepším způsobem, jak rychle odstranit obsah, je předvídat problémy dříve, než se objeví.

V lednu roku 2018 interní pracovníci spustili zpravodajský tým, který monitoruje zprávy, sociální média a zprávy uživatelů. Je nutné zjistit nové trendy obklopující nevhodný obsah, a snažit se zajistit, aby je týmy byly připraveny je řešit dříve, než se stanou větším problémem. YouTube je nadále odhodláno snižovat publikaci videím, která porušují zásady komunity. V celé společnosti Google pověřili přes 10 000 lidí detekováním, kontrolou a odebíráním obsahu, který porušuje zásady video-serveru.

EY nástrojem pomůže vyhodnotit uživatelskou, sociální a etickou rovinu

EY (Ernst & Young) novým nástrojem pomůže firmám vyhodnotit uživatelskou, sociální a etickou rovinu jejich řešení v oblasti umělé inteligence.

  • Platforma EY Trusted AI napomáhá identifikovat a omezit specifická rizika řešení umělé inteligence (AI).
  • Jedním z cílů je posílit všeobecnou důvěru v nové technologie a odstranit tak hlavní překážku širšího uplatnění umělé inteligence.

Společnost EY dokončila vývoj jedinečného souboru nástrojů, který uvádí na trh pod označením EY Trusted AI. Jde o platformu, která zhodnotí dopady a důvěryhodnost systémů založených na umělé inteligenci.

Platforma EY Trusted AI vystavěná na technologii Microsoft Azure, umožňuje souhrnně posoudit, monitorovat a kvantifikovat účinky a důvěryhodnost implementovaných prvků umělé inteligence. K rozboru technického návrhu konkrétního systému využívá pokročilé analytické modely. Lze tak získat detailní přehled o relevantních rizicích s ohledem na jeho nasazení, použité technologie, aspekty provozního prostředí nebo míru autonomie v porovnání s lidským činitelem. Koncovým výstupem je bodové ohodnocení zkoumaného řešení.

EY nástrojem pomůže vyhodnotit uživatelskou, sociální a etickou rovinu
EY nástrojem pomůže vyhodnotit uživatelskou, sociální a etickou rovinu

Koncepční rámec EY Trusted AI představuje službu

„Důvěra je v tomto segmentu prvořadá, nejde jen o položku na seznamu, kterou si odškrtneme před tím, než je systém AI spuštěn. Na rozdíl od klasického softwaru, který lze modifikovat a v případě potřeby v něm opravit chyby, může být neuronová síť, vycvičená pomocí zkreslených dat, nepoužitelná. Celá investice by tak přišla vniveč. Koncepční rámec EY Trusted AI představuje službu, která organizacím po celém světě umožní posílit důvěru v řešení na bázi AI a vytěžit z příslušných technologií trvalou hodnotu,“ říká Vladislav Severa, vedoucí partner týmu pokročilé datové analýzy ve společnosti EY a dodává: „V EY disponujeme řadou vlastních aplikací využívajících principy umělé inteligence, které nacházejí uplatnění u klientů v různých oblastech, od zvýšení spokojenosti zákazníků, až po optimalizaci skladových zásob. Při využití těchto nástrojů je stále více kladen důraz na etiku. Jsme proto rádi, že nyní představujeme nástroj, který pomáhá kvantifikovat vyvíjená řešení s cílem minimalizovat rizika umělé inteligence a tím napomoci jejich uplatnění v reálném světě a přijetí ze strany společnosti.“

Komplexní algoritmy stanoví bodové skóre

Nová platforma poskytuje cenné poznatky vývojářům AI, vedení firem nebo pracovníkům odpovědným za řízení rizik. Komplexní algoritmy stanoví bodové skóre vyvíjeného systému, v rámci hodnocení jsou zohledněny dopady na uživatele, ale také nezamýšlené důsledky v rovině sociální nebo etické. Benefitem zmírňujícím zbytková rizika je i posouzení celkové vyspělosti systému. EY Trusted AI tak pomáhá podnikům lépe pochopit rizika a připravit se na nová, která mohou podkopat důvěru v nabízené produkty, značky, ale také vztahy a dlouhodobou reputaci.

K vytvoření rizikového profilu zkoumaného řešení AI slouží řada názorných hodnoticích nástrojů, uživatele jimi provádí interaktivní webové rozhraní EY Trusted AI. Uživatelsky přívětivé vizualizace poskytují rychlý přehled o okamžité míře relativního rizika společně s dalšími podrobnostmi. Klíčovou výhodou platformy EY Trusted AI je schopnost dynamického řízení rizik předpovídáním možných dopadů, pokud se určitá komponenta AI změní – například co do rozsahu funkcí nebo úrovně autonomie. Lze tak získat přehled o rizicích konkrétního využití AI, spolu s adekvátním zhodnocením systémů z hlediska jejich tolerance vůči riziku.

Podstatou našich síťových služeb Microsoft Azure

„Pomáhat uplatňovat AI v souladu s etickými zásadami, ať již při vývoji nových řešení nebo implementaci AI do řešení stávajících, je jedním ze základních principů přístupu společnosti Microsoft. Podstatou našich síťových služeb Microsoft Azure je umožnit vytvářet aplikace, či služby na bázi umělé inteligence, všem vývojářům a datovým analytikům, a to pro nejrůznější scénáře. S přispěním platformy EY Trusted AI na Azure mohou podniky budovat pokročilé systémy AI, disponující vysokou mírou důvěry a zabezpečení, což je z hlediska úspěšného nasazení a rozvoje těchto řešení zcela zásadní,“ doplňuje Steve Guggenheimer, viceprezident společnosti Microsoft pověřený vedením divize AI Business.

EY Trusted AI je nabízena jako samostatná i řízená služba. Vychází z open-source architektury, která usnadňuje rychlé nasazení. Rozsah funkcí bude pravidelně aktualizován a rozšiřován, mimo jiné o nové metriky hodnocení rizik AI, metody měření či nástroje průběžného sledování. Podrobnější informace o EY a využití prvků umělé inteligence najdete na webových stránkách https://www.ey.com/en_gl/ai.

Google Panda aneb čistý internet

Google před dvěma měsíci oznámil hlavní aktualizaci svého vyhledávacího algoritmu, který si klade za primární cíl odstranit nekvalitní stránky z výsledků vyhledávání.

Nový a hlavně sám plující algoritmus Panda zlepší pozice kvalitním stránkám s cenným a originálním obsahem. Brázdí též kalné vody českého internetu.

Google Panda aneb čistý internet
Google Panda aneb čistý internet

Celá aktualizace je postavena na propůjčení vyšší kvality výsledků a vede k odstranění stránek s duplicitním nebo zavádějícím obsahem. Změna algoritmu bude mít dopad na 6% hledaných dotazů ve všech jazycích.

Kvalita a hloubka článků je pro vyhledávač v tomto případě klíčová. Zde se ještě můžeme zastavit nad odezvou ze sociálních sítí, ta je v tomto směru taktéž směrodatná a vyhledávač ji bere v potaz.

Nezbývá nic jiného, než tvořit stránky srdcem a poskytnout uživateli plnohodnotné a kvalitní informace, které svými zuby zhodnotí Google Panda.

Matt Cutts proti duplicitě

Matt Cutts, šéf Google Webspam Team do nebes povznáší novou spamovou kontrolu.

Jedná se o nový algoritmus, který má zabránit duplicitnímu textu nad textem originálním. Nový kód dle M. Cuttse nemá rapidně ovlivnit vyhledávání, dnes se ale většina webmasterů přesvědčila o tom, že to tak není. Dle prohlášení by se neměly změny přenést přes 0.5 %, ale u některých webů se číslo zvětšilo až 120 krát.

„Zaznamenali jsme pokles o 1020 % u téměř všech pozic pro naší největší a nejstarší stránku,“ stěžuje si například uživatel pod nickem Drall v diskuzi na WebmasterWorld. „Nezáleží na tom, že náš obsah je stoprocentně původní se spoustou zpětných odkazů. Takže jaký je vlastně vzkaz Googlu? Napište kvalitní článek, který vám zabere tři dny a odkazuje na něj mnoho firem, ale vaši pozici nakonec stejně získá web s neužitečným a nepůvodním obsahem?“ dodává.