Jaroslav Gratz (Seznam.cz): Silná konkurence nás žene dopředu
40:46

Jaroslav Gratz (Seznam.cz): Silná konkurence nás žene dopředu

02.12.2021
Novým hostem v podcastu Nejen o rekamě byl tentokrát programátor fulltextového vyhledávání v Seznamu. S Martinem Jandorou si povídali o tom, jak taková práce programátora vypadá, co stojí za fungováním funkce vyhledávání na Seznamu a jak se pracuje s neuronovou sítí. Je těžké stát se programátorem? Neřekl bych, že je to těžké. Ale při této práci je potřeba uvažovat určitým způsobem. Umět algoritmizovat úlohu a rozpadnout ji na menší části. V určité formě se to může naučit každý. Ale důležitá je také praxe. Co stojí za službou Vyhledávání a jak se vyvíjí? Mašinérie za tím je tak veliká, že je těžké to jednoduše popsat. V poslední době je to celé o strojovém učení, zatímco před deseti lety to bylo spíše o hledání klíčových slov. Uživatelé však dnes očekávají, že po zadání dotazu vyhledávač pochopí, co přesně myslí a co chtějí vyhledat. Nedávno jsme udělali velký technologický skok, když jsme použili ve větší míře neuronové sítě. Jsou to právě transformers modely, které umí pochopit význam dotazu uživatele a význam stránek. Pracovali jsme na tomto projektu téměř rok. A jak přesně funguje neuronová síť? Tento projekt pro nás představoval docela riziko. Do této doby jsme zatím nic podobného nezkusili. Ale věděli jsme, že to pro nás může mít velký přínos. Technologie již zmíněných transformers modelů je hodně disruptivní, to znamená že redefinuje způsob, jak se věci dělají a jak je nad tím potřeba přemýšlet. Předtím po zadání klíčového slova engine hledal stránky, které to klíčové slovo obsahují. Nyní se dotaz převádí do abstraktní matematické reprezentace, konkrétně do vektoru, a hledají se stránky, které tomu vektoru nejvíce odpovídají. A to je něco, co vyžaduje úplnou změnu uvažování a pohlížet na vyhledávání jiným způsobem. Pozoruješ na sobě někdy kódovou slepotu? Každý člověk dělá chyby a také seniorní vývojáři dělají chyby. Proto je potřeba zavést mechanismy k eliminaci takových chyb. Psát testy ke kódu a dělat code review. Lidské chyby se tímto způsobem snažíme eliminovat na minimum. Dá se říct, že má vývojář svůj specifický rukopis? Když dva vývojáři napíšou jeden kód, nikdy nebude identický. Ale to neznamená, že by byl jeden z nich horší. A co dalšího uslyšíte? Jak funguje Jarkův pracovní tým? Jak se ve svém oboru vzdělává?

Podcast Nejen o reklamě je vložený na túto stránku z otvoreného informačného zdroja RSS. Všetky informácie, texty, predmety ochrany a ďalšie metadáta z informačného zdroja RSS sú majetkom autora podcastu a nie sú vlastníctvom prevádzkovateľa Podmaz, ktorý ani nevytvára ani nezodpovedá za ich obsah podcastov. Ak máš za to, že podcast porušuje práva iných osôb alebo pravidlá Podmaz, môžeš nahlásiť obsah. Ak je toto tvoj podcast a chceš získať kontrolu nad týmto profilom klikni sem.

Táto webová stránka používa súbory cookies, ktoré sú potrebné pre správne fungovanie a skvalitňovanie webovej stránky. Ďalšie informácie o tom, ako používame súbory cookies, nájdete tu.
Bližšie informácie o spracúvaní osobných údajov ako aj o súboroch cookies nájdete tu.

Technické cookies

Vždy aktívne cookies sú nevyhnutne potrebné na základné fungovanie. Bez týchto súborov by sme nemohli poskytovať služby, ktoré umožňujú tejto stránke fungovať.

Funkčné cookies

Funkčné cookies vylepšujú fungovanie webových stránok, nakoľko si môžu pamätať napríklad informácie ako používateľské meno, jazyk alebo preferovanú polohu. Vďaka zapamätaniu si Vašich volieb môže stránka poskytovať vylepšené a osobnejšie služby.

Analytické cookies

Tieto cookies zhromažďujú anonymné informácie o tom, ako používatelia využívajú webové stránky. Z týchto dát sa dozvieme, ako používatelia reagujú na stránku poskytnutím informácií o tom, aké oblasti navštívili, aký čas na našej stránke strávili, a či sa pri tom vyskytli nejaké problémy, napríklad chybové hlásenia, čo nám pomáha vylepšovať webovú stránku.

Marketingové cookies

Marketingové cookies pomáhajú sledovať Vaše online návštevy a aktivitu na našich webových stránkach. Uvedené pomáha poskytovať a zobrazovať Vám relevantnejšie reklamy alebo obmedzujú počet zobrazení reklamy. Tieto súbory cookie môžu zdieľať tieto informácie s inými organizáciami alebo inzerentmi. Ide o trvalé súbory cookie a takmer vždy pochádzajú od tretích strán.