Exkurze seznam.cz 2008 Mozektevidi.net - Píše Olda Šálek.

Exkurze seznam.cz 2008

Jak probíhala naše třídní exkurze do nejúspěšnějšího českého internetového vyhledávače? Odpovědi na otázky a nějaké fotografie

image of Exkurze seznam.cz 2008

Průběh naší výpravy

Když jsme dorazili před budovu seznamu, měli jsme časovou rezervu. Po vstupu do budovy nastaly menší komplikace cestou výtahem, který odmítal spolupracovat. Nejprve jsme ho trochu přetížili, ale nakonec rozum zvítězil na technikou a do 4. patra jsme se dostali.

Po příchodu nás sympatická tisková mluvčí Rita Gabrielová uvedla do zasedačky pro 10 lidí (bylo nás 27) a mohli jsme začít. Řekla něco k historii firmy a zeptala se, kdo používá seznam. Přihlásilo se dost lidí, včetně mě. Sice nevyužívám fulltextové vyhledávání ani email, ale stále tu jsou mapy.cz. Nemálo lidí používá i spolužáky, lidé.cz, sreality a mnohé další.

Pak přišel technický ředitel Vlastimil Pečínka, který nám vyprávěl technické věci a také nějaké perly. Hodně v pohodě chlápek a taky dobrý řečník.

technický ředitel seznamu Vlastimil Pečínka

Nejprve připravený seznam otázek

1] Jak bojujete proti tzv. SEO FAKE. Mám na mysli například několik stovek klíčových slov skrytých na stránce (malé písmo, slabé barvy, div hidden). Existuje mnoho takových stránek, mezi častá FAKE klíčová slova patří „Animace, videa, zdarma, ke stažení, download…"
2] Jak se bráníte duplicitním obchodů na zboží.cz. Nějaký rádoby podnikatel si založí 10 internetových obchodů s trochu jiným designem, kde zboží načítá ze stejné databáze a cena se liší v řádu několika korun. Na stránce vyhledávání zboží je pak 10 stejných výrobků jednoho prodejce na několika obchodech.
3] Kolikačlenný team dohlíží na bezpečnost webových stránek. Mám na mysli například nedávné XSS ve vyhledávání, pomocí JS přesměrování emailové pošty na jiný účet a možnost stahování map ve vysokém rozlišené přes skript
4] UI umělá inteligence při řazení výsledků vyhledávání. Například apple vs apples (počítač mac nebo jablka), synonyma, záměna i y, oprava pravopisných chyb, skloňování časování…
5] Koho považujete za konkurenci? Google.cz nebo atlas a centrum? 6] Víme, že se od googlu inspirujete, ale zajímalo by mne, jestli s ním spolupracujete i jinak? A s centrum, atlas je nějaké spolupráce?
7] Stream.cz. Za kolik se nakoupil stream.cz, jaká je jeho návštěvnost, denní trafik a plány do budoucna?
8] Návštěvnost homepage, její dení trafik, počet sql dotazů na stránku, počet sql dotazů do tatabáze za hodinu provozu?
9] Co se všechno zaznamenává od uživatelů? Doba setrvání na stránce, hledaná slova, navštěvnování a využívání vašich dalších projektů (stream, novinky, super, email, mapy, inzerce, seznamka) nebo na to nejsou kapacity. Zaznamenávají se pokusy o XSS, skenování portů, spamování, odesílání vulgární pošty, posílání warez v emailu a další poloilegální činnosti? Jsou na to vůbec HW kapacity?
10] Uvažujete o zakoupení nebo vytvoření linkovacího projektu? Například linkuj.cz, zalinkuj.cz, topclanky.cz? Myslím, že taková služba by si zasloužila větší propagece a ve vašem portofilu chybí.
11] UI při vyhledávání. yz, yi, sz, skloňování, časování, oprava hrubek (vydeo), překlepy (sonyekrikson) a tak dále.
12] Bere se v potaz css a tagy del? Například, jestli váš bot, který prohledává stránky čte css a bere v potaz class hidden, nebo malé písmo (seo fake). Jak je to s tagem DEL (přeškrtnutní slova), bere se v potaz?
13] Duplicitní obsah a kradení obsahu. Bojujete proti tomu? jak vnímáte tzv rss čtečky, které sbírají rss ostatních webů a vytvářejí tzv duplicitní obsah? Je nějaká možnost takové stránky nahlásit a dělá s tím seznam něco? Na kolika lidech záleží, zda se www vyřadí z indexu nebo ne? Je možné se bránit proti vyřazení z indexu?
14] Jaké používáte operační systémy? Linux, windows? Jaké distra? XP nebo Vista?
15] Používají například vývojaři jiné OS než grafici?
16] Jak se může běžný uživatel bránit proti spamu?

A konečně odpovědi

1] Není odpověď, ale snaží se.
2] Pár takových obchodů už odstranili na základě oznámení. (report možná i můj)
3] Takže bezpečnost mají na starosti 2 lidi + .cCuMiNn. ze soom.cz
4] Synonyma jsou ve stádiu beta, v blízké době by se měla nasadit do provozu.
5] Kohokoliv. Konkurence jsou všichni, co se zabývají stejnou věcí. Nikoho neberou na lehkou váhu.
6] Spolupráce? Hrají spolu fotbal, zatím se hrálo jen jednou, seznam vyhrál. V příštím kole by snad měl team google.cz. Dále seznam fulltext vyhledává i pro atlas.
7] Za kolik se koupil stream.cz je tajné, ale já to od důvěryhodného zdroje vím. Jedná se o řádově desítky miliónů :) jinak návštěvnost je na netmonitoru a internetová konektivita streamu je stejně velká celého seznamu dohromady. Využívá se asi 3Gbit 
8] Návštěvnost seznamu? 2,3M za den. To je slušné. Taky je to nejnavštěvovanější stránka u nás v ČR.
9] :)
10] :)
14] Na serverech jednoznačně linux debian. Stejně tak na stanicích u vývojařů jsou ve většině linuxové distribuce. Ale grafici, produkční a zbytek kanceláří mají okýnka. Pokud je potřeba windows server, tak se emuluje ve vmware.

Jiří Chomát Manažer systému Sklik

Jak je vidět, seznam odpovídal jenom na věci, které jsou obecně známé. Věci, které jsou příliž interní (za kolik se koupil stream.cz a jestli plánují linkovací projekt) a tudíž i veřejnosti nepřístupné.

Ivo Lukačovič v akci

Přesto se mi exkurze líbila. Viděl jsem prostředí, kde se dělá na zboží, sreality, sauto, sinzerce, technickou podporu a slyšel mnoho perliček.

Serverovna a další fotky

Všechny fotky se do jednoho článku nevejdou, já jsem moc fotek nenafotil, protože mě přestal poslouchat mobil. Zbytek fotek někdy později přesunu do fotogalerie. Zapoměl jsem zmínit, že jsme byli i v serverovně v TTC TECHCOM CENTRUM, kde má seznam něco kolem 600ti serverů.

A poslední informace z první ruky: Seznam.cz příští týden oznámí nové služby určené pro mobilní internet. K některým službám (lide,email…) vytváří i mobilní verzi určenou pro mobilní telefony. Více zatím nepovím, počkejte do příštího týdné na oficiální vyjádření seznamu.


autor článku Oldřich Šálek | datum publikování 7.únor.2008 19:16 | recenze nejčastěji na HW recenze |

Kometáře


Komentáře a diskuze ke článku tady
diskuze ke článku