Exkurze seznam.cz 2008 Mozektevidi.net - Mozektevidi.net.

Exkurze seznam.cz 2008

Jak probíhala naše třídní exkurze do nejúspěšnějšího českého internetového vyhledávače? Odpovědi na otázky a nějaké fotografie

image of Exkurze seznam.cz 2008

Průběh naší výpravy

Když jsme dorazili před budovu seznamu, měli jsme časovou rezervu. Po vstupu do budovy nastaly menší komplikace cestou výtahem, který odmítal spolupracovat. Nejprve jsme ho trochu přetížili, ale nakonec rozum zvítězil na technikou a do 4. patra jsme se dostali.

Po příchodu nás sympatická tisková mluvčí Rita Gabrielová uvedla do zasedačky pro 10 lidí (bylo nás 27) a mohli jsme začít. Řekla něco k historii firmy a zeptala se, kdo používá seznam. Přihlásilo se dost lidí, včetně mě. Sice nevyužívám fulltextové vyhledávání ani email, ale stále tu jsou mapy.cz. Nemálo lidí používá i spolužáky, lidé.cz, sreality a mnohé další.

Pak přišel technický ředitel Vlastimil Pečínka, který nám vyprávěl technické věci a také nějaké perly. Hodně v pohodě chlápek a taky dobrý řečník.

technický ředitel seznamu Vlastimil Pečínka

Nejprve připravený seznam otázek

1] Jak bojujete proti tzv. SEO FAKE. Mám na mysli například několik stovek klíčových slov skrytých na stránce (malé písmo, slabé barvy, div hidden). Existuje mnoho takových stránek, mezi častá FAKE klíčová slova patří „Animace, videa, zdarma, ke stažení, download…"
2] Jak se bráníte duplicitním obchodů na zboží.cz. Nějaký rádoby podnikatel si založí 10 internetových obchodů s trochu jiným designem, kde zboží načítá ze stejné databáze a cena se liší v řádu několika korun. Na stránce vyhledávání zboží je pak 10 stejných výrobků jednoho prodejce na několika obchodech.
3] Kolikačlenný team dohlíží na bezpečnost webových stránek. Mám na mysli například nedávné XSS ve vyhledávání, pomocí JS přesměrování emailové pošty na jiný účet a možnost stahování map ve vysokém rozlišené přes skript
4] UI umělá inteligence při řazení výsledků vyhledávání. Například apple vs apples (počítač mac nebo jablka), synonyma, záměna i y, oprava pravopisných chyb, skloňování časování…
5] Koho považujete za konkurenci? Google.cz nebo atlas a centrum? 6] Víme, že se od googlu inspirujete, ale zajímalo by mne, jestli s ním spolupracujete i jinak? A s centrum, atlas je nějaké spolupráce?
7] Stream.cz. Za kolik se nakoupil stream.cz, jaká je jeho návštěvnost, denní trafik a plány do budoucna?
8] Návštěvnost homepage, její dení trafik, počet sql dotazů na stránku, počet sql dotazů do tatabáze za hodinu provozu?
9] Co se všechno zaznamenává od uživatelů? Doba setrvání na stránce, hledaná slova, navštěvnování a využívání vašich dalších projektů (stream, novinky, super, email, mapy, inzerce, seznamka) nebo na to nejsou kapacity. Zaznamenávají se pokusy o XSS, skenování portů, spamování, odesílání vulgární pošty, posílání warez v emailu a další poloilegální činnosti? Jsou na to vůbec HW kapacity?
10] Uvažujete o zakoupení nebo vytvoření linkovacího projektu? Například linkuj.cz, zalinkuj.cz, topclanky.cz? Myslím, že taková služba by si zasloužila větší propagece a ve vašem portofilu chybí.
11] UI při vyhledávání. yz, yi, sz, skloňování, časování, oprava hrubek (vydeo), překlepy (sonyekrikson) a tak dále.
12] Bere se v potaz css a tagy del? Například, jestli váš bot, který prohledává stránky čte css a bere v potaz class hidden, nebo malé písmo (seo fake). Jak je to s tagem DEL (přeškrtnutní slova), bere se v potaz?
13] Duplicitní obsah a kradení obsahu. Bojujete proti tomu? jak vnímáte tzv rss čtečky, které sbírají rss ostatních webů a vytvářejí tzv duplicitní obsah? Je nějaká možnost takové stránky nahlásit a dělá s tím seznam něco? Na kolika lidech záleží, zda se www vyřadí z indexu nebo ne? Je možné se bránit proti vyřazení z indexu?
14] Jaké používáte operační systémy? Linux, windows? Jaké distra? XP nebo Vista?
15] Používají například vývojaři jiné OS než grafici?
16] Jak se může běžný uživatel bránit proti spamu?

A konečně odpovědi

1] Není odpověď, ale snaží se.
2] Pár takových obchodů už odstranili na základě oznámení. (report možná i můj)
3] Takže bezpečnost mají na starosti 2 lidi + .cCuMiNn. ze soom.cz
4] Synonyma jsou ve stádiu beta, v blízké době by se měla nasadit do provozu.
5] Kohokoliv. Konkurence jsou všichni, co se zabývají stejnou věcí. Nikoho neberou na lehkou váhu.
6] Spolupráce? Hrají spolu fotbal, zatím se hrálo jen jednou, seznam vyhrál. V příštím kole by snad měl team google.cz. Dále seznam fulltext vyhledává i pro atlas.
7] Za kolik se koupil stream.cz je tajné, ale já to od důvěryhodného zdroje vím. Jedná se o řádově desítky miliónů :) jinak návštěvnost je na netmonitoru a internetová konektivita streamu je stejně velká celého seznamu dohromady. Využívá se asi 3Gbit 
8] Návštěvnost seznamu? 2,3M za den. To je slušné. Taky je to nejnavštěvovanější stránka u nás v ČR.
9] :)
10] :)
14] Na serverech jednoznačně linux debian. Stejně tak na stanicích u vývojařů jsou ve většině linuxové distribuce. Ale grafici, produkční a zbytek kanceláří mají okýnka. Pokud je potřeba windows server, tak se emuluje ve vmware.

Jiří Chomát Manažer systému Sklik

Jak je vidět, seznam odpovídal jenom na věci, které jsou obecně známé. Věci, které jsou příliž interní (za kolik se koupil stream.cz a jestli plánují linkovací projekt) a tudíž i veřejnosti nepřístupné.

Ivo Lukačovič v akci

Přesto se mi exkurze líbila. Viděl jsem prostředí, kde se dělá na zboží, sreality, sauto, sinzerce, technickou podporu a slyšel mnoho perliček.

Serverovna a další fotky

Všechny fotky se do jednoho článku nevejdou, já jsem moc fotek nenafotil, protože mě přestal poslouchat mobil. Zbytek fotek někdy později přesunu do fotogalerie. Zapoměl jsem zmínit, že jsme byli i v serverovně v TTC TECHCOM CENTRUM, kde má seznam něco kolem 600ti serverů.

A poslední informace z první ruky: Seznam.cz příští týden oznámí nové služby určené pro mobilní internet. K některým službám (lide,email…) vytváří i mobilní verzi určenou pro mobilní telefony. Více zatím nepovím, počkejte do příštího týdné na oficiální vyjádření seznamu.


autor článku OS | datum publikování 7.únor.2008 19:16 | recenze nejčastěji na HW recenze |

Kometáře

#1 lo3k wwwwww.pisem.cz

přesně jak jsem čekal ... bylo nad slunce jasné je, že nepusti nic zajímavého reaguj

datum 07.02.2008 20:36

opera gnu-linux

#2 MzK wwwmozektevidi.net

reakce na »lo3k«: Naopak, plno zajímavých věcí… klidně bych tam jel příští rok znova a na dýl… Je to úspěšná regionální firma a je tam plno lidí, co si na nic nehrajou i když můžou. reaguj

datum 07.02.2008 20:38

opera gnu-linux

#3 stegy wwwwww.stegy.yw.sk

Ale ajtak to musela byt super exkurzia. Keby som mal moznost hned by som ju vyuzil. reaguj

datum 07.02.2008 20:39

firefox windows-xp

#4 Jumboom www

Když jsem pročítal otázky, (který jsou dost trefný) čekal jsem aspoň odpověď na stejný úrovni. Ale seznam (stejně jako většina podniků při exkurzi) nepřekvapil.
Ovšem neřikám že mě prostředí a způsob práce v seznamu nezajíma a že bych se tam rád nepodíval.. reaguj

datum 07.02.2008 20:39

opera windows-xp

#5 matej21 wwwcompinex.cz

chyby par odpovedi na nejaky otazky.. a mezi nima i na tu ktera me zajimala skoro nejvic a tj 13 :) s tema rss cteckama.. aby mi nevyoutovali rss.cix.cz :P sice jeste skoro nic nezaindexoval ale doufam ze za mnou pride :) .. tu odpoved ses nedozvedel nebo jen nezverejnil? :) reaguj

datum 07.02.2008 21:59

firefox linux-ubuntu

#6 Subber wwwmozektevidi.net

Hmm,hmm,takze opravdu nic zajimaveho. No,dalo se to cekat. Co ti rekli to se vedelo, co se chce vedet tak je tajny. No nevim, ja bych tam jel ale nic svetobornyho bych necekal. reaguj

datum 07.02.2008 22:10

safari symbian

#7 Nobelicek wwwmozekhovnovidi.net

reakce na »MzK«: Regionalni? Ses posral v kine ne? :D Vis co je to region? :D Chudak seznam takhle mu ublizit :D

BTW: TTC Telehouse -> Taky sme tam uz par serveru nastehovali. Maji lepsi konektivitu a zazemi :) reaguj

datum 08.02.2008 07:48

firefox windows-xp

#8 Tommy wwwsumatra.wz.cz

docela závidím:) a sem zvědavej na fotky;) reaguj

datum 08.02.2008 11:51

firefox windows-xp

#9 Bloker www

Taky bych se tam rád podíval, je to velice zajímavé, ale na to naše škola nikdy nepojede. Bohužel reaguj

datum 08.02.2008 15:52

opera windows-xp

#10 Kvaky wwwkvaky.ic.cz

Já bych se tam taky rád podíval, ale máme to trošku z ruky... reaguj

datum 08.02.2008 16:01

opera windows-xp

#11 stegy wwwwww.stegy.yw.sk

Aj ja to mám dost od ruky :( Ale keby som mal sancu tak tam urcite idem. reaguj

datum 08.02.2008 21:22

firefox linux-ubuntu

#12 neznaboh www

Chybi ti tam sesta otazka, ale mas tam na ni odpoved;-) reaguj

datum 08.02.2008 22:02

opera windows-xp

#13 Anonymous_ wwwgoogle.com

to neznaboh: Asi jsi slepej :D

"..6] Víme, že se od googlu inspirujete, ale zajímalo by mne, jestli s ním spolupracujete i jinak? A s centrum, atlas je nějaké spolupráce?.."

Jen to nema odentrovany a je to ve stejnem odstavci jak 5]..

jinak k tematu, bylo jasne ze vam nedaji vice nez obycejne verejnosti, jen kvuli tomu ze jste se dostali na exkurzi..

.. jinak, urcite to muselo byt pekne, take by me to zajimalo, ackoliv jsem se dostal uz do vetsich spolecnosti a myslim si ze seznam nemuze byt zajimavejsi :)

.. pouze 2 technici na bezpecnost? ... pfff :)

ale otazky byly trefne, sam bych nevymyslel lepsi ;) reaguj

datum 09.02.2008 15:39

firefox windows-xp

#14 Anonymous_ wwwgoogle.com

joa btw.. tady mas logo w XP, ale s transparentnim pozadim, zkus ho tam hodit misto tveho nynejsiho, urcite to bude vypada mnohem lepe.. ted kdyz postnu prispevek, tak mam w XP logo a bilej ctverec kolem nej a za tim sedy pozadi.. misto te bile je transparent lepsi, zkus to ;)
img122.imageshack.us/img122/5589… reaguj

datum 09.02.2008 15:43

firefox windows-xp

#15 Devian www

Taky bych tam rád zašel se juknout :) reaguj

datum 09.02.2008 16:14

internet-explorer-5 windows-xp

#16 Devian www

reakce na »Devian«: MSIE 5,5 by se mohl identifikovat jinak, než jako mozilla.. :) reaguj

datum 09.02.2008 16:14

internet-explorer-5 windows-xp

#17 MzK wwwmozektevidi.net

reakce na »Anonymous_«: Díky, ikonku jsem zaměnil :) už by to mělo být o něco lepší.
reakce na »Devian«: V user agen máš „Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; InfoPath.2; .NET CLR 1.0.3705)“ tak si moc nevymýšlej :P
Co teda máš za prohlížeč? MSIE 5,5? To někdo používá? reaguj

datum 09.02.2008 18:58

opera gnu-linux

#18 devian www

reakce na »MzK«: reaguj

datum 09.02.2008 19:10

firefox windows-xp

#19 devian wwwwww.stahni.net

reakce na »devian«: Za tohle se omlouvám, omylem enter
reakce na »MzK«: I MSIE 7 se ti hlásí jako "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1;...."
I MSIE 6 apod, jen se mění to "compatible; MSIE x", kde x je číslo verze. A ano, skutečně jsem měl MSIE 5,5 (mám vše od 3,0; ale 3,0 je "lehce" nestabilní).
Mám to kvuli MSIE 7 - mám ho zde a testuju v něm weby. Ale potřebuju i MSIE 6 - takže jsem si sehnal Multiple IE, ten ti dovolí mít na PC všechny IE od 3,0 - někdy je zábava prohlížet weby ve MSIE 4 :)
Akorát nefunguje ve Vista, což mne netrápí. reaguj

datum 09.02.2008 19:15

firefox windows-xp

#20 BoB wwwwww.lakave.info/bob/

Ad otazka 6) - Stran spoluprace mam trochu jine informace, ale z naprosto logickych duvodu je tu nemohu prezentovat, takze si jen muzes lamat hlavicku, co by to tak mohlo byt?! ;o) reaguj

datum 13.02.2008 00:04

firefox windows-xp

#21 Rixo www

Jsem rad, ze odpoved na otazku 12) asi ani nepadla, protoze ta otazka je nesmysl. Roboti CSS neprochazi, to je vubec nezajima, stejne tak nejake nazvy trid jsou jim ukradene atd. Je opravdu skoda, ze do Seznamu poustit na exkurzi nevzdelane pubertaky, kteri o tom vsem vi leda tak kulove. reaguj

datum 14.02.2008 13:30

firefox windows-xp

#22 MzK wwwmozektevidi.net

reakce na »Rixo«: Robot by css mohl procházet právě kvůli black seo (skrytý text právě přes css). Nevzdělaný puberťák jsi ty :P reaguj

datum 14.02.2008 17:13

opera gnu-linux

#23 Kvaky wwwkvaky.ic.cz

reakce na »MzK«: hele, mozku, a nějakej robot css prochází? reaguj

datum 14.02.2008 19:38

opera windows-xp

#24 MzK wwwmozektevidi.net

reakce na »Kvaky«: To právě nevím, proto jsem se na to ptal, protože si myslím, že je s tím něco potřeba dělat. Ze seznamu se dostanu na spousty webů například o prodeji topných článků a dole pod stránkou mají přes css skryté videa a animace ke stažení atd… reaguj

datum 15.02.2008 06:58

opera gnu-linux

#25 Nobelicek wwwmozekhovnovidi.net

reakce na »MzK«: Tak je napraskame :) reaguj

datum 15.02.2008 08:14

firefox windows-xp

#26 pi-ka-chu-ka www

reakce na »Nobelicek«: pracuj:) reaguj

datum 15.02.2008 10:38

firefox windows-xp

#27 kuba www

Pokud se o Seznam zajímáš víc, tak seznamáci dělávají každý rok přednášky v Brně, Praze a Plzni na univerzitách (FI MUNI, FEL ČVUT, a nějaká plzenšká :)). A přednášky jsou veřejné takže tam klidně můžeš zajít.
is.muni.cz/predmety/predmet.pl reaguj

datum 21.02.2008 23:36

konqueror gnu-linux

#28 mixer www

co znamena smajlik v odpovedi na bod 10 - jo/ne nebo nic? reaguj

datum 27.02.2008 15:31

firefox windows-xp

#29 ShaiMagal wwwshaimagal.org/

Taky bych jel na exkurzi, ale radsi do google :-P seznam se ale taky da, kazdopadne ja se toho nikdy nedockam. reaguj

datum 17.03.2008 22:53

firefox windows-xp

Nové kometáře nejsou povolené.