brumka: (Default)
[personal profile] brumka

недавно Google открыл свой PoP в пригороде Атланты, один из первых на восточном берегу. Наткнулся на весьма поучительную статью схематично описывающию архитектуру Гугловской системы. Объясняют на пальцах, язык очень простой. Очень грамотно (хм, ещё бы :-)

Особенно, в свете потрясшей меня в своё время заметки в кулере, где некий умник спекулировал о Гугловской команде, просматривающей контент на предмет релевантности. Я и сам не особо дружил с комбинаторикой, а теперь, пожалуй, и вообще забыл почти всё, что помнил, но это ИМХО полная глупость:

Плюс, не забывай чем гугль обязан такой высокой релевантностью и полным отсутсвием порнухи. Все элементарно. В гугле сидит несколько десятков (сот?) человек и просматривают базу гугля на предмет актуальности, сортируют, отлавливают порнуху, и так далее.

Или я чего-то не понимаю?

ИМХО, задача просмотра проиндексированных страниц должна быть сравнима по сложности с Эшелоном

P.S. В начале 2003го года, я за кружкой пива слушал байки моего (тогда потенциального шефа) сотрудника, бывшего одним из ведущих специалистов в Sun в отделе суперкомпьютерных технологий. Через Sun oн занимался секретными проектами для правительств некоторых европейских государств и рассказывал о мощностях, необходимых для дешифровки различного траффика. К чему я? Гугл - public company, а значит все внутренние расходы являются достоянием публики и обязаны присутствовать в отчётах. Скрыть работу [постоянно растущего, пропорционально росту инета] отдела цензоров должно быть практически невозможно.
From: [identity profile] brumka.livejournal.com
спасибо. да, всё так и есть... просто смешно слышать реплики вроде "ну, чего вы хотите, Гугл круче Яндекса ибо у них там цензоры работают..."
From: [identity profile] ly0lik.livejournal.com
Совсем в не в тему: у меня объявился новый альбом Авишая Коэна ("Trio and Ensemble. At Home"). Любишь такого? Если да, то предлагаю натуральный обмен — метсо на сервере твоё, музыка моя: выложим для друзей и френдов на недельку, пусть порадуются вместе с нами:-)
From: [identity profile] brumka.livejournal.com
честно говоря, не слышал. что это?
From: [identity profile] ly0lik.livejournal.com
хороший израильский джазмен, фортепиано и контрабас. Вполне себе нью-йоркского уровня парень, играл с Чиком Кореа.

Если тебе нравится Азиза, думаю, понравиться и Коэн:-) Ну так как, желаете ознакомитсься?
(deleted comment)
From: [identity profile] ly0lik.livejournal.com
в воскресенье нашим утром-днём, ок?
обрати внимание, приятная мелочь от BBC: http://www.bbc.co.uk/radio3/beethoven/listenagain.shtml

ПС. начальник, ты бы под спрятал эти данные от посторонних глаз!..
From: [identity profile] brumka.livejournal.com
только вернулись из Флориды

ок, я затер аккаунт...

на днях посмотрю

спасиб за ссылку

From: [identity profile] ly0lik.livejournal.com
Илюха, верни логин, плз!
я ничё не успел залить - задурился!!!
пароль и имя сбрось по электронний почте.

Сорри за беспокойста!

Date: 2005-06-19 09:34 pm (UTC)
From: [identity profile] ly0lik.livejournal.com
Google круче Яndex'а, патамушта у них денег сильно больше;-) ты посмомтри, КТО у них инвесторы, кто у них в совете директоров сидит.

Мозги, алгоритмы, железо тогда и купить можно...

Date: 2005-06-20 02:55 pm (UTC)
From: [identity profile] brumka.livejournal.com
знаешь, я как-то слыхал инсайдерские истории из Яндекса. Даже если всё делить на 3 - уши в трубоку сворачиваются. конечно, Гугл это знамя партии, на которое равняется весь инетовский комсомол. Но и Яндекс позиционирует себя как крупнейший рунетовский проект...

Да и ладно, я не буду их пиписьки тут мерять. Просто полюбопытствовал, на сколько реально для проекта таких масштабов перепроверять релевантность контента

Date: 2005-06-20 10:31 pm (UTC)
From: [identity profile] ly0lik.livejournal.com
Прости, но какого сорта истории? О том как всё на коленях сделано(שכונתי), или наоборот? Отец мой периодически такие «напильниковые» истории про Интель рассказывает, что мне хочется не думать о том, какие процессоры стоят на атомных станциях, самолётах, автомобилях и молокозаводах...

А ручная фильтрация контента — почему бы и нет;-) Как последняя степень доводки, после всех автоматических анализаторов и фильтров. Бесплатный автоматический фильтр спама на Yahoo!Mail пропускает 1-2% грязи. Не исключаю, что специализированные алгоритмы Гугля эффективнее на много порядков, так что отдел из нескольких десятков цензоров и аналитиков вполне может справляться с отсеиванием того, что прошло фильтры, но было помесено как сомнительное.

И заметь, такой отдел может офоициально заниматься доводкой и tuning'ом фильтров, что безусловно необходимо, и cуть правда. Ну, почти правда:-)

Profile

brumka: (Default)
brumka

December 2025

S M T W T F S
 123456
7 8910111213
14151617181920
21222324252627
282930 31   

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 03:36 pm
Powered by Dreamwidth Studios