Yahoo! Placemaker - геопарсинг в действии
edinburgh
[info]sigizmund

Написал статью на Хабре о продукте, который мы разрабатывали последние несколько месяцев - рекомендую почитать тем, кому интересна тема.


Совсем недавно – 20 мая, компания Yahoo! объявила о выходе своего нового продукта, на данный момент не имеющего аналогов – Yahoo! Placemaker, сервисе гео-парсинга, основной целью которого является извлечение гео-релевантной информации из документов различного формата. Презентация прошла, как принято говорить, "при большом стечении народу" и закончилась "аплодисментами, переходящими в овацию" – задумка и реализация определенно понравилась, и какое-то время в Твиттере можно было наблюдать довольно-таки позитивный поток комментариев на эту тему. Но вот представление окончено, все расходятся по домам, и начинают задавать вопросы: так что же это такое?

Как уже было сказано, Placemaker – это веб-сервис, который позволяет извлечь гео-релевантную информацию из некоторого документа. Тут есть сразу несколько моментов, которые нуждаются в пояснении. Во-первых, что это за документы, из которых можно извлекать информацию? А во-вторых, что это за такая гео-релевантная информация, а самое главное – кому и зачем она нужна?

Читать дальше на Хабре


YQL
edinburgh
[info]sigizmund
Yahoo! Query Language - YDN
Uploaded with plasq's Skitch!


Вы знаете, что такое YQL? Я, в принципе, знал - но как то мне было очень уж лениво разбираться, что же это такое, в деталях. А сегодня с утра случайно попробовал. И вы знаете, это очень, очень клево.

Если в двух словах, то YQL = Yahoo! Query Language, дает возможность получать доступ ко многим сервисам Yahoo! и не только посредством унифицированного SQL-подобного языка. На недавно прошедшем London OpenHackDay, немалоизвестный Расмус Лердорф (Rasmus Lerdorf, автор PHP) долго восхищался возможностями этой платформы. На картинке – один из примеров использования этого сервиса: получение доступа к Yahoo! GeoPlanet: мы "спрашиваем" сервис, какие "соседи" есть у района Лондона Camden Town. Мы делаем выборку из некоторых таблицы, хотя на самом деле это – веб-сервисы.

Главная прелесть YQL состоит в том, что мы можем с легкостью "смешивать" данные разных сервисов: например, Flickr и GeoPlanet, добавив community-based "таблицу" для FriendFeed – или чего-то еще. То есть в каком-то смысле YQL – идеальное средство для прототипирования и создания mash-up сервисов.

Постараюсь рано или поздно написать более подробно про эту замечательную платформу, пока же даю ссылку на пост Расмуса, где он очень хорошо рассказал как раз про интеграцию с GeoPlanet средствами YQL. Когда я с ним разговаривал (пару недель назад) он был в буйном восторге от возможностей этой связки – посмотрим, что он скажет после 11 AM по западному времени, когда Yahoo! представит новый, абсолютно и совершенно новый продукт, в разработке которого я принимал непосредственнейшее участие (и даже на каких-то направлениях возглавлял ее)...

Наклейки и лаптопы
edinburgh
[info]sigizmund
В раздумьях, то ли наклеить все эти наклейки на девственно-серебряную крышку рабочего лаптопа, превратив его тем самым в новогоднюю ёлку и уподобясь всем остальным yahoos, то ли оставить все как есть?



Интересно, угадает кто-нибудь, что означает значок кулака в почти советском гербе? ;-) (нет, поручик, совсем не то, что вы подумали – не то, а совсем даже другое!)
Tags:

Размышления о работе
edinburgh
[info]sigizmund
Приближаемся к очень большому, супер-мажорному релизу - будем выкатывать новый продукт. Совсем новый, никто такого не делал и ни у кого такого нет. Обстановка в офисе накаляется, продакт менеджмент в штатах находится в состоянии перманетной истерики (потому что никто ничего не успевает), QA выпадает в глубокую медитацию (пытаясь понять, так ли оно должно работать), девелоперы злые и на раздражители отвечают через раз.

Ну как и всегда, в общем-то. Только, честно говоря, в таком большом релизе такого серьезного продукта я принимаю участие впервые (есть четкая уверенность, что он попадет на первые страницы многих технических сайтов и журналов, и от этого немного страшно - потому что шквал критики будет обязательно).

Ну а пока начинаю засиживаться на работе до 8 вечера, и придя домой, первым делом достаю еще теплый лаптоп и проверяю багтрекер - чего там нового QA в Штатах на-qa-ил. Маразм крепчал. Близился релиз.

С первым апреля!
edinburgh
[info]sigizmund
Занимаюсь вбросом говна в вентилятор классической провокацией. Есть у нас в Яхушечке такой список рассылки - devel-random[at]yahoo-inc.com. И используется он, в общем-то, для обсуждения чего угодно, связанного с Яхушечкой — от глюков багзиллы до предложений для Y! Mail, и трафика этот список генерит препорядочно.

Сегодня вечером (полчаса назад) весь Yahoo! получил видеобращение от Кэрол Бартц (наша СЕО), в котором она сообщила, помимо всего прочего, что по ее соображениям на devel-random уходит слишком много времени и она приняла решение его закрыть. Ну в общем она вдохновенно несла чушь в течении 10 минут, после чего поздравила всех с 1 апреля и отвалила.

А дальше началось интересное - я отправил в этот самый devel-random сообщение, что-де, вот (ссылка) Кэрол закрывает наконец наш спамогенератор - а то задолбал, понимаешь! За 10 минут я получил полсотни имейлов, в которых:
  • мне указывали на то, что сегодня первое апреля
  • говорили, что если мне не нравится, я могу отписаться
  • и только два человека поздравили меня с удачным вбросом этого самого в вентилятор - думаю, не лишне будет сказать, что оба - по странному стечению обстоятельств, оказались из UK
Потом подошли коллеги, и я им пожаловался, что зря-де Кэрол поздравила всех с первым апреля - порушила всю шутку. На это мне с полным серьезом ответили, что бы я не забывал, что работаю в американской компании, а для американцев ирония и чувство юмора - понятия практически абстрактные, и если им не показать: "вот здесь юмор! надо смеяться! смеяться! слышишь как все смеются?! и ты смейся!" - то шутка просто останется неоцененной.

Так или иначе, дискуссия в спамо-генераторе набирает обороты - народ уже предлагает переименовать список в "devel-0Nt39dD3fGsxI" и менять вторую части имени каждые 5-10 минут на случайно сгенерированную строку. Ну что я могу сказать? С первым апреля вас всех!

P.S. Особенно порадовало предложение Расмуса Лердорфа - того самого, который аффтор языка PHP:
Simply renaming it to devel-ɯopuɐɹ would provide a natural filter splitting the population into the Unicode and non-Unicode aware.

Новый формат рабочего пространства
edinburgh
[info]sigizmund


Ну вот дошло и до небольшой перестановочки на работе. Я избавился от своих трех мониторов и двух рабочих станций, переключателя KVM и всей этой лапши - на замену я поставил один монитор-девятнашку (который IT должны сегодня-завтра заменить на 24") и один MacBook 13" Unibody. И вот так вот оно мне очень, очень нравится! :) Осталось по примеру всех Yahoo!-шников обклеить крышку лаптопа наклейками до неузнаваемости - и все готово.

Про работу
edinburgh
[info]sigizmund
А дело-то все в том, что ... нет, не так. По-другому начнем.

Исторически так сложилось, что за взаимодействие с группой Research в нашей команде отвечает ваш покорный слуга. Отвечает и отвечает, ничего особого это не требовало до последнего времени; да и не так сложно с ними общаться. Вообще говоря, для тех кто не знает, Research - это bunch of nerds группа ученых, которые full-time занимаются решением проблем, интересных для Yahoo!, решение которых позволит увеличить релевантность -> profit.

Так-то оно так, но на практике получается все несколько иначе. Ученые эти - ребята ну очень умные, и мне не всегда легко следовать своими не самыми вроде глупыми мозгами за их мыслью (хотя может я и зря прибедняюсь - пару раз и мне их удалось крепко удивить, но речь не о том). Так вот, решают они задачи, проблемы ставят, пишут статьи, и рапортуют о том, что готово решение, использование которого позволит нам повысить F-score чуть ли не на два порядка в два раза. Ну почти готово, то есть. То есть вот они доделывают, да. И им бы очень нужна помощь инженера, потому как у самих что-то вот чуть-чуть совсем не получается.

Ну блин, я тут для того и есть - тем более, что это решение мы ждем довольно давно, и внедрение его действительно позволит очень сильно упростить получение ... не о том речь. Речь о том, что я начал разбираться, что у них есть и в чем проблема. Прихожу я к ним (виртуально, конечно, пока - они в Барселоне) и спрашиваю: ну что тут? Где код, документация, ... примеры... тесты?!?! То есть как нету?!?!?!?!

душераздирающие подробности )

Удивляюсь или гиковские радости
near the ocean
[info]sigizmund
Продолжаю удивляться, какое же огромное количество знаний об окружающем мире содержится в различных вебдванольных сайтах. Вот сейчас занимаюсь анализом данных Flickr'а - это же просто кладезь какой-то! И не надо намекать, что-де у меня повышенный к ним доступ - нифига подобного, в целях ускорения процесса (approve data feed'а - это две недели висения на телефоне со Штатами), тупо выкачиваю данные через публичный Flickr'овский API - мне реально больше не надо, там и так хватает.  Нашел несколько очень милых районов в итальянских Альпах, которые практически неизвестны в англоязычном интернете - а вот в итальянском сегменте наоборот активно обсуждаются, постятся фотографии - в том числе и на Flickr. А надо-то просто пойти и взять их, никакой закрытой информации, все свободно!

P.S. пишу очередную "внутреннюю" статью research-характера, сочиняя подход, который почти наверняка мне удастся протолкнуть и внедрить - но вот напечатать статью эту, к сожалению, мне никто и никогда не даст, несмотря на протесты группы Research, что подтверждается множественными предыдущими случаями :-)

P.P.S. \LaTeX продолжает рулить и бибикать по множественным причинам!


(no subject)
edinburgh
[info]sigizmund
Хм. Выглядит неплохо. С чего бы это? ;-)



Кризис окончен? ;)


Яхушечка все-таки радует
edinburgh
[info]sigizmund
Query Assist работает как надо :-)


Mobile/Geo Developers Group
edinburgh
[info]sigizmund
Вчера был на встрече geo/mobile dev-group, которая проходила в офисе Гугла. Ну что я могу сказать?


  • Про само мероприятие рассказывать не буду. Подавляющему большинству - даже гиков - тема будет неинтересна и не очень понятна, потому как крайне узкоспециализированная. Однако я уверен что здесь есть те, кто "в теме" (я прям-таки даже знаю об этом) - вот им ссылка на наш корпоративный блог, Гэри неплохо написал.

  • Google. Как мне тут уже рассказали, он протягивает шлюпки экипажу тонущего корабля - но на это я отвечать не буду :) Офис - вы знаете, если бы я пришел туда после банка, то я бы сказал ВАААААААУ и писал бы кипятком. После года в Yahoo! - ну ничешный такой офис, забавный, да. У нас прикольнее, однозначно. Идея называть митинг-румы станциями метро Лондона - очень неплохо :) у нас пабы - что тоже забавно.

  • О чем этот пост? да ни о чем, на самом деле. Но подумать действительно есть о чем - некоторые мысли, которые высказывались, были настолько нетривиальны, что не обратить на них внимание - ступить по полной.

  • Ах да. В понедельник напишу товарищам из Гугла - они обещали выложить запись на YouTube, но по-моему их надо пнуть для этого. Если кому-то интересно - выложу сюда


Вот где-то так.

P.S. говнофото в корпоративном блоге - мой айфон ;) ну да, трэш, но камеру я не стал туда брать.

Хм.
edinburgh
[info]sigizmund
Пойти что ли на Джерри Янга посмотреть? Как только что выяснил, он на 5 этаже презентацию какую-то проводит.


Update: Забил и слушаю/смотрю его скринкаст онлайн. Из уважения отвел на него целый монитор и теснюсь на двух.

Update 2: У Джерри АйФон! Я это вижу своими глазами! :-)
Tags:

Ну блин вы даете...
edinburgh
[info]sigizmund
Стоило Балмеру по пьяной лавочке словом обмолвиться...


Yahoo! Product Fair
edinburgh
[info]sigizmund
Оторвал на этом тусняке замечательные flip-flops модного сиреневого цвета :-)

Верхний менеджмент
edinburgh
[info]sigizmund
Был на митинге с товарищем, по имени Аш Пател (Ash Patel). В принципе - нормальный такой классный дядька, и не скажешь что "небожитель" (в том смысле, что репортит он не кому-нибудь, а Джерри Янгу лично). Очень интересно рассказывал о том, что мы делаем сейчас и что в ближайших планах, но помимо этого - очень понравилось, как на вопрос который всех волнует (i.e. «Microsoft v. Yahoo») он говорил минут 10 но не сказал абсолютно ничего.

Это, безусловно, следствие большого жизненного опыта :-))

Yahoo Россия, Путин и космическая гонка
edinburgh
[info]sigizmund


Нет, определенно ребята в Yahoo Россия собираются отмечать 12 апреля с толком ;-) щас найду кому это отправить...

Национальный вопрос
edinburgh
[info]sigizmund
Вы знаете, я удивлен. Вот уже вторую неделю я работаю в Yahoo! и пока я тут не видел ни одного русского кроме меня самого (да и тот под сомнением). Странно, правда?
Tags:

Подводя итоги недели
belgo think
[info]sigizmund
Итак, что у нас случилось на этой неделе?

0. Ура нас покупает Microsoft!
1. Мы начали работать в Yahoo! Europe.
2. Поняли, насколько тут все запущено
3. Признались в собственном отупении
4. Сделали небольшой прогресс вчера, и
5. Сегодня засабмитили свой первый багфикс в куске кода, даже назначение-то которого понять сложно. Попутно засабмитили 5 багрепортов.

В принципе, мой несколько пессемистичный настрой середины недели ближе к концу активно меняется на умеренный оптимизм - в общем-то, если дергаться то все двигается, и нерешаемых задач не бывает. Что не может не радовать.

Ну вот....
edinburgh
[info]sigizmund
Ну только блин на новую работу устроился, и вот на тебе...
Tags:

А еще только четверг...
edinburgh
[info]sigizmund
А я уже как выжатый лимон. Нда, братцы-кролики, джава-джава, банки и акции - отупел я окончательно, а думать себя заставлять - куда как неприятно... А ведь приходится, и процесс этот сопряжен со значительными сложностями...

Home