Елена Колмановская: «Информационный мусор – проблема не только интернета, а вообще окружающей среды»
Главная > Медиа > Новости > Елена Колмановская: «Информационный мусор – проблема не только интернета, а вообще окружающей среды»
4 Июля 2016
Елена Колмановская: «Информационный мусор – проблема не только интернета, а вообще окружающей среды»

Интервью с Еленой Колмановской хочется начинать со слов «разрешите к вам обратиться». Потому что Елена – сооснователь Яндекса, а к поисковику Яндекса в течение дня мы, бывает, обращаемся чаще, чем к кому бы то ни было. Наш респондент просит обращаться к ней исключительно по имени, потому что «Елена Савельевна – это только для врачей и государства». В команде, создавшей Яндекс, она была первым непрограммирующим человеком (хотя по образованию инженер-математик и писать код умела). Впоследствии создала отдел маркетинга, сама себе придумала должность и самовольно покинула ее, перейдя на позицию консультанта. На апрельском семинаре в «Репном» мы расспросили Елену подробнее о том, что такое интернет сегодня и какое место в нем занимает Яндекс, как реализуется образовательная функция интернета, и немного поговорили о командообразовании.


— Вопрос обывательский, от пользователя и для пользователей: чем Яндекс лучше Google?

DSC_2011.jpg— Тем, что Яндекс нравится гораздо большему количеству пользователей. Дальше я могу выдвигать гипотезы, за счет чего мы лучше, но фактически больше половины поисковых запросов России сегодня задаются именно Яндексу.

— Сейчас остро стоит проблема нерелевантности поисковой выдачи. Громкие, нередко далекие от содержания статьи заголовки, раскрутка через новостные агрегаторы, «мусорный» SEO-контент – и пользователь выходит совсем не на то, что искал. Как вернуть интернету чистоту?

— Хорошего решения нет, иначе бы уже сделали. Когда-то поисковые системы ориентировались только на текст страницы, сейчас они используют множество внешних сигналов. В том числе все они учитывают действия человека, задавшего запрос – по каким ссылкам он перешел, с каких страниц и т.д. К сожалению, то, что люди на что-то кликают, не обязательно является критерием ценности. В смысле, извините, есть такое утрированное маркетинговое выражение: ешьте дерьмо, миллионы мух не могут ошибаться. Хорошо бы придумать набор содержательных факторов, когда-то этими факторами были ссылки, и Google замечательно придумал PageRank, определяющий авторитетность страницы в интернете. (PageRank определяет «важность» веб-страницы количеством ссылок, которые на нее ссылаются. – Прим. «Репное».) Но, используя этот важный сигнал,  Google практически убил интернет-каталоги, количество ссылок на страницу стало валютой – инструментом накрутки. В России, например, функционирует биржа ссылок, в Америке та же история. И поисковики борются с тем, что они сами породили. Порой на рынке появляются маленькие компании, которые заявляют, что делают более «чистый» поиск с помощью ручной фильтрациии источников, но так тоже не работает, «руками» просто нельзя угнаться за ростом данных. Сформулировать, что такое содержательная, качественная информация – это хорошая и очень нетривиальная задача. Если кому-нибудь это бы удалось, можно было бы написать алгоритм. Информационная замусоренность – проблема не только интернета, а вообще окружающей среды. Можно подумать, что поток, который льется из  телевизора или печатных газет, много чище! Интернет лишь зеркало информационной среды. Другое дело, он дал много средств, чтобы добавить что-либо в интернет было проще, чем газету напечатать, и это доступно всем, а не узкому слою издателей. Я пока не вижу каких-либо подходов к новому качественному уровню решения проблемы.


Метод машинного обучения Матрикснет. Формула ранжирования Яндекса


— В вузах не учат SEO, не учат работать с паблишинг-платформами. Многое, что требует сегодня рынок от специалистов, не входит в академическое образование.

— Не согласна, что в вузах надо учить SEO. Вот были раньше такие специалисты – операторы ЭВМ, которые практически исчезли после появления персональных компьютеров. А некоторые люди по сей день пишут в резюме: уверенно владею Вордом и Экселем. Сейчас это совсем смешно, хотя вот я не бухгалтер и Экселем владею неуверенно, но, очевидно, овладею, как только мне что-то конкретное потребуется. Вуз должен научить человека тому, чтобы, когда ему потребуется разобраться с паблишинг-платформами, он сделает «раз-два-три-четыре» и разберется. Не надо учить Ворду. Надо знать, какой инструментарий для решения таких-то задач и как его найти, а дальше взять его и использовать. Если человек знает о существовании SEO, то он уже что-то понимает про поисковые системы, а дальше он пойдет и купит книжку. Или найдет ее в интернете. Или сходит на лекцию и научится. Мне даже не кажется, что для этого нужно высшее образование. Вы же не требуете, чтобы вуз учил людей водить автомобиль? Потому что каждый в состоянии прочесть про дорожные знаки, взять уроки вождения и сдать экзамен. Вуз должен учить человека учиться: подойти методически, попробовать, узнать, кто здесь гуру, каковы лучшие практики и т.д.

— Если образование рассматривать как процесс воспитания, то что в нас может воспитать интернет?

— Интернет, он как нож – можно колбасу нарезать, а можно убить. Поэтому сам по себе интернет ничего воспитать не может. Он дает образовательные возможности, это библиотека, доступ к дистанционному обучению, к книгам, к научным статьям, и при этом в нем много мусора, шелухи. Сейчас у нас в «одном клике» столько информации, сколько и не снилось доинтернетовским поколениям. Раньше информация была не только дозирована, но и с понятным источником — вот это сказано в Большой советской энциклопедии, а вот это говорят бабушки у подъезда, а вот это на заборе написано… Сейчас источником может стать любой аноним. Предыдущая цивилизация не научила человека отличать полезное от вредного в области информации, как, например, животные различают ядовитые грибы. Интернет несомненно можно использовать для полезного, но он настолько нов, что надо помогать людям понимать его особенности.

— Как вы думаете, придем ли мы к цензуре в интернете?

— А что считать цензурой? К примеру, кто-то пойдет голым по улице, его заберут, потому что у нас не принято. Если считать цензурой это, то в интернете она уже есть (например, педофилия). Я уточняю определение, поскольку цензура чаще слово ругательное, имеют в виду удушение свободной мысли и тому подобное. Не любое поведение человека в обществе является общественно приемлемым. Когда людям не дают ходить голыми, нам это кажется правильным. В 60-х годах людям резали узкие брюки и стригли челки, сейчас нам это кажется идиотизмом. Чем больше вопрос нормальности разрешает общество, тем лучше. Плохо, когда цензура – история от одного лица.


DSC_1977.jpg

— До какого предела искусственный интеллект может имитировать интеллект человека?

— Пока интеллекта роботов не хватает на то, чтобы улицы подметать или квартиры убирать. Максимально, что есть, это пылесос, который умеет запоминать комнату и устроить карту движения – и это большое достижение. Но этот пылесос работает с поверхностью одного типа – плоской. К такому, чтобы отличить фарфор от других материалов, искусственный интеллект пока еще близко не подошел. При этом компьютер уже довольно давно обыграл чемпиона мира по шахматам, и совсем недавно выиграл в го. Го принципиально отличается от шахмат тем, что там количество комбинаций не просто огромно, а бесконечно. Это подняло волну дискуссий о том, что же такое интеллект. Кажется, следующий рубеж – это изобретательство.

— Насколько законы эволюции распространяются на программные продукты?

— Законы эволюции были про природу, а человек предпринимает массу усилий, чтобы не зависеть от природы. По закону эволюции социальная сеть как Фейсбук должна была погибнуть, и там большинство маркетологов должно было погибнуть, но они тем не менее неплохо себя чувствуют. Так что, боюсь, там про законы не эволюции, а психологии масс, массового рынка. Есть печальная шутка современных физиков: было бы здорово, если бы оказалось, что на землю падает крупный метеорит или астероид, и все физики Земли должны объединиться, чтобы защитить Землю. И вместо того, чтобы заниматься вопросом, как они друг в друга будут стрелять, они бы занялись защитой Земли. Вот это была бы хорошая физическая задача. Законы эволюции человека, к сожалению, ничего не говорят про эволюцию человечества в целом. Мы многое знаем про людей, и я вообще-то оптимист, но то, что ровно сейчас происходит с человечеством, мне очень не нравится. Я б не удивилась, если еще через пару лет ученые бы выяснили, что два-три года назад произошла буря на Солнце или возник какой-то ранее неизвестный ядовитый газ, и оказалось, что человечество немного отравилось и перестало соображать. Потому что осуществляется масса странных действий, которые ни разу не похожи на эволюцию человечества в целом.


Технология распознавания речи. Акустическая модель Яндекса


— В конкуренции продуктов и программ, созданных человеком, какой критерий главный? Удобство для пользователя или возможность развития?

— Исторически сложилось так, что в интернете очень многое бесплатно, и это не улучшает качества. Есть очень качественные платные почтовые программы с удобным интерфейсом, над ними думают люди, для которых это вполне бизнес, но у них нет тех миллионов и миллиардов пользователей, которые сидят в почтовых программах Mail.Ru, Google, Yahoo, Microsoft и т.д. Эти популярные программы имеют массу недостатков, но они бесплатные, и в глазах потребителей это перевешивает. Люди не чувствуют, что их продают на рекламу, их это мало волнует. В интернете так сложилось и все привыкли. Это очень затрудняет определение качества. Деньги, даже небольшие – это настолько сильный критерий по сравнению с нулем, что они качество забивают. Чтобы жить на рекламную модель, ты должен быть очень большим. Почты Mail.Ru, Gmail или Яндекс вполне хороши и не уступают друг другу, но все они точно хуже FastMail, который платный.

— Каким проектом Яндекса вы особенно гордитесь или выделяете среди остальных?

— Ядро Яндекса – это все равно всегда поиск. Когда его начинали, интернет был гораздо проще, информации было относительно мало и всего одного вида – текстовая. Когда мы впервые проиндексировали русский интернет, 2/3 было написано по-английски. По очень простой причине: в 1997 году домашних пользователей практически не было, потому что еще не было провайдеров, умеющих доставлять интернет в квартиры. В то время пользователями интернета были сотрудники академических институтов или IT-компаний, и если кто-то решал делать себе сайт, он делал его на 2-х языках, т.к. не ожидал много русских пользователей. А заметная часть русских сайтов была в домене .com, потому что наши ребята уезжали в Америку учиться, а там в университетах уже были компьютерные классы с интернетом. В основном это было какое-то количество ресурсов типа Kulichki, где люди развлекались русским языком в интернете. Все сильно выросло – очень изменился состав информации, но по-прежнему  поиск – очень важный и востребованный сервис. Можно его делить на части – поиск по картинкам, поиск по видео, но все равно самое главное направление Яндекса – это не портал, а поиск. Из более прикладных проектов я считаю очень удачным проект Яндекс.Пробки и сейчас удачный проект Яндекс.Транспорт. В свое время Яндекс.Такси просто преобразовал рынок такси в Москве.

Технология Спектр. Как Яндекс исследует поисковые запросы


— Яндекс не планирует в рамках Яндекс.Диска создать документы по типу Google Документов?

— Это периодически обсуждается, но упирается в вопрос оценки аудитории, которой это нужно. Людей, хранящих фотки, гораздо больше, чем людей, которым нужно редактирование документа прямо в облаке.

— А если рассуждать из соображений госбезопасности?

— Да, журналисты одно время развлекались тем, что искали у госорганизаций публичные мэйлы. Но по-хорошему это должны быть правила безопасности жизни государственных людей и организаций, информационной политики. Вот мы ходили в Администрацию президента в 2006 году, когда Путин в очередной раз общался с народом и к этому делу впервые привлекли интернет. Яндекс был площадкой по сбору вопросов через интернет, причем можно было не только задать свой вопрос, но и голосовать за уже имеющиеся, таким образом повышая вероятность получения ответа. Мы тогда впервые входили в Кремль через Спасскую башню. Там на входе сдаешь мобильный телефон, ноутбук, а внутри работает собственная защищенная сеть, и есть только одна специальная комната с «публичным» интернетом. Видимо, поэтому документы из Кремля еще ни разу не утекли в Wikileaks. Там, где это серьезно, где это военная тайна – там об этом уже подумали. Там, где более гражданское и волнует меньше – еще нет. В этом должен быть регламент государства, и в свете нашей с Западом повышенной «любви» я думаю, что задачу доведут до ума. Просто она пока не первой важности на государственном уровне.

Как устроена антивирусная система Яндекса


— Была история у Яндекс.Маркета с государством, когда у встал вопрос ответственности сервиса за юридическую чистоту интернет-магазинов, которые он выдает. Как эта ситуация разрешилась?

— По-моему, никак не разрешилась. Вообще эта ситуация – вопрос не Яндекс.Маркета, а государственной политики: что является законной продажей, а что нет. Казалось бы, если все желающие видят, что какой-то магазин ведет серую продажу через Яндекс.Маркет и это незаконно, то, товарищи милиция, идите в этот магазин, Яндекс.Маркет тут при чем? Это очень беспокоит крупные российские магазины, но мало беспокоит государство и правоохранительные органы, поэтому магазины и пытаются лоббирововать идею ответственности Яндекса. Понятно, под фонарем светло и искать лучше там… Вот, например, таксисты в России должны быть лицензированы, и Яндекс.Такси сказал «окей, мы принимаем в систему только таксистов, имеющих лицензию, потому что мы выполняем закон». А тут нет закона, есть туманные рассуждения. Я не знаю ни одного дела по закрытию магазина. Мы все время объясняем: магазин есть, сайт есть, адрес есть, чего вы от нас-то хотите? Довольно понятно, что интернет вносит новые отношения в старые системы. До интернета не было проблемы трансграничного оказания услуг, потому что парикмахеры не умеют стричь через границы. Истории, кто где должен платить налог, где чьи данные должны храниться – они все новые и находятся в процессе урегулирования. Возвращаясь к торговле и к понятию серого импорта: имеет ли право только Apple ввозить свои «яблоки» для продажи, или любой добросовестный приобретатель? Это государственный вопрос о правилах торговли. Конечно, для Apple удобнее здесь продавать по одной цене, в США по другой. Но у нас люди не такие богатые, и если кто-то везет из Америки и продает дешевле, я вообще не вижу в этом проблемы.


DSC_1962.jpg

— В электронных проектах иногда наблюдается противостояние отделов IT и маркетинга. Айтишники считают себя элитой компании, подстрекая маркетологов, что те лишь палят бюджеты. А маркетологи воспринимают программистов как строителей, которые только «плитку кладут», не заботясь о концепции продукта во внешнем мире. Вы как человек, который внутри Яндекса был первым представителем маркетинга, скажите, что важнее?

— Это зависит от бизнеса. Программисты задирают нос по той простой причине, что они дороже стоят, поскольку они – экспортный товар довольно большого спроса. Сейчас на рынке такой перекос. Да, программисты действительно могут уехать в Европу или Штаты даже при минимально-базовом знании английского языка и программировать там. Маркетологи в этом смысле менее конвертируемые, потому что они часто привязаны к почве, к языку и т.д. Технологи часто плохо понимают, как выглядят люди, которые не такие глубокие специалисты, как они. Маркетологи могут им в этом помочь. А еще – сделать так, чтобы люди узнали о существовании продукта, и принести технологам обратную связь от пользователей.

Главное – сначала выяснить, одинаково ли маркетологи и технологи понимают цель. Цель может быть любой: заработать как можно больше денег, построить главный магазин по продаже чебурашек, осчастливить всех велосипедистов и т.д., но надо понимать ее, обсуждать вместе. Если у технологов упал софт, интернет-магазин не сможет продавать чебурашек. А  если маркетологи неправильно угадали с ценой и завысили стоимость, то чебурашек не будут покупать. Надо не думать, кто главнее, а вместе нормально работать на общую цель. В компаниях, где люди препираются, плохо с командой, я им сочувствую. В Яндексе главнее программисты, потому что основное – поиск, много технических нюансов. Но программисты поиска понимают, что у хорошего поиска, который они делают, должен быть хороший дизайн: и красивый, и понятный, и удобный. А еще про разные новые возможности поиска желательно так рассказывать, чтобы все понимали, кому и зачем они нужны – и делают это пиарщики. 

Праздничный логотип из Музея Яндекса


Когда мы в 2000-м году ставили на проект менеджера, программист говорил: зачем он мне, я без него знаю, как, скажем, писать почту. Да, устройство ты знаешь, только ты не знаешь, с кем обсудить, какая фича важнее, потому что это не обязательно то, что наиболее  нравится твоим друзьям. И что такое дизайн? Это вообще понимание, как мир устроен. Когда программист делает дизайн, это конец света. У них очень специальное представление: главное, чтобы им все было понятно. Поэтому лучший в мире дизайн для программиста – это терминал в Linux, в котором можно напрямую отдавать команды компьютеру. Но потом яндексовые программисты прониклись и стали требовать: пусть будет менеджер, он мне сформулирует эти ваши разговоры в конкретное техническое задание. И всем стало хорошо, не выясняя, кто главнее. Правильная ситуация в команде – когда одни понимают, зачем им другие.

Беседовала Ирина Трофимова


Вернуться