"Вбивця" Google і платних підписок. Уродженець Ніжина створює новий пошуковик – в чому його унікальність
Українець Дмитро Герасименко створив сервіс з просування сайтів Ahrefs, яким користуються Uber і Netflix, та який приносить засновнику десятки мільйонів доларів. Тепер він кидає виклик Google.
У світі існує безліч пошукових систем. Першою з них була Yahoo!, яка з'явилася практично три десятиліття тому, в далекому 1994 році.
Зараз найпопулярнішим є Google, яким, як свідчать червневі дані, користуються 92,47% всіх користувачів. Його найближчий конкурент – Bing від Microsoft. Хоча на думку самого Google, найчастіше у Bing запитують, "де завантажити Google".
У Китаї популярна Baidu, в Росії – Яндекс, а серед людей, які турбуються за свої персональні дані – DuckDuckGo, що працює на відкритому коді за принципом збереження анонімності.
Утім незабаром на ринок вийде ще один гравець – пошукова система від творців Ahrefs – SEO-сервісу і аналізатора посилань, якbq в найближчому майбутньому може стати "вбивцею Google".
Як буде працювати новий пошуковик, за рахунок чого він може нав'язати боротьбу глобальному монополісту, та й ще з такою дивною назвою, і коли він почне працювати? На ці та інші запитання відповідає CEO Ahrefs Дмитро Герасименко.
— Как и почему возникла идея создать поисковик, когда есть Google, у которого более 90% рынка? Почему захотелось выйти на этот путь конкуренции?
— Для меня этот путь всегда был интересный. Но я не понимал, зачем делать поисковик, когда есть Google. Он бесплатный, и там все классно, все хорошо работает.
Но так как на нашем основном проекте (SEO-сервисе – ЕП), мы очень много работаем с вебмастерами (люди занимающиеся техническим обслуживанием сайтов – ЕП), то видим, какие у них проблемы с Google.
Например, он начинает убирать некоторые веб-сайты с результатов поиска и всё больше и больше добавляет свои сервисы. Они пытаются всё строить вокруг себя и не дают трафик другим.
В какой-то момент возникла мысль: как это можно было бы сделать лучше? Например, почему бы не компенсировать тем, кто пишет контент? Есть этот контраст, когда они (Google – ЕП) используют контент Википедии у себя в результатах поиска.
Но мы видим, что Википедия каждый год показывает баннер "дайте нам 5 долларов, чтобы мы оплатили свои сервера", а Google зарабатывает 160 миллиардов долларов в год, используя контент Википедии. И, как бы, все "ОК". А мне кажется, это не "ОК".
Идея с поисковиком зародилась с мыслями об интернете, о котором мы все мечтали. Когда по поисковому запросу отображаются самые топовые знания, а не реклама, на которой Google просто зарабатывает. Это также история с несправедливостью, ведь создатели контента, которые работают над качеством материала, проверяют его, должны зарабатывать за свой труд непосредственно через бизнес-модель 90/10.
— Как будет работать модель 90 на 10?
— На веб-страницах, когда вы создаете блог или новостной сайт, или что угодно, нужно будет разместить ID автора. И тогда наш кроулер (crawler – программа, которая систематически делает запросы в интернете для создания веб индекса (хранилище копии всех веб страниц в интернете – ЕП) увидит этот ID и пропишет, что этот контент ваш.
Самая интересная задача проекта – найти критерий оценки контента, чтобы создатели получали справедливую плату. Мы планируем ввести "метрику полезности" контента, чтобы определить сумму выплаты по модели распределения прибыли.
Создатели будут получать 90% от всей рекламной прибыли поисковика в зависимости от полезности созданного ими контента. Мы планируем делиться прибылью со всеми создателями контента, вне зависимости от сферы его применения – будь то шоппинг-обзор или энциклопедические знания.
Скандальні розслідування про роботу Facebook: що розповіла Сенату інсайдер "Шон" та як на це відреагував Цукерберг
— Будете ли вы как-то "трекать" пользователей и выдавать им более релевантный контент, условно, смотреть на их предыдущие поисковые запросы?
— Мы не хотим "трекать". Изначально мы хотим сделать так, чтобы у нас не было истории пользователей. Конечно, сами запросы нам надо где-то хранить, чтобы мы могли улучшать наш результат поиска. Нам нужно знать, что люди вообще ищут.
Но мы не хотим создавать историю запросов человека, не хотим, чтобы была возможность отследить, что вы искали. Поэтому мы изначально отрезаем информацию, которая может вас идентифицировать и дальше уже обрабатываем у себя в системе без этой информации.
Тут нужно четко разделить персональную информацию пользователя и поисковые запросы. Поисковые запросы – это информация, которую пользователь вбивает в поисковую строку, чтобы мы понимали, каких запросов больше, каких меньше, как работать с рекламодателями, как улучшать алгоритмы и так далее.
Персональная информация, которую Google и другие поисковые системы собирают и хранят для того, чтобы продавать рекламодателям и компаниям для исследований – это другая история.
То есть, информация о том, кто вы такой, чем занимаетесь, как зовут вашу собаку, ваши предпочтения в любых сферах жизни у нас не будет хранится, и мы не будем передавать ее никаким третьим лицам.
— Приблизительно как DuckDuckGo работает?
— У DuckDuckGo есть проблема – они не индексируют интернет целиком. Поэтому, когда к ним приходит запрос, этот запрос дальше уходит в Bing, Яндекс, еще куда-то. Потом они собрали эти результаты и вам отдали лучшее. То есть запрос, который приходит от вас, уходит в ещё несколько компаний и вам нужно им доверять.
С точки зрения приватности, чем мы лучше, – мы строим свой дата-центр, у нас свои сервера, которые принадлежат нам, мы используем клауд. То есть эти данные не уходят от нас никуда. Получается, у нас больше контроля.
— А если будет большое количество запросов, справятся ли ваши сервера с таким объемом информации?
— Да, это то, чем наши разработчики сейчас занимаются. Они пытаются сделать хорошее качество результатов, при этом чтобы оно было подъемно для нас.
Ни одна компания, никакие стартапы не строят свои дата-центры и сервера, потому что это, в том числе, очень дорого. Это нужно поддерживать, на это нужна невероятная экспертиза, нужно нанимать людей, которые в этом разбираются, а их очень мало в принципе на рынке.
В основном все для того, чтобы разработать новую компанию или какой-то продукт, используют клаудовские сервера, которые принадлежат Amazon или Google. То есть, по сути, это передача информации, которая на чужих серверах хранится, работает и обрабатывается. В этом есть определенный риск в безопасности.
Мы уже инвестировали около 50 миллионов долларов для того, чтобы развернуть наш дата-центр. Посмотрев него, можно представить себе, какие, скажем так, надежды компания вкладывает в этот проект с поисковиком.
— Это очень большая инвестиция. А где находится дата-центр?
— Есть один в Европе, в Нидерландах, и сейчас новый, там, где большая часть поиска – в Сингапуре. Мы планируем еще один открывать в США, еще один в Европе, чтобы быть ближе к пользователям.
— Вернемся к персональным данным. Вы не храните информацию о пользователе, хранятся только поисковые запросы без привязки к личной информации. Будут ли результаты в таком случае релевантными?
— Будут. Потому что, когда вы вводите этот поисковый запрос, по нему уже можно определить, что релевантно. Не обязательно знать, что вы искали две недели назад, чтобы показать релевантный результат.
Релевантность – это то, над чем мы работаем каждую неделю. Наша первая цель – достичь качества как у Bing, а потом мы будем стремиться к Google.
По поводу влияния персональных данных и качества результатов для конкретных юзеров, то, если я не ошибаюсь, персональная информация пользователя не сильно влияет на органическую поисковую выдачу, потому что есть понятные параметры оценки качества контента.
Например, если ты смотришь какой-то новостной запрос, информационный, энциклопедический и так далее, Google оценивает информацию, которую он выдает по определенным параметрам: сколько сайтов сослались на эту информацию, насколько там проверенная информация, насколько актуальная, не устаревшая и так далее.
То есть вся эта история с выдачей она далека в принципе от персональных данных. На персональных данных работает реклама.
Як надійно і безпечно зберігати паролі від сайтів
— Суть монетизации Google как раз в рекламе, на которой они зарабатывают свои миллиарды. А как вы будете монетизироваться свой поисковик, если инвестируете много денег и при этом будете отдавать 90% криейтеру?
— Я думаю, что инфраструктура Google, если они зарабатывают 100 миллиардов, то, скажем, 10 миллиардов более чем достаточно, чтобы обеспечивать этот сервис. На счет зарабатывать – примерно аналогичным образом, показывать рекламу в результатах поиска.
Еще разница в том, что Google – это огромная компания с огромным количеством бенефициаров, инвесторов и заинтересованных людей, которые просто тем, что существуют, зарабатывают огромную часть прибыли компании.
Ahrefs – немножко другая компания. У нас пока работает всего 80 человек. Мы никогда не привлекали инвестиций. То есть нет людей, которые заинтересованы в том, чтобы прибыли побольше положить себе в карман.
Да, будут какие-то операционные затраты на содержание серверов, команды и так далее. Но если прибыли получается так много, то с головой можно покрыть операционные косты и еще и получить очень и очень неплохой доход.
У Google на самом деле часть команды, которая занимается непосредственно поисковой системой, ее построением, поддержанием – относительно небольшая. Они больше тратят на то, чтобы в год 20-30 новых стартапов запускать.
Там другая структура трат и прибыли. Она очень сильно отличается о того, что происходит в Ahrefs. Поэтому мы себе можем позволить такую историю с тем, чтобы 90% прибыли отдавать.
В этом и есть проблема, что в принципе вся эта история на рынке может измениться только с приходом новой компании, которая начнет действовать по новым принципам. Мы хотим предложить эту новую бизнес-модель.
— А как вы будете работать с криейтерами? Это будут уже существующие криейтеры или новые, которым будете присваивать эти номера?
— Любой владелец сайта сможет добавить у себя эту разметку на странице и сказать, что этот контент мой, я хотел бы получать с него profit share.
Изначально у нас доход от рекламы будет небольшой, но и людей, которые разместили этот идентификатор у себя, их тоже будет мало. Поэтому мы сможем их нормально компенсировать за счет того, что пока мало и дохода, но мало и людей, которые хотят долю.
С ростом дохода по рекламе, люди будут обращать больше внимания, будет больше людей, которые будут размещать этот идентификатор. Мы планируем расти нормальным темпом по двум направлением – приход денег и кому их нужно распределять.
— На каком этапе проект сейчас, когда планируется какой-то тестовый запуск?
— Тестовый запуск уже идет. С сентября Google заставили в Европе на Android добавлять альтернативные поисковики. И вот с сентября наш поисковики уже там. То есть мы уже собираем каких-то пользователей и по их запросам видим, что люди ищут, какие у нас результаты поиска и продолжаем их улучшать.
Но мы не хотим привлекать очень много посетителей, пока не будем уверены в нашей релевантности. Не хотим, чтобы люди пришли, увидели, разочаровались, и больше не пришли. Так что можно назвать это "пред тестированием".
— Когда планируется запуск основного тестирования?
— Для этого у нас есть метрики, которые мы отслеживаем. У нас есть цифра, начиная с которой мы запускаем следующий этап, делаем ребрендинг нашего робота.
Сейчас это удается более скрыто держать, мы индексируем под нашим ahrefs брендом, как мы делали уже больше 10 лет. Но после того, как мы сделаем ребрендинг, много-много людей это увидят и это уже будет такой мини-лонч.
— Хорошо. Если от 1% до 100% оценить готовность проекта к запуску и к показу его миру, на сколько бы вы его оценили?
— Так как Ahrefs частная и независимая компания, на наши проекты нет ни финансового ни управленческого давления. Поэтому релиз поисковика подвязан исключительно под техническую готовность продукта к тестированию широкой аудиторией, а не к каким-то конкретным датам.
На данный момент мы опираемся на метрику релевантности выдачи, чтобы понимать готовность поисковика.
Если перевести готовность на проценты, то на данный момент готовность поиска где-то 87%. Месяц назад это было 60%.
Несмотря на скорость, с которой мы двигаемся, мы не беремся прогнозировать релиз даже внутри компании, потому что результаты выдачи – это очень субъективная метрика.
— Какое имя будет у вашего робота?
— У нашего робота уже есть имя и довольно, знаешь ли, недурное имя на рынке – Ahrefs-бот, который сейчас является вторым по эффективности после Google.
За 10 лет существования компании Ahrefs, которая занимается СЕО-оптимизацией сайтов, мы построили бот, который ходит по сайтах, собирает веб-индекс, то есть, по сути, копию всего интернета, миллиарды страниц. Весь этот массив знаний наш бот собирает, хранит и как-то "процессит".
По сути, этот бот дает нам очень неслабое технологическое преимущество для того, чтобы построить на самом деле довольно видимого конкурента Google.
— Веб-индексы?
— Есть три индекса. Google, Microsoft и наш. Если поискать в Google разные поисковики, то 90% из них либо берут из Google результаты, меняют брендинг и показывают их как свои, либо берут у Bing, потому что Microsoft их даже продает, это официально.
Можно купить результаты Bing, добавить свой брендинг и зарабатывать с рекламы самостоятельно. Но есть нюанс - надо зарабатывать больше, чем тратить на покупку этих результатов.
Нам повезло с тем, что первый продукт Ahrefs был, по сути, первой ступенью, которая органически переходит к построению поисковика сейчас. Нам повезло с тем, что мы наработали такую технологически интеллектуальную базу, которая позволяет с большим преимуществом от других конкурентов дальше заниматься красивыми проблемами, вроде как оптимизировать эти вещи.
Конгрес США проти Amazon, Google, Facebook та Apple. Як IT-гіганти виправдовувалися за "зачистку конкурентів"
— Я правильно понимаю, что запускаться вы будете тоже под именем Ahrefs? То есть это будет поисковик, который будет называться Ahrefs? Или нет?
— Нет, он будет, как бы, построен командой Ahrefs, но название будет другое.
Пока что на уровне маркетинга тестируем разные названия и искали что-то, чтобы хорошо передавало нашу философию. Но оказалось, что это не так просто найти свободный домен с тем, что подходит под концепцию твоего продукта и что-то, что не переплеталось бы еще с существующими организациями, компаниями и игроками. То есть пока что с названием мы не торопимся.
— Все деньги, потраченные на этот проект, это ваши деньги. Собираетесь ли вы брать какие-то инвестиции со стороны или этого нет в планах?
— Бизнес-модель нового поисковика не предполагает участия инвесторов. Планируется, что система будет работать самостоятельно, и поскольку рынок креативной экономики сейчас сильно растет, нет явной потребности в том, чтобы привлекать инвесторские деньги.
Плюс Ahrefs никогда как компания со своим основным продуктом не привлекала инвестиций. У компании за 10 лет уже есть навык зарабатывать и эффективно тратить свои собственно заработанные деньги.
— А эта история Google с profit-sharing поисковиком Neeva. Они хотели тоже делать такую историю, но там 80 на 20. Была информация, что они к вам приходили, хотели скооперироваться и вы им отказали. Можно поподробнее?
— Там не 80 на 20, там 20 на 80.
— Ах, вот оно что.
— Мы с ними общались. Они хотели с нами коллаборироваться, получить доступ к нашим данным. Но так как мы, очевидно, идем в сторону конкурирования, то у нас коллаборации не получилось.
Из интересного, именно после нашего с ними общения у них появилась эта profit share идея, до этого не было. До этого они были сфокусированы на поисковике по подписке. Приятно, что мы смогли profit-share идею "продать" и нашим конкурентам тоже.
— Как вы планируете продвигать свой проект? Я знаю историю о том, что Bing платил своим пользователям за то, чтобы они им пользовались. Какая у вас будет стратегия?
— Наша бизнес-модель сама в себе содержит большой маховик раскрутки. Если мы платим создателям контента за их контент, то, получается, этим создателям контента выгодно рассказывать про наш поисковик. Это примерно, как случилось с Facebook, когда один друг пригласил второго, а потом если у тебя все друзья в Facebook, то тебе тоже туда хочется.
Создателям реально выгодно, чтобы пользователи читали их контент через нашу поисковую систему. И для пользователя это по сути, ничего не меняет, а для создателя контента очень сильно меняет. Хотя для пользователя это безопасная история с его данными.
И еще плюс одна штука, которую мы нащупали в процессе работы над поисковиком – очень многим медиа сейчас необходимо устанавливать paywall. Медиа просят – подписывайтесь на нас, это условный такой донейшн за наш классный контент.
И самый лучший контент спрятан от широкой аудитории, потому что медиа действительно нужно зарабатывать. С моделью profit-sharing медиа, которые реально работают над глубокими какими-то исследованиями, расследованиями и так далее, смогут зарабатывать и давать эту информацию классную на более широкую аудиторию.
То есть в принципе из интернета должен уйти кликбейт, аффилиатные ссылки и так далее. И плюс премиум-контент под paywall уйдет, потому что паблишеры закрывают свою задачу, если зарабатывают с контента, который они создают, и при этом у них нет потребности прятать его.
И в таком случае как можно большее количество читателей будет иметь доступ к самому лучшему контенту через наш поисковик, именно потому что у него такая бизнес-модель. Это тоже такая история, мне кажется, которая может выстрелить и поменять много вещей.
— Это очень круто. И последний вопрос: когда ждать ваш поисковик?
— Как я уже говорил, у нас есть критерии. Я очень надеюсь, что мы сделаем ребрендинг нашего робота, скажем, до ноября. А вот по поводу следующего этапа мне пока сложно сказать.
Здесь опять-таки разница бизнес-моделей. У нас нет внешних каких-то инвесторов или заинтересованных лиц, которые приходят и говорят – когда? И мы такие – ок, работаем на то, чтобы в ноябре появилось.
Мы будем релизить продукт, который будет уже действительно достаточно хорош, и у нас есть такая возможность – не упираться в какие-то сроки. По сути, когда мы увидим, что все работает так, как мы хотим, тогда будет релиз.