?

Log in

No account? Create an account

Живой Журнал Максима Дементьева

Все записи открытые. Комментировать может любой. Не стесняйтесь! :-)


Предыдущий пост Поделиться Следующий пост
Качество выдачи поиска Яндекса: Резюме, Вакансия и Си++
mpd
Хотел бы для интересующихся уточнить некоторые особенности, которые прочувствовал на своей шкуре.

Пролог


Тема задания правильного запроса к поисковикам и получения репрезентативного ответа - остаётся острой и по сей день. Не знаю, к какому состоянию приведёт прогресс - к пониманию естественного языка поисковиками или к тренированности людей, задающих запросы поисковикам.
Например, для меня очень забавным был опыт с магическим числом и какую выдачу по нему давали поисковики (там даже количество не совпадало, прыгало, ...).
Сегодня я хотел бы рассказать про два ортогональных свойства, объединение которых в результатах выдачи Яндекса меня расстроило.

Сведение к одному: Резюме и Вакансия


Скажите, есть ли разница между этими понятиями? По-моему, да. Как между оранжевый и голубой.
Да, есть, конечно, контексты, в которых обе группы можно свести к одному (например, рынок труда и цвет соответственно).
Но если я - Homo sapiens (а не a human below), то вводя запрос "резюме ..." - я ищу именно резюме (или résumé, curriculum vitae, CV; кстати, последнее сокращение даёт ключ к тому, что название системы контроля версий CVS рассматривается как множественная форма и даже переводится как БИОГРАФИИ), а не вакансию, нет?
И наоборот, если мне нужны вакансии, к чему мне видеть в выборке резюме?
И если обобщать, то каждый раз отдельно для резюме и вакансия я выступаю вообще-то в разных качествах Homo sapiens.

Яндекс в выборке по этим двум ключевым словам всё сваливает в одну кучу.
Кстати, насколько я вижу, Google так не поступает; да, бывает, что последний выводит в результатах вакансии, но он даже не подсвечивает в них вакансия, зато в них подсвечиваются резюме.
А так получается, что мне на запрос "оранжевый ..." - выдают и голубой, ну просто потому, что они - тоже цвета, и от мелкий и мягкий - разительно отличаются.

Дробление одного и того же: Си++


Нет, ну понятно, что если уж я пишу начало запроса "резюме программиста" то дальше переключатся на английский, чтобы вбить название языка из одной буквы (по-английски) - сущая ерунда, никто так не поступает. В результате чего люди вбивают фразу в поисковик полностью русскими буквами
резюме программиста с++
и не мудрено, что именно этот вариант предлагает система автоматического дополнения при вводе в Яндексе.
Но скажите мне откровенно, есть ли разница между двумя следующими записями кириллицей?
  1. с++
  2. си++
В каком контексте это может различаться для Homo sapiens (к которому аргументируют поисковики в своих документах)?
И может ли вообще это отличаться от первого варианта, записанного латиницей?

Да, проблема обработки коротких слов, да ещё и со знаками пунктуации - вещь непростая.
У того же Google я наблюдаю свой подход к решению проблемы, но не суть.
Яндекс даёт практически разные результаты на эти два варианта написания называния языка.

Эпилог


Да, я читал умную книгу про SEO, я знаю, что есть опечатки и варианты написания.
Но, если я не ошибаюсь, надо как-то двигаться в этом направлении - объединении схожего и разделении различного.
Ведь, если не ошибаюсь, в Яндексе довольно много, кто имеет отношение к Си++.
А может, я - флуктуация и несу откровенны бред, который никакими экспериментальными данными не подтверждается.


  • 1
кмк в поиске есть несколько очень плохих тенденций
- ориентированность яндекса в большей степени на коммерческие запросы. те они чета там тюнят из-за чего субьективно проседает качество поиска в некоммерческих запросах. я уже давно не пользую активно яндекс имено по этой причине, гугл кстати тоже стал хуже, его я пользую с кучей уточняющих слов
- сама идея показывать по 10 результатов в поиске даже в коммерческих тематиках - поганая. потому, что ты не видишь ничего что может скрываться за ними, а это огроменные пласты информации
- настоящий семантический поиск (когда тебе на "вакансию" выдают доп. вопросы по тематике типа "может вывести самые интересные вакансии?") до сих пор не придуман
- универсальность поиска заметно проигрывает спец-порталам (поиск работы, авиабилетов, тачек, да всего чего угодно) по юзабилити
- яндекс вообще похоже стал херово индексировать и ранжировать. к примеру, в поиске по блогам вобще пипец творится :(
- из-за недостатков алгоритма (page rank, те учет ссылок и в яндексе и в гугле) при современных тенденциях (лайки, перепосты и прочее) в топ зачастую всплывает откровенное г. или не совсем тематические вещи

По-моему поиск будущего будет совсем другим чем мы видим сейчас. а пока что, в результате укрупнения специализированных сайтов типа амазона фб и прочих - трафик будет уходить от поисковиков напрямую к ним

Ну и не стоит ждать, что будет лучше, ага :) потому, что сейчас у гугла основная проблема - фб, у яндекса - прибыльность и им похоже не до качества поиска :) А людей с яйцами, которые могут кардинально сменить парадигму ни там ни там нету. Хотя, я могу немного ошибаться и может просто еще нет нормальных алгоритмов, но вот ощущение того, что нет даже примерного видения как нужно делать поиск не 90х, а 21го века - точно есть.

Re: его я пользую с кучей уточняющих слов

Т.е., пока дела обстоят так, что обучаются люди, которые вводят запросы... ;-)

Re: его я пользую с кучей уточняющих слов

Мне понятен дух статьи, но не понятны выводы.
По-моему, рановато как-то отказываться от поиска... :-)

Да, я ничего не сказал про Bing. Там - свои "тараканы". И я очень рад, что вообще есть из чего выбирать.
К сожалению, я не смогу вникнуть в Байду, но и ладно...

  • 1