Поиск Google состоит из серии локализованных веб-сайтов. Самый крупный из них, сайт google.com, является самым посещаемым сайтом в мире. Некоторые из его особенностей включают в себя ссылку на определение для большинства поисковых запросов, включая слова из словаря, количество результатов, полученных при поиске, ссылки на другие поисковые запросы (например, для слов, которые Google считает неправильно написанными, он предоставляет ссылку на результаты поиска с использованием предложенной орфографии), и многое другое.
синтаксис поисковых запросов
Поисковая система Google обычно принимает запросы как простой текст и разбивает текст пользователя на последовательность поисковых терминов, которые, как правило, являются словами, которые должны встречаться в результатах, но можно также использовать булевы операторы, такие как: кавычки (") для фразы, префикс, такой как "+", "-" для квалифицированных терминов, или один из нескольких продвинутых операторов, таких как "site:". На веб-страницах "Основы поиска Google" описываются каждый из этих дополнительных запросов и опций (см. ниже: "Опции поиска").
Веб-форма расширенного поиска Google предоставляет несколько дополнительных полей, которые могут быть использованы для квалификации поиска по таким критериям, как дата первого поиска. Все расширенные запросы трансформируются в обычные, как правило, с дополнительными квалифицированными условиями.
Расширение запроса
Google применяет расширение запроса к поданному поисковому запросу, преобразуя его в запрос, который на самом деле будет использоваться для получения результатов. Как и в случае с ранжированием страниц, точные детали алгоритма, используемого Google, намеренно затушевываются, но, безусловно, среди происходящих преобразований есть и следующие:
- Переупорядочивание терминов: при поиске информации это стандартная методика, позволяющая сократить объем работы, связанной с получением результатов. Это преобразование невидимо для пользователя, так как при упорядочивании результатов для определения релевантности используется порядок следования исходных запросов.
- Стемминг используется для повышения качества поиска за счет сохранения небольших синтаксических вариантов поисковых терминов.
- Существует ограниченная возможность исправить возможные опечатки в запросах.
"Я чувствую себя счастливчиком".
На главной странице Google есть кнопка с надписью "I'm Feeling Lucky" (Я чувствую себя счастливчиком). При нажатии на эту кнопку пользователь попадает непосредственно на первый результат поиска, минуя страницу результатов поиска. Считается, что если пользователь "чувствует себя счастливчиком", то поисковая система вернет идеальное совпадение в первый раз без необходимости страницы с результатами поиска. Согласно исследованию Тома Чавеса из "Rapt", эта функция стоит Google 110 миллионов долларов в год, так как 1% всех поисковиков используют эту функцию и обходят всю рекламу.
30 октября 2009 года для некоторых пользователей с главной страницы Google была удалена кнопка "I'm Feeling Lucky", а также кнопка обычного поиска. Обе кнопки были заменены на поле с надписью: "Это пространство намеренно осталось пустым". Этот текст исчезал при перемещении мыши по странице, а обычная функциональность поиска достигается за счет заполнения поля поиска желаемыми терминами и нажатия клавиши enter. Представитель Google объясняет: "Это всего лишь тест, и для нас это способ оценить, понравится ли нашим пользователям еще более простой интерфейс поиска". Персонализированные домашние страницы Google сохранили как кнопки, так и их обычные функции.
21 мая 2010 года, в день 30-летия Pac-Man, кнопка "I'm Feeling Lucky" была заменена на кнопку с надписью "Insert Coin" (вставить монету). После нажатия кнопки пользователь начинает игру Pac-Man на тему Google в том месте, где обычно находится логотип Google. При повторном нажатии на кнопку начинается двухпользовательская версия той же самой игры, в которую входит г-жа Пакман для игрока 2. С этой версией можно ознакомиться по адресу http://www.google.com/pacman в виде постоянной ссылки на страницу.
Богатые отрывки
12 мая 2009 года компания Google объявила о том, что она будет анализировать микроформаты hCard, hReview и hProduct и использовать их для заполнения страниц с результатами поиска тем, что они называют "Богатые фрагменты".
Специальные характеристики
Помимо основной функции поиска текста, Google Search имеет более 22 "специальных функций" (активируется при вводе любого из десятков триггерных слов) при поиске:
- погода - Погодные условия, температура, ветер, влажность и прогноз, для многих городов, можно просмотреть, набрав "погода" вместе с городом для больших городов или города и штата, почтовый индекс США, или город и страна для небольших городов (например: погода Лоуренс, Канзас; погода Париж; погода Бремен, Германия).
- Котировки акций - Просмотреть рыночные данные по конкретной компании или фонду можно, набрав тикер (или включив в него "акции"), например: CSCO; MSFT; IBM stock; F stock (списки Ford Motor Co. ) или AIVSX (фонд). Результаты показывают изменения между днями, или 5-летний график и т.д. Это не работает для биржевых наименований, длиной в одну букву, таких как "Ситигруп" (К) или "Мейсис" (М) (Форд является исключением), или общих слов, таких как "Алмазный оффшор" (КО) или "Маджеско" (КООЛ).
- время - текущее время во многих городах (по всему миру), можно посмотреть, набрав "время" и название города (например: время Каир; время Пратт, KS).
- спортивные очки - очки и расписание, для спортивных команд, могут быть отображены путем ввода имени команды или названия лиги в поле поиска.
- преобразование единиц измерения - Измерения можно преобразовать, введя каждую фразу, например: 10,5 см в дюймах; или 90 км в милях
- конвертация валют - Можно выбрать конвертер валют или денег, введя названия или коды валют (перечислены по ISO 4217): 6789 евро в USD; 150 GBP в USD; 5000 йен в USD; 5000 юаней в лирах (доллар США может быть USD или "USD" или "$", в то время как канадский - CAD, и т.д.).
- калькулятор - Результаты вычислений можно определить, как вычисляется в реальном времени, введя формулу в числах или словах, например: 6*77 +pi +sqrt(e^3)/888 плюс 0.45. Пользователю предоставляется возможность поиска формулы после вычисления. Калькулятор также использует функции пересчета единиц и конвертации валют, позволяющие производить расчеты с учетом единицы измерения. Например, "(3 EUR/литр) / (40 миль/галлон) в USD/миля" вычисляет долларовую стоимость за милю для автомобиля 40 mpg с бензином стоимостью 3 EUR/литр. Каретка "^" поднимает число до экспонентной мощности, и проценты разрешены ("40% от 300").
- числовые диапазоны - Набор чисел может быть сопоставлен с помощью двойной точки между номерами диапазона (70...73 или 90...100), чтобы соответствовать любому положительному числу в диапазоне, включительно. Отрицательные числа рассматриваются как использующие исключающую тире, чтобы не совпадать с числом.
- поиск по словарю - определение слова или фразы можно найти, введя "определить", затем двоеточие и слово(и) для поиска (например, "определить:философия").
- карты - некоторые связанные карты могут быть отображены, введя название или американский ZIP код местоположения и слово "карта" (например: карта Нью-Йорка; карта Канзаса; или карта Парижа).
- Показы фильмов - Отзывы или показы фильмов могут быть перечислены для любого фильма, играющего рядом, введя "фильмы" или название любого текущего фильма в поле поиска. Если определенное местоположение было сохранено в предыдущем поиске, то в верхнем результате поиска будут показаны показы для близлежащих кинотеатров для этого фильма. Эти списки, однако, иногда совершенно некорректны, и нет возможности попросить Google исправить их; например, 25 июля, для театра Эль Капитан, google showtimes списки Up, но, согласно сайту Эль Капитан, единственный фильм, воспроизводимый в этот день, это G-Force. []
- публичные данные - Тенденции в отношении численности населения (или уровня безработицы) можно найти для штатов и округов США, набрав "численность населения" или "уровень безработицы" с последующим указанием названия штата или округа.
- Недвижимость и жилье - списки домов в данной области могут быть отображены с помощью триггерных слов "жилье", "дом" или "недвижимость", за которыми следует название города или почтовый индекс США.
- данные путешествия/аэропорты - Статус рейса для прибывающих или вылетающих рейсов в США можно отобразить, введя название авиакомпании и номер рейса в поле поиска (например: American airlines 18). Задержки в определенном аэропорту также могут быть просмотрены (путем ввода названия города или трехбуквенного кода аэропорта плюс слово "аэропорт").
- Отслеживание пакетов - Пакетную почту можно отследить, набрав номер отслеживания королевской почты, UPS, Fedex или USPS пакета непосредственно в поле поиска. Результаты будут включать в себя быстрые ссылки для отслеживания статуса каждой посылки.
- номера патентов - Поиск по патентам США может быть проведен путем ввода слова "патент" с последующим указанием номера патента в поле для поиска (например: Патент 5123123).
- территориальный код - географическое местоположение (для любого телефонного кода США) может быть отображено путем ввода 3-значного территориального кода (например: 650).
- Поиск синонимов - Поиск может найти слова, аналогичные указанным, поместив знак тильды (~) непосредственно перед поисковым термином, например: ~фастфуд.
- Поиск по сайтам правительства США - Поиск по сайтам правительства США можно осуществлять с веб-страницы: www.google.com/unclesam.
Параметры поиска
На веб-страницах, поддерживаемых Справочным центром Google, имеется текст, описывающий более 15 различных вариантов поиска. Операторы Google:
- ИЛИ - Ищите любой из них, например, "цена высокая или низкая" ищите "цена" с помощью "высокая" или "низкая".
- "-" - Поиск при исключении слова, например, поиск "яблоня-дерево", где не используется слово "дерево".
- "+" - Принудительное включение слова, например "Имя + из + Игры", для того чтобы слова "из" и "из" появились на соответствующей странице.
- "*" - оператор Wildcard для сопоставления любых слов с другими конкретными словами.
Некоторые из вариантов запроса выглядят следующим образом:
- define: - Префикс запроса "define:" будет содержать определение слов, перечисленных после него.
- акции: - После слов "акции:" термины запроса рассматриваются как биржевые символы для поиска.
- Место: - Ограничение результатов на те сайты в данном домене, например, site:www.acmeacme.com. Опция "site:com" будет искать URL всех доменов с именем ".com". (нет места после "сайт:").
- allintitle: - Поиск ведется только по заголовкам страниц (не по остальному тексту на каждой веб-странице).
- intitle: - Префикс поиска в заголовке веб-страницы, например, "intitle:google search" будет содержать список страниц со словом "google" в заголовке, а слово "search" - в любом месте (без пробела после "intitle:").
- Аллинурл: - Поиск выполняется только по строкам адреса URL страницы (а не по тексту внутри каждой веб-страницы).
- впрыгивать: - Префикс для каждого слова, найденного в URL; другие слова совпадают в любом месте, например, "inurl:acme поиск" совпадает с "acme" в URL, но совпадает с "поиск" в любом месте (без пробелов после "inurl:").
Опции отображения страниц (или типов запросов):
- кэш: - выделяет поисковые слова внутри кэшируемого документа, например "cache:www.google.com xxx" показывает кэшируемый контент с выделенным словом "xxx".
- Связь: - Префикс "link:" будет указывать на веб-страницы, которые имеют ссылки на указанную веб-страницу, например "link:www.google.com" будет указывать на веб-страницы, имеющие ссылки на домашнюю страницу Google.
- родственник: - Префикс "родственные:" будет указывать на веб-страницы, которые "похожи" на указанную веб-страницу.
- Информация: - Префикс "info:" будет отображать некоторую справочную информацию об одной из указанных web-страниц, например, info:www.google.com. Обычно info: это первый текст (160 байт, около 23 слов), содержащийся на странице, отображаемый в стиле записи результатов (только для 1 страницы, как подходящей для поиска).
- тип файла: - в результатах будут показаны только файлы нужного типа (ex filetype:pdf вернет файлы pdf)
Обратите внимание, что Google ищет кодировку HTML внутри веб-страницы, а не на экране: слова, отображаемые на экране, могут быть перечислены не в том же порядке в кодировке HTML.
Ошибочные сообщения
Некоторые поиски выдадут 403 Запрещенную ошибку с текстом
"Нам очень жаль...
... но ваш запрос похож на автоматический запрос от компьютерного вируса или шпионского приложения. Чтобы защитить наших пользователей, мы не можем обработать ваш запрос прямо сейчас.
Мы восстановим ваш доступ как можно быстрее, так что попробуйте еще раз как можно скорее. Тем временем, если вы подозреваете, что ваш компьютер или сеть были заражены, вы можете запустить проверку на вирусы или удаление шпионских программ, чтобы убедиться, что ваша система свободна от вирусов и других поддельных программ.
Приносим свои извинения за причиненные неудобства и надеемся, что мы еще увидимся с вами от всей команды здесь, в Google".
иногда с последующей подсказкой CAPTCHA.
Впервые об этом экране было сообщено в 2005 году, и он стал ответом на активное использование Google компаниями, занимающимися поисковой оптимизацией, для проверки рангов сайтов, которые они оптимизируют. Сообщение вызвано большим количеством запросов с одного IP-адреса. Очевидно, что Google использует куки Google как часть определения отказа в обслуживании.
В июне 2009 года, после смерти поп-суперзвезды Майкла Джексона, это сообщение появилось у многих пользователей Интернета, которые искали в Google новости, связанные с певицей, и было принято Google за DDoS-атаку, хотя многие запросы были представлены законными поисковиками.
ошибка вредоносного ПО
Google помечает результаты поиска сообщением "Этот сайт может нанести вред вашему компьютеру", если известно, что на сайте установлено вредоносное программное обеспечение в фоновом режиме или иным образом скрытно. Google делает это, чтобы защитить пользователей от посещения сайтов, которые могут нанести вред их компьютеру. Примерно в течение 40 минут 31 января 2009 года все результаты поиска были ошибочно классифицированы как вредоносные программы и поэтому не могли быть щелкнуты; вместо этого отображалось предупреждающее сообщение, и пользователь должен был ввести запрашиваемый URL вручную. Ошибка была вызвана человеческой ошибкой. URL-адрес "/" (который расширяется на все URL) был ошибочно добавлен в файл шаблонов вредоносного ПО.
Дудл для Google
В некоторых случаях логотип на веб-странице Google меняется на специальную версию, известную как "Google Doodle". Щелчок по ссылке "Дудл" на строку результатов поиска Google по данной теме. Первая - ссылка на фестиваль"Горящийчеловек" в 1998 году, другие - на дни рождения таких выдающихся людей, как Альберт Эйнштейн, исторические события, такие как взаимосвязанный 50-летний юбилей блока Лего и такие праздники, как День Святого Валентина.
Google Caffeine
В августе 2009 года компания Google объявила о внедрении новой архитектуры поиска под кодовым названием "Кофеин". Новая архитектура была спроектирована таким образом, чтобы быстрее возвращать результаты и лучше справляться с быстро обновляемой информацией, поступающей от таких сервисов, как Facebook и Twitter. Разработчики Google отметили, что большинство пользователей не заметят никаких немедленных изменений, но предложили разработчикам протестировать новый поиск в своей песочнице. Различия, отмеченные их влиянием на поисковую оптимизацию, включали в себя более тяжелый вес ключевых слов и важность возраста домена. Этот шаг был интерпретирован в некоторых кругах как ответ на недавний выпуск компанией Microsoft обновленной версии своей собственной поисковой службы, переименованной в Bing. Компания Google объявила о завершении разработки Caffeine 8 июня 2010 года, заявив о 50% более свежих результатах благодаря непрерывному обновлению своего индекса. С Caffeine компания Google перевела свою внутреннюю систему индексации с MapReduce на BigTable, платформу распределенных баз данных компании. Caffeine также базируется на Colossus, или GFS2, капитальный ремонт распределенной файловой системы GFS.
Шифрованный поиск
В мае 2010 года компания Google запустила веб-поиск с шифрованием SSL. Доступ к зашифрованному поиску можно получить по адресу: https://encrypted.google.com.
Мгновенный поиск
Улучшение Google Instant, которое отображает предложенные результаты в то время как типы пользователей, было введено в Соединенных Штатах с 8 сентября 2010 года. Одна из проблем заключается в том, что люди могут выбрать один из предложенных результатов вместо завершения запроса, и такая практика может привести к предвзятости по отношению к знакомым предприятиям или другим поисковым терминам. Порнографические или иные оскорбительные поисковые термины исключаются из предлагаемых результатов. Мгновенная функция появляется только на основном сайте Google, а не на специализированных страницах iGoogle. Google ожидает, что Google Instant экономит пользователям от 2 до 5 секунд при каждом поиске, что, по их словам, в совокупности составит 11 миллионов секунд в час. Специалисты по поисковому маркетингу предположили, что Google Instant окажет большое влияние на локальный и платный поиск.
Совместно с Мгновенным запуском Google, Google отключил возможность пользователям выбирать для просмотра более 10 результатов поиска на страницу. Мгновенный поиск можно отключить через меню "Параметры" Google, но предложения по автоматическому полнотекстовому поиску теперь нельзя отключить. Представитель Google заявил: "Это соответствует нашему видению унифицированного опыта поиска Google, чтобы сделать популярные, полезные функции частью опыта по умолчанию, а не поддерживать различные версии Google". Поскольку качество Autocomplete улучшилось, мы сочли целесообразным, чтобы оно всегда было включено для всех наших пользователей".