sonyps4.ru

Используйте интернет чтобы найти информацию. Как найти данные в интернете

КАК ПРАВИЛЬНО ИСКАТЬ ИНФОРМАЦИЮ В ИНТЕРНЕТ
(Журнал "Украинский Туризм" номер 4, 2007 год.)

Статья подготовлена сотрудниками студии Web-дизайна FloMaster ®

Многие люди считают, что сейчас Интернет больше напоминает кучу мусора, чем источник информации. Мол, все тут есть, но чтобы это "все" найти, нужно перерыть очень много ненужных страниц. Однако это не так.

В всемирной сети есть своя логика. Зная и используя несколько простых правил, вы можете сделать так, что любая информация будет находиться быстро, и что самое главное - вы найдете именно то, что ищите.

В этой статье речь пойдет о наиболее известных поисковых системах и правилах поиска в сети.

Вначале сделаем небольшое отступление, и попробуем разобраться, как устроена поисковая система. Так уж случилось, что пользователь видит лишь внешний дизайн поисковой системы, а ее механизмы поиска и внутренности - остаются невидимыми.

Одна из частей поисковой системы - это так называемый "паук", который путешествует по сети, просматривает все страницы и ссылки. Страницы которые он просмотрел, заносятся в базу поисковой машины в виде встречающихся на странице слов. Таким образом, индекс поисковой машины - это огромнейшая база данных, с помощью которой можно быстро узнать, на какой именно странице в сети можно встретить определенное изречение.

Другая часть поисковой системы - это собственно поисковая машина. Занимается она тем, что ищет нужное слово или словосочетания в индексе. Поисковая система не ищет по всему Интернету. В этом состоит основное заблуждение пользователя. Она ищет только по своей базе. Таким образом если поисковая машина не нашла то, что вы ей задавали, это совсем не значит, что этого нет в сети. Поэтому если вы не нашли что-то в одной поисковой системе, обязательно надо поискать это в другой.

Паук (поисковый робот), составляющий индекс, регулярно посещает сайты и сканирует их. Особенно ему интересны сайты на которых есть постоянное обновление. Поэтому, если вы являетесь владельцем сайта, постарайтесь что то постоянно на нем изменять, добавлять новую информацию и тем самым привлекать "паука" для обработки новой информации на вашем ресурсе.

Последняя часть поисковой системы - это сам ее сервер. Это тот интерфейс, посредством которого пользователь задает вопросы и получает на них ответы.

Теперь попробуем разобраться в языке общения с поисковыми системами. Может вы будите удивлены - но и здесь существуют специальные правила и специальный язык. Это так называемый язык запросов.

Для начала вам нужно определиться с ключевыми словами: решить, какие два-три слова или словосочетания наиболее полно характеризуют объект ваших поисков, и вводить именно их. Вроде бы все просто и понятно. Однако тот, кто пытался найти, что то широко известное поймет, что найти именно то что необходимо - очень сложно.

Как правило, большой процент запросов отличается полной неясностью, и неконкретностью: "туризм", "видео", "телефоны", "мелодии".

Поисковой машине очень сложно догадаться что вы имели в виду например под словом "туризм". На запрос "туризм" Яндекс и Google выдает более стни тысяч ссылок. Таким образом надо более конкретно уточнять, что именно вы ищите, иначе найти нужное будет сложно.

Теперь мы подошли вплотную к вопросу о правилах. Рассмотрим их на примере наиболее известных поисковых систем, таких как Яндекс и Google.

Если вы постоянно используете Яндекс, тогда вам необходимо знать, что если набирается слово с маленькой буквы, то будут найдены слова с маленькой и большой буквы. Если же вы набрали слово с большой - то будут найдены слова только с большой буквы. Например, на запрос "аэроплан" поисковая система выдаст упоминания о летательном аппарате а так же о музыкальном коллективе и много еще о чем. Поэтому правило: не набирайте без особой нужны слово с большой буквы.

По другому обстоит дело в Google. Здесь запросы нечувствительны к регистру символов. Это значит, что для Google нет никакой разницы, будет запрос набран одними прописными, одними строчными буквами или вообще вперемешку. Из этого правила существует одно исключение - слово "or". Если вы хотите использовать его как логический оператор, то должны набирать OR. Оператор OR (ИЛИ) полезен в первую очередь для тех случаев, когда у нужного термина есть синонимы, или если его правильное написание еще не устоялось. Ему соответствует символ (|).

При поиске Google пропускает некоторые слова, не несущие смысловой нагрузки, а также одиночные цифры. Иногда Google автоматически ищет по сокращениям, принятым для слов, включенных вами в свой запрос, что может быть полезным, но может и помешать. Обойти данные ограничения можно либо задав в строке поиска всего одно любое слово или же заключив запрос с такими проблемными словами в кавычки, то есть произведя поиск по фразе.

Рассмотрим более подробно поиск устойчивых словосочетаний. Здесь необходимо ввести фразу для поиска в кавычках. (Во всех остальных случаях кавычки не нужны). Очень помогает, когда вам нужно, к примеру, найти слова стихов, а вы помните всего одну строчку. Введите эту строку с кавычками в поисковую систему. Например, вы помните отрывок стихотворения "У лукоморья дуб зеленый", а кто написал - не помните. Идете на поисковую систему, вводите эту фразу и сразу же узнаете, что это А.С. Пушкин.

Запрос Google может состоять максимум из десяти слов, при этом считаются как собственно ключевые слова, так и операторы. Это ограничение можно обойти, например, заменив все слова, которые Google и так проигнорирует (все те же предлоги, артикли и т.п.), на звездочки. При расчете длины запроса Google такие символы не учитывает, и у вас появится возможность добавить пару-тройку дополнительных полезных условий.

Теперь рассмотрим использование знаков "-" и "+". Используя их, вы можете принудительно исключать слово из поиска, либо делать слово обязательным. Например, вам нужен список туристических компаний которые продают Кипр. Тогда запрос должен быть примерно таким: "туристическая компания + Кипр".

А если вам наоборот не нужны компании которые продают Кипр, тогда вам необходимо задать примерно следующее: "туристическая компания - Кипр".

Если вы ввели просто несколько слов, разделенных пробелами, то для поисковика это будет означать, что надо найти страницы, где эти слова входят в одной предложение. Например: "Отель Греция лучший".

Кроме этих общеизвестных операторов, Google позволяет использовать в запросах спецсимволы "*" и "~". Первый означает подстановку в запрос одного любого слова (обратите внимание: не знака, а именно слова), при этом, если вы поставите две "звездочки", то будут найдены все документы с двумя любыми словами на месте звездочек. Тем самым можно задавать точные промежутки между частями поисковой фразы. Применение спецсимвола "~" дает Google команду искать не только указанное вами слово, но и его синонимы. Результат такого поиска может быть весьма полезным, но не всегда предсказуемым.

В принципе, существуют три-четыре поисковые системы, которые должны удовлетворить практически все нужны. Если говорить про русскоязычные поисковики - это уже упоминавшийся "Яндекс" (www.yandex.ru),"Рамблер" (www.rambler.ru) и "Апорт" (www.aport.ru). Из зарубежных - всем известный Google (
Рассмотрим их подробнее. Так называемый "поиск по ftp" позволяет искать информацию в огромных файловых архивах. Наиболее известная Российская - www.filesearch.ru , и западная - ftp.lycos.com . Данные поисковые системы ищут только файлы по имени.

Они очень полезны во многих случаях. К примеру, вы собрались скачивать откуда-то программу, а программа потерялась. Все, что у вас есть - это старая ссылка, например: http://www.sony.net/name.zip. Ссылка не работает. А программу хочется. Существует большая вероятность, что программа понравилась не только вам, но и другим людям. И может кто то скачал ее себе и выложил на ftp. Для этого всего лишь надо зайти наwww.filesearch.ru , и набрать в строке поиска: name.zip. И сразу находим то что надо! Особенно хорошо искать таким образом драйвера, mp3-файлы, и другую полезную мелочь.

Думаю, что меня не закидают помидорами, прочитав название статьи. Согласитесь, что без информации мы сейчас и дня прожить не можем. Только для того, чтобы информацией обладать, ее нужно сначала найти. Разве существуют правила поиска информации в Интернете ? — спросите вы.

Предлагаю вспомнить себя новичком в Интернете или оглянуться на своих знакомых, которых у каждого из нас найдется предостаточно. Тех, кто использует Интернет в очень ограниченном количестве. А происходит это зачастую только из-за того, что человек не знает, как правильно составлять поисковые запросы, чтобы найти нужную ему информацию. В результате — сидение на одних и тех же сайтах и ресурсах, не понимая, что под ногами, то есть под руками есть огромный и неизведанный мир.

Как происходит поиск информации в Интернете?

Для начала, давайте определимся, кто для нас находит нужную нам информацию? Главные труженики — это поисковые системы и каталоги. Как верно замечено в справочнике Яндекса, умение искать — это искусство. Вести поиск эффективно при всей простоте интернета, могут далеко не все.

Находят для русского пользователя информацию различные поисковые системы, такие как Google, Yandex, Ramble, Mail, Yahoo… Общих правил поиска у них нет, так что нам предоставляется полная свобода действий. Я предпочитаю использовать Google, так как он имеет лучший в мире алгоритм ранжирования запросов. Для сравнения результатов всегда обращаюсь к Yandex. Если вы будете использовать эти два поисковика, то увидите, что результаты поиска в обоих случаях при одинаковом запросе будут отличаться друг от друга.

Поисковые системы ищут для нас информацию, учитывая следующие критерии:

  • Ключевое слово содержится в заголовке
  • Наличие ключевого слова в адресе домена или в названии страницы
  • Ключевое слово выделено жирным шрифтом
  • Плотность ключевого слова
  • Ссылки на странице и название ключевого слова в тексте ссылки

То есть, поисковой системе нужно проделать огромную работу, чтобы выдать нам результат. Поэтому первое, что мы должны научиться делать, правильно оформлять поисковые запросы, прежде чем их ввести в поисковую строку.

Правила поиска информации в Интернете

1. Сформулируйте несколько запросов по вашему вопросу. Учитывайте при этом, что если вам надо найти реферат о слоне, то по слову слон вы найдете слонов и всего того, что может и не может относиться к слову слон. Это могут быть книги со словом слон в заголовке, это могут быть сайты, статьи, анекдоты, сказки, вообщем все то, к вашему настоящему запросу не имеет никакого отношения. Поэтому пишем коротко и ясно: рефераты о слонах. Для увеличения нажмите на картинку.

Яндекс нам выдал 2 млн ответов, Гугл оценил, что нам будут полезны 335000 страниц. Как видите, придется попотеть, чтобы найти то, что нам действительно нужно.

2. Сузим область поиска. Для этого заключим в кавычки наш запрос, и он будет выглядеть так: «рефераты о слонах». Посмотрим, что получится:


О чудо! Искать придется теперь гораздо меньше! Теперь мы уверены, что на этих страницах, которые нам выдали поисковики, будет информация, связанная с рефератами о слонах.

3. Не забываем о том, что писать поисковый запрос нужно грамотно. От этого также зависит качество выданной нам информации.

4. Поисковый запрос пишем только маленьким буквами. Если мы используем в запросе большие буквы, то не сможем увидеть ответы, где данное слово пишется с маленькой буквы. Используйте заглавные буквы только в именах собственных.

5. Активно используем поиск в картинках. Обычно, картинки имеют подписи при загрузке, в которых могут прописаны именно ваши ключевые слова.

6. С помощью знаков + и — можно указать какие слова мы хотим или не хотим видеть. Например, при запросе «зеленый чай» можно отметить знаком (-) слово пакетированный. В этом случае, можете рассчитывать на то, что информацию о зеленом чае в пакетиках вы не увидите.

7. Знак | сможет дать понять поисковым системам, что вы хотите найти «или-или». Если вы спросите «как написать реферат|оформить реферат», то в ответах у вас будут и как написать реферат и как его оформить.

8. Знаком! мы указываем, что хотим знать точную информацию по конкретному слову. Например, при поиске запроса!слон, мы увидим точное соответствие данному слову без словоформ. То есть, в поиске не будут отображены различные формы слова «слон» — слоны, слонов, слонами, о слонах и т.д.

9. Принимайте во внимание, что через какое-то время поиск может выдать вам совершенно другую информацию. Поэтому найденную информацию, если она вам действительно важна, лучше всего сохранять в избранном или в закладках браузера. Используйте систему хранения информации в своем браузере с помощью папок, их можно создавать прямо на панели, нажав правой кнопкой мыши и выбрав «добавить папку». Я предпочитаю сохранять с метками в Evernote, можете прочитать о моем любимом помощнике в статье

10. Используйте функции расширенного поиска поисковых систем, если вам нужны уточнения по датам, географии, языку, формату файла.

11. Не пренебрегайте поиском на 2-й и последующих страницах. Часто бывает, что свежая и новая информация еще не успела попасть в ТОП 10, поэтому ее придется поискать. Иногда, свои ответы я нахожу на пятой, или даже десятой странице.

12. Если вам постоянно нужна информация по конкретной сфере деятельности, используйте для сбора информации социальные сети, сообщества, группы, форумы, каталоги. Рассылка Subcribe может предложить вам большое количество специализированных, тематических групп, которые будут постоянно присылать вам новую информацию. Самое нужно вы также можете сохранять в закладках или в Evernote.

Если эта статья для вас оказалась полезной и интересной, поделитесь ею с друзьями, нажав на кнопку любой социальной сети.

16.Поиск информации в интернете

Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы.

3. Обращение к поисковой системе (поисковому серверу).

Способ 1: Указание адреса страницы

Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Способ 3: Обращение к поисковой системе

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

Поисковая система - веб-сайт, предоставляющий возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

Поисковые каталоги служат для тематического поиска.

Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог - структурированный набор ссылок на сайты с кратким их описанием.

Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, - и получает список ссылок на web-страницы, содержащие указанные термины.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

Как работает поисковой индекс?

Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Поисковый робот («веб-паук») - программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

http://www.yandex.ru/

Яндекс - российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

http://www.google.ru/

Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

По одной из версий, Google - искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

http://www.rambler.ru/

Rambler Media Group - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

Rambler создан в 1996 году.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

Когда-то, в начале 2000х, был богатый выбор поисковых машин Aport, Rambler, Nigma, Webalta, Mail.ru и другие:

  • Aport - русская поисковая система. Используется с 1995 г.. Часть портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка. В Русскоязычном интернете с начала 2000-х гг. поисковая система стала резко сдавать позиции, заметно уступая по известности Яндексу и Рамблеру. По богатству языка запросов заметно уступает иным популярным системам.
  • Rambler - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов русского , информационный портал. Настройки языка поиска: любой, британский, российский, украинский. Учитывается морфология. Одно время поисковая система Рамблер была самой популярной врусскоязычном интернете, однако потом уступила лидерство Яндексу.
  • Yandex - русская система поиска в Интернете и интернет-портал. Поиск Яндекса позволяет искать по Рунету бумаги на русском, белорусском, английском, украинском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
  • Mail.ru - 1 из крупнейших в Русскоязычном интернете бесплатных сервисов электронной почты. Компания работает на рынке под данным именем с 16 окт. 2001г.. До этого момента бренд Mail.ru принадлежал компании Port.ru. В итоге 2006 г. было заключено стратегическое соглашение о предоставлении поискового сервиса, основанного на движке Яндекса.
  • Webalta - Русская поисковая система, находящаяся на стадии публичного тестирования.

Время показало, кто из поисковых систем может называться лидером.

Из русско-язычного сегмента смогла идти в ногу со временем лишь Yandex. Зарубежные поисковые системы тоже трансформировались с различной степенью успеха. На первый план вышла корпорация Google.

По состоянию на 2012 год можно сказать, что используя эти две поисковые системы можно найти русскоязычную информацию в 95-97% случаев. Остальные 3-5% распределены равномерно среди сотен поисковых движков.


Поэтому есть смысл приглядеться к возможностям Google и Yandex. Легче простого написать в строке поиска Yandex или в строке поиска Google необходимый Вам запрос и поисковая система выдаст большое множество предложений по Вашему запросу. Поисковая машина - Yandex в Русскоязычном интернете способна отыскать нужные Вам веб-страницы, свежие вести, массу разных картинок и видео роликов, энциклопедические познания и массу иной полезной информации.

Итак, начинаем искать! Благо, тут не нужны какие-то особые познания и отработанные умения. Сформулируйте Ваш , как бы Вы задали его собственному учителю, товарищу или библиотекарю.
К примеру, "кто самый сильный", "где растут дубы" или "скачать mail агент ". В какой бы падежной форме не употребили Вы слова, поисковая система Yandex и Google будут искать все формы слов: по запросу "дуб", поисковик разыскивает "дуб", "дуба" и иные.

Yandex-поисковик отлично понимает и односложные запросы, и запросы из некоторого количества слов и своими силами их интерпретирует. Он понимает, когда нужно отыскатьстраницы, где слова запроса находятся рядом, а когда словам просто довольно встретиться в одном документе, чтоб отыскать хорошую страницу с ответом для Вас.


Как же сформулировать правильный запрос?

Он как правило должен состоять из некоторого количества слов, так как по одному слову весьма непросто понять, о чем Вы хотите задать вопрос. К примеру, введем в поисковик слово "пол". Вероятно, Вы хотите задать вопрос о поле мужском или женском или же напольном покрытии. По этому запросу Yandex найдет информацию обо всех известных ему полах. Пример понятный - запрос нужно формулировать как возможно четче и уточнять по максимуму.

Используйте расширенный поиск! Так Вы сможете в максимальной степени сузить круг поиска. А сейчас несколько советов для эффективного и быстрого поиска нужной информации в Yandex. Старайтесь при поиске применять особые знаки. С их помощьювозможно уточнить запрос поиска. А отыскать их возможно на Yandex, нажав в расширенном поиске на ссылку "Памятка по применению языка запросов".

Для примера приведу несколько этих полезных знаков:
1. Чтоб отыскать точную фразу или форму слова, используйте кавычки:
["зима недаром злится"]
2. Чтоб исключить слово во фразе из поиска, воспользуйтесь знаком минус. Это слово должно стоять в итоге фразы запроса. М/у словом и знаком не должно быть пробела.
[схемы вязания крючком -купить]
3. Чтоб восстановить забытое слово в цитате, воспользуйтесь звездочкой (*). Всю цитату заключите в кавычки, а вместо забытого слова поставьте звездочку.
["сжала руки над * вуалью"]
4. Чтоб отыскать слова, которые обязаны быть в одном предложении, воспользуйтесь знаком с необычным названием "амперсанд" - &. Если соединить слова амперсандом,Yandex выдаст статьи, где эти слова располагаются в одном предложении.
[Огромной театр & Москва]
5. Чтоб по запросу отыскать статью или документ с определенным словом, нужно поставить перед этим словом плюс. М/у словом и знаком не должно быть пробела.
[Памятник Пушкину +площадь]

Специализированные поисковые системы.

  • Поиск по картинокам
  • Поисковые системы с фильтрами
    • Scandoo: Поиск с проверкой сайтов на наличие вирусов, вредоносных программ
    Поиск по скрытому интернету (часть веб-страниц Всемирной паутины, не индексированная поисковыми системами): Поиск files: Поиск схем и электронных компонентов:
  • Поиск кода (программистам):
  • Поиск вредоносных программ ( , трояны и т.п.):
  • Поиск кряков (специальная программа (либо файл, содержащий инструкции для такой программы), изменяющая некоторые байты в другой программе, выполняемая с целью отключения защиты от копирования, отключение nagscreen"ов или запрещение чтения системного времени) и вареза (термин, обозначающий незаконно распространяемое программное обеспечение)
    • Astalavista Security Group: поиск через все движки «подпольного Интернета»
  • Поиск новостей:
  • Метапоисковые системы:

Как же поисковые системы ищут информацию?

Поисковые системы состоят из 5 отдельных программных компонент:

  1. spider (паук): утилита, которая скачивает веб-страницы.
  2. crawler: сканирующий паук, который гуляет по всем ссылкам, найденным на странице.
  3. indexer (индексатор): "слепая" утилита, которая изучает веб-страницы, скаченные пауками.
  4. database (база данных): хранилище скаченных и обработанных страниц.
  5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

Spider : Паук - утилита, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же воздействие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете "просмотр HTML-кода" всобственном браузере.
Crawler : Как и паук скачивает страницы, он может "раздеть" страницу и отыскать все ссылки. Это его задача - определять, куда далее должен идти паук, основываясь на ссылках или отталкиваясь от заблаговременно заданного списка адресов.
Indexer : Индексатор разбирает страницу на разные ее части и изучает их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и иных стилевых частей страницы вычленяются и анализируются.
Database : База данных - хранилище всех данных, которые поисковая система скачивает иизучает. Это нередко требует больших ресурсов.
Search Engine Results Engine : Система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск. Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании всегда меняющихся критериев. Алгоритмом называется способ, по которому она принимает решение. Профессиональные оптимизаторы (SEO) время от времени потребляют термин "algos" - это и есть то, о чем мы говорим.

Основные критерии отбора результатов поиска:

  • Title (заголовок): Есть ли ключевое слово в заголовке?
  • URL (Домен): Есть ли ключевое слово в имени домена или в адресе страницы?
  • Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или Hx (H1, H2,...) текстовых заголовках?
  • Density (плотность): Насколько часто ключевое слово употреблено на странице?Число ключевиков сравнительно текста страницы называется плотностью ключевого слова.
  • META (мета данные): Впрочем многие отрицают, некорые поисковые системы до сих пор читают мета ключевые слова (meta keywords ) и мета описания (meta description ).
  • Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?
  • Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный интернет-сайт? Каков текст ссылки? Это называется "внестраничный" критерий, таккак автор страницы не во всех случаях может им руководить.
  • Insite Links (ссылки внутри страницы): На какие еще страницы данного ресурса содержит ссылки эта страница?

Итак, алгоритм поисковой системы учитывает:

  1. Число ключевиков на веб-ресурсе.
  2. Число ключевиков на странице.
  3. Соотношение общего количества слов на веб-ресурсе к количеству ключевиков навеб-ресурсе.
  4. Соотношение общего количества слов на странице к количеству ключевиков на странице.
  5. Индекс цитирования.
  6. Популярность темы.
  7. Количество запросов по конкретному ключевому слову за определённый временнойпромежуток.
  8. Общее число веб-страниц ресурса.
  9. Использование стиля к веб-страницам.
  10. Объём текста ресурса.
  11. Объём ресурса.
  12. Объём любой веб-страницы.
  13. Объём текста любой веб-страницы.
  14. Возраст ресурса.
  15. Наименование URL ресурса (имя домена)
  16. Периодичность обновления информации на веб-ресурсе.
  17. Последнее обновление страниц ресурса.
  18. Количество картинок (рисунков) на веб-ресурсе.
  19. Число мультимедийных файлов.
  20. Наличие замещающих надписей на рисунках (картинках).
  21. Длину (в числе знаков) замещающих надписей рисунков (картинок).
  22. Применение фреймов.
  23. Язык ресурса (российский или заграничный).
  24. Размер шрифта, которым оформлены ключевые слова.
  25. Жирность шрифта ключевиков.
  26. Написаны в разрядку или нет ключевые слова.
  27. Написаны или нет заглавными буквами ключевые слова.
  28. Как далеко от начала веб-страницы находятся ключевые слова.
  29. Стиль заголовков и наименований ключевиков.
  30. Наличие и разбор мета-тэгов.
  31. Содержание и наличие описания и свойств страницы.
  32. Наличие файла "робот".
  33. Географическое месторасположение ресурса.

Когда в нынешнее время мы говорим о «поиске» или «исследовании», то мало кто подразумевает проведение ряда часов в библиотеке в поисках нужной книги или периодического издания. И мы вряд ли говорим даже о онлайн-доступе к научным базам школ или университетов. Слово «исследование» в повседневной культуре чаще всего включает в себя один смысл: открыть браузер, написать ключевые слова в строку поиска и «сёрфить» по просторам Интернета, пока не найдёшь нужную информацию.

Однако для достижения результата в стадии «пока не найдёшь нужную информацию» может возникнуть проблема - порой поиск затягивается, а искомая информация не находится категорически. Чтобы быстрее находить нужные данные и не тратить время на проверу «левых» сайтов, можно воспользоваться небольшими хитростями.

Итак, хитрость номер 1: Пользуйтесь разными поисковиками

Не смотря на то, что «мастодонты поиска» (такие как Google, Яндекс, Yahoo! и др.) зачастую предлагают аналогичные результаты, всё же стоит делать запрос не только на одном сайте. Отличие в несколько ссылок может быть критичным, если это будет именно то, что вам нужно.

Если же вы - яростный поклонник одной из систем, то можно узнать, не обладает ли она узкоспециальными поисковыми инструментами (у Гугла, например, есть Google Scholar , который позволяет искать исключительно по онлайн-репозиториям университетов, академических издательств).

Хитрость номер 2: Копайте глубже

Кто из вас закрывал поисковик, бегло просмотрев первую страницу результатов? Так вот, это в корне неверно! В наших головах сидит уверенность, что лучшие и самые точные результаты находятся на первой (в крайнем случае на второй) страницах. Именно поэтому корпорации платят большие деньги, чтобы попасть на первые страницы поиска. Не дайте себя обмануть - просмотрите большее количество страниц, дальше вам могут попасться менее проплаченные, зато более интересные и нужные сайты.

Хитрость номер 3: Ясность

Вы должны хорошо понимать, что именно вы ищете, перед тем, как приступать к самому поиску. Звучит как сообщение от «капитана очевидность»? Однако это очень важный момент: очень часто пользователи надеются, что Интернет прочитает их мысли и выдаст нужный материал по первому же слову. На деле же выходит, что нужно «раскрутить» свою тему с самых основ - определения ключевых слов.

Поисковые системы имеют доступ к огромному количеству информации, и, если немного постараться, то можно получить от них «всего лишь» нужную нам информацию (вместо кучи «левых» страниц).

Хитрость номер 4: Используйте модификаторы

Не все знают, но наши обыкновенные знаки препинания (кавычки, многоточие, тире, дефис-минус и другие) и кодировки стран хорошо помогают в том, чтобы сузить результаты поиска и сделать их настолько релевантными, насколько это возможно.

  • Используйте кавычки , если вам нужна конкретная фраза или словосочетание, тогда поисковая система поймёт, что слова нужно искать всенепременно рядом.
  • Когда вам нужно найти материал, содержащий одни слова, но исключающий другие, то используйте тире (или минус). Выглядит это так: "Ньютон -яблоко". Хитрая задачка для поисковика - найти всё о Ньютоне, но не содержащее никаких упоминаний о яблоках.
  • Впишите в поисковой строке название сайта, на котором вы хотите искать. Чтобы поиск осуществлялся только на конкретном сайте, используйте слово site (сайт), сделать это можно так: если вы ищете новости про Академию Хана на сайте newtonew.. А вот и .
  • Если вам нужно найти информацию, содержащуюся в некоем численном промежутке, то можно использовать точки, чтобы указать, какой именно интервал требуется: на запрос «ЕГЭ 2010..2014» поисковая система откликнется статьями с упоминанием всех лет между 2010 и 2014 годами и словом «ЕГЭ».
  • Используйте поисковую систему с кодировкой страны, чтобы получить результаты поиска на национальных сайтах. Например, Google Кореи выглядит следующим образом: www.google.co.kr .

Хитрость номер 5: Будьте бдительны и критичны

Для тех, кто сомневается, мы авторитетно заявляем: «Не всему, что написано в Интернете, стоит верить». Увы, но это так. Поэтому когда вы читаете статью или скачиваете материал с ранее непосещённой страницы, оглядитесь: «Это сайт с первичными данными? Информация свежая, релевантная и достоверная? Статья, которую вы читаете, пестрит фактами, но не ссылается на исследования, где они получены? Кто написал статью? Не пытаются ли вам что-то продать?».

Хитрость номер 6: Цитирование и ещё раз цитирование

Как говорится, повторение - мать учения. Если вы воспользовались материалами, высказываниями и статьями какого-то источника, то сошлитесь на него потом в своей работе. Вы же не хотите, чтобы кто-то другой взял ваши соображения и идеи, а потом назвал их своими? Поэтому не поступайте так с другими.

Воспользуемся же последним пунктом и скажем спасибо сайту Edudemic и его автору Katie Lepi за прекрасный набор советов о том, как сделать процесс поиска в интернете проще, быстрее и приятнее!



Загрузка...