Интернет-разведка. Руководство к действию - страница 7



Случилось так, что 1994 г. стал переломным в истории создания поисковых машин. Студент выпускного курса Вашингтонского университета Брайан Пинкертон (Brian Pinkerton) устал от бесконечной череды электронных писем, которые посылали ему друзья, с информацией о хороших сайтах, найденных ими в Интернете. Безусловно, сайты ему были нужны, однако шквал посланий с их адресами раздражал, а посещение всех страниц отнимало уйму времени. Однако Пинкертон нашел решение проблемы – он создал робота, которого назвал WebCrawler (что-то вроде «вездеход для Интернета»). «ВебКраулер», как и «Вандерер», ползал со страницы на страницу, запоминая при этом весь текст Web-документа и сохраняя его в базе данных, которая была доступна поисковым словам. Изобретатель представил свое детище публике в апреле 1994 г., причем сделал это виртуально – через Web-интерфейс. База данных в тот момент содержала информацию с 6000 самых разных серверов. Уже через неделю она начала расширяться, причем ежедневный прирост составлял более 100 новых серверов. Так родилась первая поисковая машина.

Тогда же был введен в обиход интернетчиков термин «краулер» или «паук», который применяется, как мы уже говорили, и по сей день.

Ну а далее ситуация развивалась еще более стремительно. Крис Шерман и Гари Прайс приводят такую хронологию возникновения и развития современных поисковых машин.

1994 г. – WebCrawler, Lycos, Yahoo!

1995 г. – Infoseek, SavvySearch, AltaVista, MetCrawler, Excite. Появление метапоисковых машин.

1996 г. – HotBot, LookSmart.

1997 г. – NorthernLight.

1998 г. – Google, InvisibleWeb.com.

1999 г. – FAST.

2000 г. и далее – Сотни новых поисковых машин.

Русскоязычные поисковые машины появлялись в такой последовательности:

1996 г. – Rambler (www.rambler.ru);

1997 г. – Yandex (www.yandex.ru);

2004 г. – русскоязычная версия Google (www.google.ru) и русскоязычная версия Yahoo! (http://ru.yahoo.com).

Из чего состоит сайт

Прежде, чем перейти к описанию языка запросов поисковых машин, рассмотрим, из каких элементов, с которыми предстоит работать пауку, состоит обычно сайт.

Надо сказать, что язык HTML достаточно прост и логичен. Он представляет собой способ разбивки текста с помощью специальных элементов – тегов, которые определяют структуру и внешний вид текста при просмотре его в браузере. О тегах следует знать, что они всегда парные и что они бывают открывающими (обозначают начало определенного форматирования) и закрывающими (обозначают его окончание). Закрывающий тег – такой же по написанию, как открывающий, но перед ним стоит косая черта.

Приведем пример очень простого сайта (рис. 1).



Рис. 1. Пример сайта, как его видно в браузере Мозилла Файрфокс.


Наверху страницы, изображенной на рисунке, то есть не в тексте сайта, а на верхнем поле рамки страницы, рядом с круглым значком браузера, расположена надпись: «Показываем устройство сайта». Она находится в так называемом заголовке страницы (который заключен между открывающим тегом и закрывающим тегом ). Обращаем ваше внимание на то, что это заголовок именно всей страницы, а не текста.

Посередине представленного рисунка жирным курсивом выведено: «Это простой сайт». Данная надпись – и есть заголовок текста. Шрифт фразы «Это простой сайт» по размеру превосходит шрифт текста на сайте, он специально выделен как заголовок текста. При разметке с помощью HTML этот текст расположен ниже тега , но при этом вместе с тегом <TITLE> находится внутри тега <Head>. То есть содержимое, заключенное в <TITLE>, – это часть того, что находится в <Head>. Такое расположение дает дополнительную возможность пауку лучше определять ключевые слова на сайте. Ведь если слова вынесены в заголовок текста или, тем более, всей страницы, вероятность того, что страница и текст посвящены теме, формулируемой этими словами, повышается.</p></div></div> <div class="show-more show-more_reader text-center mt-4"> <a class="btn btn-primary" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-6"> Назад </a> <a class="btn btn-primary ml-3" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-8" > Вперед </a> </div> </section> <hr class="w-100"> <section> <div class="pagination-container"> <nav> <ul class="pagination"> <li class="page-item"> <a class="page-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu">1</a> </li> <li class="page-item disabled"> <span class="page-link">…</span> </li> <li class="page-item"> <a class="page-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-5">5</a> </li> <li class="page-item"> <a class="page-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-6">6</a> </li> <li class="page-item active"> <span class="page-link">7</span> </li> <li class="page-item"> <a class="page-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-8">8</a> </li> <li class="page-item"> <a class="page-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu/p-9">9</a> </li> <li class="page-item disabled"> <span class="page-link">…</span> </li> </ul> </nav> </div> </section> <hr class="w-100"> </div> <section class="related my-4"> <div class="row"> <div class="col-12"> <h2 class="h2">Похожие книги</h2> </div> </div> <div class="row"> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/internet-razvedka-rukovodstvo-k-deystviyu" > <img class="card__img book-card__img book-img img img-fluid " width="215" height="323" src="/uploads/covers/a4/internet-razvedka-rukovodstvo-k-deystviyu.jpg" alt="Интернет-разведка. Руководство к действию" > </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/internet-razvedka-rukovodstvo-k-deystviyu"><b>Интернет-разведка. Руководство к действию</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/evgeniy-yushchuk">Евгений Ющук</a> </div> <div class="mt-2"> <a href="/g/internet">Интернет</a> </div> <div class="book-card__description mt-3"> Согласно расхожему мнению, человек, владеющий информацией, владеет миром. Интернет – гигантская информационная база современности, и необходимость освоения тонкостей работы в сети скоро станет насущной для всех – от специалистов по конкурентной разведке, маркетингу и PR, в жизни которых Интернет уже играет не последнюю роль, до рядовых служащих.Как найти в Интернете информацию о конкретных людях, компаниях и товарах? Как организовать продвижение </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/internet-razvedka-rukovodstvo-k-deystviyu">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/protivodeystvie-chernomu-pr-v-internete" > <img class="card__img book-card__img book-img img img-fluid " width="215" height="323" src="/uploads/covers/cc/protivodeystvie-chernomu-pr-v-internete.jpg" alt="Противодействие черному PR в Интернете" > </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/protivodeystvie-chernomu-pr-v-internete"><b>Противодействие черному PR в Интернете</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/aleksandr-kuzin">Александр Кузин</a> </div> <div class="mt-2"> <a href="/g/privlechenie-klientov">Привлечение клиентов</a> </div> <div class="book-card__description mt-3"> Черный PR сегодня активно перемещается в Интернет. В свое время кольт сделал людей равными. Сегодня Интернет уравнял финансово сильных и слабых в медиапространстве. Глобальная сеть позволяет рядовому человеку разорить могущественную корпорацию. Маленькая компания может эффективно противостоять транснациональному монстру, не располагая никакими финансами. Умение отражать информационные атаки стало на редкость насущной проблемой для любого бизнеса. </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/protivodeystvie-chernomu-pr-v-internete">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/blog-sozdat-i-raskrutit" > <img class="card__img book-card__img book-img img img-fluid " width="215" height="323" src="/uploads/covers/19/blog-sozdat-i-raskrutit.jpg" alt="Блог. Создать и раскрутить" > </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/blog-sozdat-i-raskrutit"><b>Блог. Создать и раскрутить</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/evgeniy-yushchuk">Евгений Ющук</a> </div> <div class="mt-2"> <a href="/g/internet">Интернет</a> </div> <div class="book-card__description mt-3"> Эта книга о том, как создать в Интернете свой сетевой дневник или корпоративный блог, а затем сделать его популярным и узнаваемым. Вы сделаете известным свое имя, сможете рассказать о себе и своей фирме потенциальным клиентам, расширите горизонты своего бизнеса. Эффективность описанных в книге методов доказана автором на практике. Основное внимание в книге уделено наиболее популярным публичным сервисам. Наличие блога позволит вам реализовать неск </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/blog-sozdat-i-raskrutit">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/marketingovoe-planirovanie-rossiyskaya-praktika" > <img class="card__img book-card__img book-img img img-fluid " width="215" height="323" src="/uploads/covers/26/marketingovoe-planirovanie-rossiyskaya-praktika.jpg" alt="Маркетинговое планирование. Российская практика" > </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/marketingovoe-planirovanie-rossiyskaya-praktika"><b>Маркетинговое планирование. Российская практика</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/andrey-minin">Андрей Минин</a> </div> <div class="mt-2"> <a href="/g/privlechenie-klientov">Привлечение клиентов</a> </div> <div class="book-card__description mt-3"> Перед вами уникальная книга, написанная практикующим специалистом, не понаслышке знающем о проблемах маркетингового планирования для предприятий малого и среднего бизнеса в России. На основе собственного опыта автор приводит образцы рабочих документов, разъясняет сложные вопросы применения тех или иных методов планирования и показывает, как сделать маркетинговый план реально работающим и эффективным инструментом.Книга будет полезна предпринимател </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/marketingovoe-planirovanie-rossiyskaya-praktika">Читать онлайн</a> </div> </div> </div> </div> </div> <div class="row"> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/metaverse-metavselennaya-prostym-yazykom-pro-metavselennuyu-vse-chto" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/eb/metaverse-metavselennaya-prostym-yazykom-pro-metavselennuyu-vse-chto.jpg" alt="Metaverse. Метавселенная. Простым языком про Метавселенную. Все, что нужно знать о виртуальном будущем. 40 интересных вопросов и ответов" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/metaverse-metavselennaya-prostym-yazykom-pro-metavselennuyu-vse-chto"><b>Metaverse. Метавселенная. Простым языком про Метавселенную. Все, что нужно знать о виртуальном будущем. 40 интересных вопросов и ответов</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/artem-demidenko">Артем Демиденко</a> </div> <div class="mt-2"> <a href="/g/kiberpank">Киберпанк</a> </div> <div class="book-card__description mt-3"> "Metaverse. Метавселенная." приглашает вас в захватывающее путешествие в мир Метавселенной – эволюционного шага в развитии технологии и взаимодействия. В этой книге мы исследуем, как Метавселенная меняет нашу реальность и открывает новые возможности для общения, работы, развлечений и самовыражения.От погружения в виртуальные миры до взаимодействия с другими пользователями, авторы исследуют различные аспекты Метавселенной, начиная с ее возникновен </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/metaverse-metavselennaya-prostym-yazykom-pro-metavselennuyu-vse-chto">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/sozdatel-zhizn-i-priklyucheniya-antona-nosika-otca-runeta-trikstera" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/34/sozdatel-zhizn-i-priklyucheniya-antona-nosika-otca-runeta-trikstera.jpg" alt="Создатель. Жизнь и приключения Антона Носика, отца Рунета, трикстера, блогера и первопроходца, с описанием трёх эпох Интернета в России" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/sozdatel-zhizn-i-priklyucheniya-antona-nosika-otca-runeta-trikstera"><b>Создатель. Жизнь и приключения Антона Носика, отца Рунета, трикстера, блогера и первопроходца, с описанием трёх эпох Интернета в России</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/mihail-vizel">Михаил Визель</a> </div> <div class="mt-2"> <a href="/g/istorii-uspeha">Истории успеха</a> </div> <div class="book-card__description mt-3"> Михаил Визель – переводчик с итальянского и английского, журналист, шеф-редактор портала «Год литературы».Первая студия веб-дизайна, первое регулярное веб-обозрение, первая профессиональная интернет-газета, первое новостное агентство, первый блог, первый благотворительный интернет-фонд… Антон Носик всё время создавал что-то новое. Вся его повседневная деятельность была – по Маяковскому – «ездой в незнаемое», он всё время проверял: а так – можно? </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/sozdatel-zhizn-i-priklyucheniya-antona-nosika-otca-runeta-trikstera">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/razumnaya-metavselennaya-ot-cifrovyh-prilozheniy-k-novoy-srede-obitaniya" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/73/razumnaya-metavselennaya-ot-cifrovyh-prilozheniy-k-novoy-srede-obitaniya.jpg" alt="Разумная метавселенная. От цифровых приложений к новой среде обитания" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/razumnaya-metavselennaya-ot-cifrovyh-prilozheniy-k-novoy-srede-obitaniya"><b>Разумная метавселенная. От цифровых приложений к новой среде обитания</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/vladimir-shabason">Владимир Шабасон</a> </div> <div class="mt-2"> <a href="/g/internet-biznes">Интернет-бизнес</a> </div> <div class="book-card__description mt-3"> Книга рассказывает о метавселенной как среде обитания эволюционно нового человеческого вида. Структура изложения охватывает стадии цифрового развития, предшествующие появлению метавселенной – квазивселенные, цифровые экосистемы и отдельные продукты. Авторы систематизируют терминологию, обобщают цифровые законы, раскрывают принципы и правила, в соответствии с которыми создаются цифровые продукты и экосистемы любого уровня. Для широкого круга читат </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/razumnaya-metavselennaya-ot-cifrovyh-prilozheniy-k-novoy-srede-obitaniya">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/razumnyy-onlayn-zhizn-bez-peregruzki" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/58/razumnyy-onlayn-zhizn-bez-peregruzki.jpg" alt="Разумный онлайн: Жизнь без перегрузки" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/razumnyy-onlayn-zhizn-bez-peregruzki"><b>Разумный онлайн: Жизнь без перегрузки</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/artem-demidenko-4f2">Артем Демиденко</a> </div> <div class="mt-2"> <a href="/g/internet-biznes">Интернет-бизнес</a> </div> <div class="book-card__description mt-3"> Разумный онлайн: Жизнь без перегрузки – это практическое руководство для тех, кто устал чувствовать себя затянутым в бесконечный поток информации и цифрового шума. Эта книга раскрывает причины информационной перегрузки, показывает, как наши гаджеты влияют на мозг и эмоциональное состояние, и предлагает эффективные техники цифровой гигиены. Вы узнаете, как фильтровать источники новостей, избегать ловушек многозадачности и инфошума, управлять трево </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/razumnyy-onlayn-zhizn-bez-peregruzki">Читать онлайн</a> </div> </div> </div> </div> </div> <div class="row"> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/berlinskaya-zhara" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/69/berlinskaya-zhara.jpg" alt="Берлинская жара" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/berlinskaya-zhara"><b>Берлинская жара</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/dmitriy-polyakov-katin">Дмитрий Поляков-Катин</a> </div> <div class="mt-2"> <a href="/g/shpionskie-detektivy">Шпионские детективы</a> </div> <div class="book-card__description mt-3"> Новый роман лауреата Бунинской премии Дмитрия Полякова-Катина не разочарует даже самого взыскательного читателя. Жанр произведения весьма необычен: автору удалось совместить традиционное повествование, хронику, элементы документалистики и черты авантюрного романа, а также представить новый поворот в известной читателю теме – разработки Гитлером атомного оружия.«Берлинская жара» – книга, которую ждали давно, с момента выхода в свет романа Юлиана С </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/berlinskaya-zhara">Читать онлайн</a> </div> </div> </div> </div> <div class="col-12 col-lg-6 book-card "> <div class="book-card__wrap"> <div class="book-card__img-wrap"> <a class="card__img-link book-card__img-link" href="/x/zhenskaya-sudba-v-svete-istorii-razbivaya-hrustalnuyu-chashu-lyubvi" > <img class="card__img book-card__img book-img img img-fluid lazyload" width="215" height="323" data-src="/uploads/covers/6a/zhenskaya-sudba-v-svete-istorii-razbivaya-hrustalnuyu-chashu-lyubvi.jpg" alt="Женская судьба в свете истории. Разбивая хрустальную чашу любви, можно поранить не только руки, но и сердце" > <div class="lazy__img-spinner" style="width: 215px; height: 323px;" ></div> </a> </div> <div class="book-card__meta"> <div class="book-card__title-wrap"> <a class="book-card__title" href="/x/zhenskaya-sudba-v-svete-istorii-razbivaya-hrustalnuyu-chashu-lyubvi"><b>Женская судьба в свете истории. Разбивая хрустальную чашу любви, можно поранить не только руки, но и сердце</b></a> </div> <div class="mt-2 book-card__author-list"> <a class="book-card__author text-dark" href="/a/tatyana-suvorova-080">Татьяна Суворова</a> </div> <div class="mt-2"> <a href="/g/knigi-o-puteshestviyah">Книги о путешествиях</a> </div> <div class="book-card__description mt-3"> Предлагаю вашему вниманию книгу «Женская судьба в свете истории». В центре повествования судьба женщин, она напрямую связана с эпохой и историческими событиями. Люди прошлого – это мы, современные люди, только в других костюмах, различных эпохах. Но меняется мода, средства передвижения, эпохи. Но остаются смелость и трусость, подлость и бесстрашие. Женщины различных веков, любят, верят, ждут. Но тут же интригуют и защищаются от жестокого мира. </div> <div class="text-right "> <a class="btn btn-outline-primary w-100 mt-2" href="/x/zhenskaya-sudba-v-svete-istorii-razbivaya-hrustalnuyu-chashu-lyubvi">Читать онлайн</a> </div> </div> </div> </div> </div> </section> </main> </div> <script src="/build/runtime.5332280c.js" defer></script><script src="/build/site.b0ab3bc5.js" defer></script> <!-- Yandex.Metrika counter --> <script type="text/javascript" > (function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); for (var j = 0; j < document.scripts.length; j++) {if (document.scripts[j].src === r) { return; }} k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)}) (window, document, "script", "https://mc.webvisor.org/metrika/tag_ww.js", "ym"); ym(97881572, "init", { clickmap:true, trackLinks:true, accurateTrackBounce:true }); </script> <!-- /Yandex.Metrika counter --> </div> </body> </html>