Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт - страница 6

Кенвуд Таун Центр, Цинциннати, штат Огайо

В ходе этого мысленного эксперимента каждый участник создает в своей голове слегка отличающийся алгоритм. Разумеется, все смотрят на маркеры, окружающие интересующую нас точку X, чтобы понять особенности района, но в какой-то момент необходимо решить, что ресторан находится слишком далеко, чтобы повлиять на прогноз. Иногда человек видит единственный ближайший ресторан, в данном случае – независимый (I), и основывает на этом свой прогноз: «Ближайшим соседом ресторана X является независимый ресторан (I), поэтому мой прогноз – (I)».

Однако большинство людей учитывают несколько соседних ресторанов. На втором изображении вокруг нового ресторана нарисована окружность, включающая семь его ближайших соседей. Вероятно, вы выбрали другое число, но мы выбрали 7. Шесть из семи ресторанов сетевые (С), поэтому мы прогнозируем, что новый ресторан тоже будет сетевым.

Что дальше?

Если вы поняли пример с рестораном, значит, вы уже на пути становления главным по данным. Давайте пройдемся по тому, что вы узнали.

– Вы выполнили классификацию, предсказав метку для нового ресторана (сетевой или независимый), обучив алгоритм на наборе данных (содержащем местоположения ресторанов и соответствующие метки).

– В этом состоит суть машинного обучения! Просто для разработки алгоритма вы использовали не компьютер, а собственную голову.

– Данный тип машинного обучения называется контролируемым обучением, потому что вы знали, что существующие рестораны были сетевыми (C) или независимыми (I). Эти метки направляли (то есть контролировали) ход ваших мыслей при размышлении о том, как расположение ресторана связано с его типом (сетевой или независимый).

– Если еще конкретнее, то вы использовали алгоритм контролируемой классификации под названием метод k-ближайших соседей[6]. Если K = 1, посмотрите на ближайший ресторан и получите свой прогноз. Если K = 7, посмотрите на 7 ближайших ресторанов и сделайте предсказание на основе их большинства. Это интуитивно понятный и мощный алгоритм. И в нем нет никакого волшебства.

– Вы также узнали о том, что для принятия обоснованных решений вам нужны данные. Однако помимо них вам необходимо кое-что еще. В конце концов, в этой книге много внимания уделяется критическому мышлению. Мы хотим показать не только то, как работают те или иные вещи, но и то, почему иногда они не срабатывают. Если бы мы попросили вас спрогнозировать, опираясь на приведенные в этом разделе изображения, будет ли новый ресторан ориентирован на детей, вы бы не смогли ответить. Для принятия обоснованных решений подходят далеко не любые данные. Для этого нужно достаточное количество точных и релевантных данных.

– Помните технические термины, которые мы упоминали ранее, говоря об «…анализе бинарной переменной отклика методом контролируемого обучения?..» Поздравляем, вы только что выполнили такой анализ. Переменная отклика – это просто еще одно название метки, и она является бинарной, потому что в нашем примере их было две – (C) и (I).

В этом разделе вы многое узнали, причем даже не осознавая этого.

Для кого написана эта книга?

Как говорится в начале этой книги, данные затрагивают жизни многих сотрудников современных корпораций. Мы придумали нескольких аватаров, представляющих людей, которые могут выиграть от становления главными по данным.

Мишель – специалист по маркетингу, которая работает бок о бок с аналитиком данных. Она разрабатывает маркетинговые инициативы, а ее коллега собирает данные и измеряет влияние, оказываемое этими инициативами. Мишель считает, что их работа должна быть более инновационной, но не может донести до коллеги свои потребности в данных и их анализе. Общение между ними затруднено. Она поискала в Google некоторые специальные термины (машинное обучение и прогностическая аналитика), но в большинстве найденных ею статей использовались чрезмерно технические определения, неразборчивый компьютерный код, реклама аналитического программного обеспечения или консультационных услуг. В результате поисков она почувствовала еще большую тревогу и растерянность, чем раньше.

Назад Вперед

Похожие книги

Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт

Алекс Дж. Гатман

Программирование

Перед вами исчерпывающее руководство по основам Data Science. С помощью него вы сможете научиться мыслить статистически и понимать, какую роль в вашей работе играет аналитика, пользоваться языком науки о данных, избегать распространенных ошибок при работе с ними и, наконец, разобраться в полезных инструментах, которые используют эксперты.В формате PDF A4 сохранен издательский макет книги.

Читать онлайн

Создай свой VPN. Безопасное использование интернета

Джейд Картер

Самоучители

Книга будет полезна для тех, кто стремится к созданию собственной виртуальной частной сети (VPN). Она охватывает широкий спектр тем, начиная с основ безопасности сетей и технологий VPN, и заканчивая практическими шагами по настройке и обслуживанию серверов и клиентов VPN. Автор подробно рассматривает различные аспекты создания VPN, включая выбор платформы и инфраструктуры, обеспечение безопасности данных, оптимизацию производительности и интеграц

Читать онлайн

AGI на IoT с подкреплением децентрализованной валютой

Лэй Энстазия

Программирование

Эта книга о будущем, где искусственный интеллект постепенно преображается в универсальный мозг, рождающийся из множества IoT-устройств, объединённых в децентрализованную сеть. Автор исследует, как самообучающиеся системы, способные автоматически переписывать и оптимизировать собственный код, превращают каждое «умное» устройство в автономного агента. Благодаря применению механизмов мотивации через альткоины, каждое устройство не только обмениваетс

Читать онлайн

Потенциал ИИ в бизнесе. Стратегическое применение искусственного интеллекта и Big Data

Аша Саксена

Программирование

Наверняка вы слышали об искусственном интеллекте (ИИ) и больших данных, но думали, что эти технологии слишком сложны. Возможно, вы представляете ИИ как что-то из голливудских научно-фантастических фильмов. Но искусственный интеллект – уже часть нашей повседневной жизни. И он способен изменить ваш бизнес к лучшему.Как использовать мощный потенциал ИИ, больших данных и других технологий для расширения и развития бизнеса? Ответы на эти вопросы вы н

Читать онлайн

Программирование на Java: Руководство для опытных разработчиков

Программист

Программирование

Эта книга предназначена для опытных разработчиков, которые хотят углубить свои знания и навыки в программировании на Java. В ней рассматриваются наиболее актуальные и сложные темы, включая разработку высокопроизводительных приложений, использование современных библиотек и фреймворков, а также лучшие практики программирования на Java. Книга содержит подробные примеры, код и практические задания, которые помогут читателям закрепить свои знания и на

Читать онлайн

Беглянка с секретом - 2

Счастная Елена

Любовное фэнтези

Один из самых могущественных магов королевства сделал мне предложение, от которого нельзя отказываться разумной девушке. Соперницы негодуют и мечтают сжить меня со свету. Высшие маги не желают признавать ту, кто должна была кануть в безвестность, исполнив свой долг. Неизвестные преследуют, желая забрать то, что хранит моё тело. Что ещё я должна узнать о себе, чтобы овладеть так неожиданно проявившейся силой? И что ещё мне нужно узнать об Альдоре

Читать онлайн

Свой среди чужих. Переговоры изнутри

Андрей Толкачев

Российская практика

В этой книге – мастер-класс из 80 кейсов. Решив их, вы сможете без проблем договориться с кем угодно по любому вопросу – будь то собеседование о приеме на работу, разговор с начальником или коммерческая сделка на рынке.Вы сформируете свой индивидуальный инструментарий переговорщика с помощью технологии СКАРП, в которой представлены 20 целей, 15 реакций, 40 приемов, 3 способа и 7 стилей переговоров.Книга подойдет бизнесменам, создателям и руководи

Читать онлайн