Введение в облачные и распределенные информационные системы - страница 2
И, наконец, есть программное обеспечение, которое работает на всех этих серверах, а также маршрутизаторы.
Программное обеспечение включает в себя операционные системы, различные приложения пользовательского уровня, поддержку IP-протокола, коммутации и маршрутизации.
Так что это единственный центр данных.
И как правило, такой центр обработки данных размещается в одном здании.
Но компания также может иметь несколько географически распределенных центров обработки данных, и они могут быть подключены друг к другу.
Таким образом, в этом случае, есть много сайтов, каждый из которых является центром обработки данных, и это часто называют географически распределенным облаком.
Но теперь остается вопрос «чем это отличается от кластера?», потому что это похоже на кластер.
Облачные вычисления не являются первой распределенной системой, которая появилась.
Первые несколько компьютеров, которые были построены в 1940-х годах, были построены на основе архитектуры или подобной архитектуры, такой, как мы знаем сегодня.
Они были фактически центрами данных; они занимали целые, большие залы и большие лаборатории.
Это была эпоха индустрии обработки данных, когда обработка данных была сосредоточена в таких центрах.
Затем в 1980-х годах появились персональные компьютеры, которые упростили создание кластеров или сетей рабочих станций, и это привело к появлению распределенных вычислений, а затем крупномасштабных систем, таких как одноранговые системы Peer-to-peer (P2P) в 1990-х и 2000-х годах.
С появлением персональных компьютеров эпоха индустрии обработки данных ушла.
И в настоящее время мы совершили круг и вернулись к эпохе индустрии обработки данных, путем создания крупномасштабных кластеров, которые обрабатывают очень большие объемы данных.
И отличие сейчас от 1960-х и 70-х в масштабах и мощностях.
Итак, чем облачная инфраструктура отличается от предыдущих поколений распределенных вычислительных систем.
Сегодняшние облака имеют масштабирование, доступ по требованию, интенсивность данных и новую парадигму облачного программирования.
Масштабирование означает, что датацентры очень большие, они содержат десятки тысяч, а иногда и сотни тысяч серверов, и вы можете запускать ваши вычисления на стольких серверах, как вы захотите.
Доступ по требованию означает, что вы не подписывайте контракт по покупке ресурсов заранее.
Нет никаких предварительных обязательств, вы платите только за то, что используете, и каждый может использовать эти ресурсы.
Третий аспект, это интенсивность данных.
То, что раньше было мегабайтами, стало терабайтами данных.
И эти данные нужно сохранить, и их необходимо обработать, и, возможно, в режиме реального времени.
Наконец, появляются новые парадигмы облачного программирования, которые упрощают обработку такие больших объемов данных.
Эти, новые программные парадигмы и парадигмы хранения являются доступными, их легко программировать и легко настраивать, и многие из них являются системами с открытым исходным кодом.
Так, это Hadoop – проект для разработки и выполнения распределённых программ.
И это MongoDB – NoSQL база данных и так далее.
И облачные сервисы классифицируются исходя из характера предоставляемых услуг.
HaaS означает «аппаратное обеспечение как услуга».
По сути, это означает, что вы получаете доступ к голым машинам, и вы можете делать с ними все, что хотите.
Например, если вы покупаете кластер, приватное облако, тогда, вы запускаете аппаратное обеспечение как сервис.