Искусственный интеллект: начала MSM. Сингулярность неизбежна - страница 7
– Каждая новая ветка начинается с буквы А. Каждая добавочная в ряде одного порядка – следующий по значению код символа.
То есть, каждый новый уровень мы начнем с добавления «А» к коду, а если какой-то объект добавляется к существующему на одном уровне, то получим уже «В», «C», «D»… и т. д.
Начиная работу над базой кодов, я признаюсь, пытался «загуглить» некий «Классификатор всего», но не нашел. К сожалению, человечество так и не пришло к простой идее создания универсального классификатора всего сущего. Сначала мне было сложно классифицировать все неживые понятия, поскольку даже сложно представить, с чего начать. Но впоследствии дело пошло вперед.
Я начал работу над собственным классификатором, и прорисовал его графически для простоты представления в powerpoint, и на первом этапе это выглядело, как на рисунке 10.
Рис. 10. Графический пример ветвлений в начале классифицирования неживого (слева) и живого (справа).
(Левая часть рисунка – это часть классификатора наиболее разветвленного, «Неживого»). С правой частью особых проблем испытывать не пришлось, спасибо биологам и ботаникам, которые хорошо потрудились над проработкой классификации царства животных и растений.
Из рисунка видно, что схема кажется очень сложной, и запутанной, хотя здесь всего лишь около 150 базисных наименований. К моменту написания этих строк число основных объектов в базе данных рабочей программы уже составляет около 3000 (Продолжая работу по расширению ядра классификатора с использованием морфологии и толкового словаря это число уже приблизилось к 60 000 слов, но эта история достойна отдельной книги. Прим. автора ко второму изданию). И хотя эта схема еще слишком проста для классификации «ВСЕГО», но уже слишком сложна, чтобы изобразить ее в виде подобного двухмерного рисунка. В будущем мы обязательно это нарисуем.
Кстати говоря, мне очень импонирует, что эта схема чем-то напоминает человеческий мозг (рис. 11). Или мне кажется? Но это несущественный вопрос.
Рис. 11. Если разветвленную структуру «классификатора всего» «упаковать» в небольшом объеме, то он мог бы получить сходство со схематичным мозгом.
В принципе, нам и не нужно разбираться в сложностях классификатора, за нас это будет делать компьютерная программа.
Новые понятия в этот классификатор добавляются очень просто, с использованием легкой конструкции объяснений, к какому объекту какой принадлежит.
Посмотрим, как выглядит часть записей словаря «боевой» программы на рисунке 12.
Рис. 12. Фрагмент кодирования в словаре «боевой» (но все же, тестовой) программы.
Сохраняя новые и новые объекты и их коды в базу данных, мы получаем структуру, обладающую огромным потенциалом, которую я назвал «Многомерным строчным множеством» или «Multidimensional Strings Multiplicity» (англ.). (Сокращенно, можно использовать аббревиатуру MSM или «слово-множество»).
Глава 2. Невероятное многомерное множество
Слово «невероятное» используется в названии этой главы, не потому что для MSM есть что-то невозможное, а скорее наоборот, потому что само существование подобной структуры дает нам невероятное количество возможностей.
Что самое главное – эта структура обладает важнейшим свойством комплементарности элементов между собой. Элементы классов в отличие от других онтологий и классификаторов приобретают неявное свойство дополнительной операбельности, унификации во взаимоотношениях друг с другом и в связи с этим не требуют дополнительной памяти. Сравнивать классификаторы MSM и обычное ООП или классификатор – это как сравнивать паровой двигатель и двигатель внутреннего сгорания. Да, и то и другое едет, но первичные преимущества MSM очевидны: это и скорость и энергозатратность.