AI JOLY - страница 3
Вообще, это обычное для таких, как я, пренебрежительное отношение к близлежащим братским народам, на котором в наших умах и строилась большая часть интуитивной доктрины величия казахской нации, со временем не выдерживало критики. Шахристаны Бухары, утопавшие в золоте согдийских закатов, а также величественный мрамор тимуридских мавзолеев Самарканда, когда я в молодости путешествовал по Узбекистану с его отличными дорогами, стабильной мобильной связью и чистыми придорожными туалетами, несколько поколебали мою уверенность в превосходстве моей нации над теми, кого в 17–18 веках так часто били мои героические предки. А успехи кыргызских революций, IT-предпринимателей, инфраструктуры туризма и даже боксёров-любителей после очередной блёклой для Казахстана олимпиады вызывали зависть и обострение конфронтации с кыргызами в популярных тогда социальных сетях.
Что же касается языка, с ним у меня всё было примерно так же. Государство пропагандировало развитие собственных LLM на государственном языке. Инвестировались большие деньги, писались концепции, программы, дорожные карты, организовывались проекты государственно-частного партнёрства, даже собирались данные из библиотек, архивов, записи телефонных разговоров, кол-центров, выделялись гранты, привлекались инвестиции, декларировалась какая-то готовность каких-то моделей, на цифровых выставках показывались красивые цифры с высоким уровнем распознавания, попадания в контекст, скорости и качества ответа и его правдоподобности.
Заявлялся (а потом несколько раз утверждался и даже реализовывался) полный цифровой суверенитет в части языка, искусственного интеллекта, его генеративного направления и так далее. Депутаты Мажилиса вменяли МИДу задачу создания пантюркистского искусственного интеллекта, пантюркистских же общеязыковых моделей, межгосударственных комиссий по, например, созданию контента для казахо-узбекоговорящих жителей юга страны. На моей памяти было даже проведено несколько нового формата цифровых тусовок, столь любимых в нашей стране. На одной из них, я даже запомнил, была такая интересная презентация с веточками дерева казахского языка, и между стандартной алматинской и западной цифровыми методами была подсчитана разница в порядка двенадцати, по-моему, процентов по общей частоте использования слов.
Не забывали и про так называемый «шалаказахский» язык русскоязычных казахов, сильно перемешанный с русским, и утверждалось даже, что голосовой робот способен общаться свободно с русскоязычными пользователями. В результате чего даже появилась серия новых версий о том, что такой шалаказахский чат-бот лучше говорит на русском, чем на казахском, причём настолько, что даже лучше, чем яндексовская Алиса, которая, кстати, так и не заговорила на казахском, несмотря на все обещания разработчиков. Что самое ужасное, и я во всём этом принимал наинепосредственнейшее участие.
Пока весь технологический мир совершал свои первые прорывы в области коммуникаций между натуральным мозгом и внешними информационными системами и строил первые нейралинки, мы продолжали всё глубже и глубже погружаться в потёмки языковых моделей. На территории EXPO в Астане открыли новый акселератор искусственного интеллекта, который назвали AI Dala, и всевозможные казаховеды, айтишники, бигдатеры, питонщики-эскуэльщики, стартаперы по природе и стартаперы по духу, грантхантеры, госушники из минцифры, мининфы, минкульта, представители университетов, Microsoft, Yandex, Huawei и прочие сильно заигрывающие с правительством вендоры, интеграторы и прочие джентльмены цифровой удачи разместили там свои стенды, песочницы, лаборатории, серверы, посадили своих людей, наклеили красивые таблички и начали строить Великий Суверенный Казахский AI. В качестве своей первой резолюции этот импровизированный птичий базар принял, впрочем, достаточно негласно, правило говорить в стенах акселератора на казахском языке.