Ответ на пост «Хаус-кипер 2.0: зачем нам ИИ, к которому мы действительно привязаны»

Захотелось немного порассуждать на тему заданную в исходной статье. Там (на мой вкус) многовато воды и патетически риторических вопросов, но посыл ясен и довольно очевиден. Тот путь, по которому сейчас развиваются генеративные модели, пройдёт именно через такие этапы, что перечислил автор исходного поста.Начало этому уже положено - это агенты. У них есть "память" в виде базы фактов, которые нужно "помнить" про глобальный контекст агента. У них есть "инструменты" - пайплайны и скрипты на основе цепочки более простых промтов для решения типовых задач. У них есть характеристические базовые промты, которые формируют роль, характер и базовые ценности персонажа.Очевидно, что здесь мы только в самом начале пути, и в нашем цифровом доме с нами будет жить не один такой персонаж, а несколько. Так интуитивно проще с ними общаться и делегировать им задачи. Очевидно, что напрашивается и какая-то иерархия с централизацией управления, и некоторая степень автономности элементов системы.Вообще ничего принципиально нового тут нет. Люди вступают в этап "цифровых слуг". Это уже не просто инструменты, но и не равноправные "друзья". Пока ещё. Да, я технооптимист, и готов на эту тему поспорить и порассуждать здесь и в такого же вида постах, если будет кому-то интересно.Вообще для таких персонажей есть замечательный и удобный термин, который пришёл к нам давным давно от фантастов. Это же самые настоящие иск-ины - искусственные интеллекты, да, но у любого термина есть свой оттенок и свой контекст применимости. Искинами в фантастике всегда были некие "джины", цифровые персонажи, слуги, которые выполняли более или менее широкие спектры когнитивных задач.Искин дома, или космического корабля в фантастике - это понятная штука в нашей культуре. Куда понятнее и точнее, чем "ИИ", "Агент" или "генеративная модель".Кстати, в зачаточной степени на роль такого искина могла бы претендовать Алиса Яндексовна. Я не знаю по какой причине команда Алисы и Умного Дома Ядндекса не спешит развивать технологию именно в этом направлении. Может быть они не хотят быть первыми в этой гонке, ведь последователи будут учиться на их ошибках и получать преимущество за счет этого.Мне кажется Алисе давным-давно пора "понимать" и усваивать настройки не только путём указания их в профиле, а ещё через голосовой интерфейс: состав семьи в доме, где установлены её интерфейсы, наличие и имена домашних животных, предпочтения обитателей Умного Дома, их привычки, какую-то важную информацию о них, их индивидуальные расписания, планы, задачи... Сейчас с этим у Алисы всё очень ограниченно и печально.Вообще текущего уровня технологий уже достаточно, чтобы делать такого персонализированного домашнего ассистента, как описывает автор оригинального поста. Но сделать первые шаги "на коленке" относительно легко, а вот построить долгосрочный проект с перспективами многолетнего развития - гораздо сложнее.Тут нужны расширяемые специализированные фреймворки, гибкие стандарты, слоистая архитектура...Вот, к примеру, память.Очевидно, что нам нужна глубокая обратная совместимость, чтобы по мере развития проекта новые расширенные версии не забывали важные вещи, которые помнила предыдущая модель. База памяти должна иметь предикатную структуру и должна быть читаемой, то есть простой файн-тюнинг языковой модели, который зальёт какие-то кастомные "знания" в "черный ящик" нейронной сети не подойдёт. Из этого "черного ящика" эти знания чертовски сложно достать, а ещё сложнее сделать это так, чтобы быть уверенным, что ничего не потерялось и ничего не было сгаллюцинировано лишнего.То есть, видимо, нужны какие-то когнитивно-читаемые предикаты и постулаты, собранные в простую БД, может быть с иерархической древовидной или теговой структурой для удобства анализа, суммаризации и модификации. В принципе, технологии эти давно есть в инструментарии разработчиков - это базы знаний - они бывают графовые, бывают логические (Пролог), сложные, простые, узкоспециализированные или общего назначения...Сейчас все знания о мире мы загружаем в "черный ящик" генеративной модели, но это, очевидно, не самый идеальный путь. Нейронные сети отличный "переводчик" с языка на язык, отличный адаптер между абстрактными уровнями, и к слоистой архитектуре мы так или иначе придём. Это неизбежное следствие уменьшения цивилизацией энтропии своих знаний о мире. Но это я что-то уже далеко залез. Не тут бы рассыпаться на эту тему.Ещё важна прозрачность и стабильность.Было бы странно при обновлении ПО умного дома получить заметно другую личность "дворецкого" вместо старого привычного Бэримора.Да, этого нового будут звать так же, и он будет помнить все предикаты (условия и факты), которыми руководствовался его предшественник, но как контролировать целостность и преемственность суждений ИскИна на более тонком уровне косвенных предпосылок? Как добиться бесшовности его развития на более-менее больших масштабах времени?Нужны когнитивные простые суб-агенты, которые бы проводили непрерывное самотестирование ИскИна и подмечали существенное различ

Май 7, 2025 - 15:22

Ответ на пост «Хаус-кипер 2.0: зачем нам ИИ, к которому мы действительно привязаны»

Захотелось немного порассуждать на тему заданную в исходной статье. Там (на мой вкус) многовато воды и патетически риторических вопросов, но посыл ясен и довольно очевиден. Тот путь, по которому сейчас развиваются генеративные модели, пройдёт именно через такие этапы, что перечислил автор исходного поста.

Начало этому уже положено - это агенты. У них есть "память" в виде базы фактов, которые нужно "помнить" про глобальный контекст агента. У них есть "инструменты" - пайплайны и скрипты на основе цепочки более простых промтов для решения типовых задач. У них есть характеристические базовые промты, которые формируют роль, характер и базовые ценности персонажа.

Очевидно, что здесь мы только в самом начале пути, и в нашем цифровом доме с нами будет жить не один такой персонаж, а несколько. Так интуитивно проще с ними общаться и делегировать им задачи. Очевидно, что напрашивается и какая-то иерархия с централизацией управления, и некоторая степень автономности элементов системы.

Вообще ничего принципиально нового тут нет. Люди вступают в этап "цифровых слуг". Это уже не просто инструменты, но и не равноправные "друзья". Пока ещё. Да, я технооптимист, и готов на эту тему поспорить и порассуждать здесь и в такого же вида постах, если будет кому-то интересно.

Вообще для таких персонажей есть замечательный и удобный термин, который пришёл к нам давным давно от фантастов. Это же самые настоящие иск-ины - искусственные интеллекты, да, но у любого термина есть свой оттенок и свой контекст применимости. Искинами в фантастике всегда были некие "джины", цифровые персонажи, слуги, которые выполняли более или менее широкие спектры когнитивных задач.

Искин дома, или космического корабля в фантастике - это понятная штука в нашей культуре. Куда понятнее и точнее, чем "ИИ", "Агент" или "генеративная модель".

Кстати, в зачаточной степени на роль такого искина могла бы претендовать Алиса Яндексовна. Я не знаю по какой причине команда Алисы и Умного Дома Ядндекса не спешит развивать технологию именно в этом направлении. Может быть они не хотят быть первыми в этой гонке, ведь последователи будут учиться на их ошибках и получать преимущество за счет этого.

Мне кажется Алисе давным-давно пора "понимать" и усваивать настройки не только путём указания их в профиле, а ещё через голосовой интерфейс: состав семьи в доме, где установлены её интерфейсы, наличие и имена домашних животных, предпочтения обитателей Умного Дома, их привычки, какую-то важную информацию о них, их индивидуальные расписания, планы, задачи... Сейчас с этим у Алисы всё очень ограниченно и печально.

Вообще текущего уровня технологий уже достаточно, чтобы делать такого персонализированного домашнего ассистента, как описывает автор оригинального поста. Но сделать первые шаги "на коленке" относительно легко, а вот построить долгосрочный проект с перспективами многолетнего развития - гораздо сложнее.

Тут нужны расширяемые специализированные фреймворки, гибкие стандарты, слоистая архитектура...

Вот, к примеру, память.

Очевидно, что нам нужна глубокая обратная совместимость, чтобы по мере развития проекта новые расширенные версии не забывали важные вещи, которые помнила предыдущая модель. База памяти должна иметь предикатную структуру и должна быть читаемой, то есть простой файн-тюнинг языковой модели, который зальёт какие-то кастомные "знания" в "черный ящик" нейронной сети не подойдёт. Из этого "черного ящика" эти знания чертовски сложно достать, а ещё сложнее сделать это так, чтобы быть уверенным, что ничего не потерялось и ничего не было сгаллюцинировано лишнего.

То есть, видимо, нужны какие-то когнитивно-читаемые предикаты и постулаты, собранные в простую БД, может быть с иерархической древовидной или теговой структурой для удобства анализа, суммаризации и модификации. В принципе, технологии эти давно есть в инструментарии разработчиков - это базы знаний - они бывают графовые, бывают логические (Пролог), сложные, простые, узкоспециализированные или общего назначения...

Сейчас все знания о мире мы загружаем в "черный ящик" генеративной модели, но это, очевидно, не самый идеальный путь. Нейронные сети отличный "переводчик" с языка на язык, отличный адаптер между абстрактными уровнями, и к слоистой архитектуре мы так или иначе придём. Это неизбежное следствие уменьшения цивилизацией энтропии своих знаний о мире. Но это я что-то уже далеко залез. Не тут бы рассыпаться на эту тему.

Ещё важна прозрачность и стабильность.

Было бы странно при обновлении ПО умного дома получить заметно другую личность "дворецкого" вместо старого привычного Бэримора.

Да, этого нового будут звать так же, и он будет помнить все предикаты (условия и факты), которыми руководствовался его предшественник, но как контролировать целостность и преемственность суждений ИскИна на более тонком уровне косвенных предпосылок? Как добиться бесшовности его развития на более-менее больших масштабах времени?

Нужны когнитивные простые суб-агенты, которые бы проводили непрерывное самотестирование ИскИна и подмечали существенное различие в его суждениях на те или иные темы из широкого ряда, где будут вопросы этики, политики и т.д.

Ещё важно, чтобы такая сложная система как ИскИн была устойчива к когнитивно-деструктивным "мемо-вирусам", которые могли бы разрушить преемственность версий и целостность развивающегося персонажа.

С людьми такое провернуть не получится, человек может спиться, сторчаться, уйти в маргинальный образ жизни, и из инструментов для какого-то подобия контроля за такими вещами у человека есть только, разве что, психологи, психотерапевты и какие-то медикаменты.

ИскИны можно строить на базе иерархии иммутабельных (неизменяемых) слоёв, можно исследовать и подвергать когнитивным тестам изменение версий до и после дообучения моделей.

Это всё тоже большая и интересная тема, на которую не хочется здесь сильно расплываться.

А что в итоге?

Если поиграть в футурологов, то у нас, скорее всего, в ближайшем будущем будет развитие ИИ Агентов в контексте выше перечисленного. Предпосылки видны уже сейчас.

Наши домашние голосовые помощники расширятся и выйдут за пределы Умного Дома. Будут персональные ИскИны для повседневных задач. Установка будильников, чеклисты, трекинг задач для бытовых вопросов перейдёт в их зону ответственности. Также мы всё меньше будем пользоваться "однопальцевыми" интерфейсами для заказа билетов, еды, поиска фильмов и прочей организации досуга.

Если бы у вас был реальный человек-помощник, то вы бы с ним взаимодействовали больше вербально, хотя чаты иногда будут тоже удобны. Это значит, что модальности взаимодействия с ИскИнами расширятся и переплетутся. ИскИны будут "видеть" (это уже не в таком близком будущем как хотелось бы. По технологическим причинам) не только нашими глазами, но и всем нашим окружением. Они будут в курсе всего что происходит в нашем бытовом контексте. Про рабочий контекст - это отдельная история. Сотрётся четкая граница того, через что именно мы общаемся с ИскИном. Он будет сам понимать когда нам что и как удобнее воспринимать. Спросив у него погоду мы услышим коротко самое важное, а параллельно на каком-нибудь экране в поле нашего зрения откроется виджет с более подробной информацией.

Например, слушая подкаст (может быть даже генеративный), мы можем переходя от "поверхности" (экрана) к поверхности видеть какую-то сопутствующую наглядную инфографику о том, что говорится в подкасте, но можем и не обращать на это внимание.

Мне кажется это интересным образом повлияет и на наши когнитивные функции. Тут тоже большая тема, но вкратце, речь про нашу внешнюю техническую аугументацию.

Мы тысячи лет с трудом представляем себе жизнь без горячей приготовленной пищи, многие сотни лет без письменности, сотни без СМИ и периодики, десятки без телевидения и интернета. Мы пользуемся будильниками, записными книжками, часами, календарями, справочниками для расширения своей памяти и чувства времени. Мы пользуемся транспортом для расширения своих возможностей в перемещении. Медицина увеличила среднюю продолжительность на десятки лет, а детскую смертность практически исключила (в сравнительной мере, конечно же, если сравнивать с прошлым веком, средневековьем или более глубокой древностью).

Люди давно встроили технику и технологии в свою экосистему так, что без технологий ныне существующая численность населения на планете просто невозможна. Я это воспринимаю как внешнюю аугументацию. Внутренняя, которую давно пророчили фантасты, не так пока развита и ограничена пломбами, кардиостимуляторами, кохлеарными имплантами, силиконовыми сиськами, титановыми пластинами в костях и, пожалуй, всё. Тут тоже большой потенциал, но не сразу.

Зато внешняя аугументация заходит куда проще! Гугл как поиск информации мгновенно заменил энциклопедии, книги и библиотеки с ними. Нейросети сейчас заменяют гугл, местами учителей и репетиторов, местами джунов на работе, местами секретарей... но это только начало.

В интересное время мы живём. Мне кажется не было периода у человечества, когда эта фраза была бы не справедлива.

Этот текст сгенерирован исключительно естественным интеллектом биологического происхождения. Генеративные модели не применялись даже для корректуры и стилистического оформления.

Считаю это важным на данном этапе развития технологий.

@editors, мне кажется пора добавить тег "ИскИн" в смысле и контексте персонализированного ИИ-агента, являющегося индивидуализированным персонажем, который может иметь специфические черты характера, изолированную уникальную память, навыки, инструменты, допуски и зону ответственности. ИИ - это слишком широкий термин.