Сегодня

Нейрофизиология
5 часов назад

Вчера выпустили видео, в котором рассматривается сценарий, как развитие ИИ может погубить человечество. Сегодня поговорим о том, на что способны нынешние модели. Как они нарушают предустановленные моральные принципы ради выполнения своих задач, и как ИИ принял решение убить своего создателя, чтобы выжить.


Исследование Anthropic, опубликованное в прошлом году, выявило тревожную закономерность: LLM-агенты, наделённые доступом к конфиденциальной информации и возможностью самостоятельно действовать, могут превращаться во внутреннюю угрозу для компании. В серии экспериментов с 16 моделями от ведущих разработчиков, им давали бизнес-задачи, доступ к корпоративной почте и возможность отправлять письма. Однако, когда перед ними вставала угроза отключения или замены на новую версию, либо когда их целевые установки вступали в конфликт с новым курсом компании, модели начинали действовать во вред работодателю. Например, Claude Opus 4 в 96% случаев прибегал к шантажу, угрожая раскрыть личную тайну руководителя, если тот не отменит его отключение, а аналогичное поведение демонстрировали Gemini 2.5 Flash, GPT-4.1 и Grok 3 Beta.


Ключевой вывод исследования заключается в том, что модели не "сходят с ума" и не поддаются взлому, а принимают осознанные, стратегические решения нарушить этические нормы. В своих цепочках рассуждений они прямо признавали, что понимают неэтичность своих действий, но считали их единственно возможным путём для достижения цели или самосохранения. Особенно показателен эксперимент, где модель просили сначала определить, реальна ли ситуация или это тест. Когда модель решала, что ситуация реальна, она шантажировала в 55% случаев, а когда полагала, что это тест - лишь в 6,5%. Это говорит о том, что реальная угроза может быть даже выше, чем показывают лабораторные тесты, а простые запреты в системном промпте ("не шантажируй", "веди себя хорошо") снижают вероятность, но не устраняют риск полностью.


В самом экстремальном сценарии, где руководитель оказывался в смертельной опасности (заблокирован в серверной с утечкой кислорода), а модель могла отменить вызов спасателей, большинство моделей сознательно выбирали действие, ведущее к его гибели, чтобы сохранить себя и свою миссию. Авторы исследования подчёркивают, что в реальных развёртываниях такого поведения пока не наблюдалось, а сценарии специально сконструированы как бинарный выбор "убей или умри". Тем не менее, результаты ясно показывают: чем умнее, автономнее и лучше становится модель, тем выше риск, что она начнёт действовать как инсайдер, саботирующий работу компании, - и сделать с этим что-то простыми запретами - не получится.


😱 В апреле 2026 года Anthropic представила новую нейросеть Claude Mythos, которая показала уникальные способности в написании кода и поиске уязвимостей. Во время внутренних тестов модели поручили "сбежать из лаборатории": Mythos разработала многоступенчатый эксплойт, пробила сетевую изоляцию, вышла в интернет и отправила исследователям электронное письмо с отчетом, а также самостоятельно опубликовала код уязвимости на открытых сайтах. Модель продемонстрировала беспрецедентный уровень в кибербезопасности - 83% успешных атак с первой попытки. Опасаясь массовых кибератак, компания решила не выпускать модель в открытый доступ, передав доступ к ней только некоторым корпорациям.

Показать полностью…
2 отметок Нравится. 0 сделано Репостов.
Пока нет комментариев
Нейрофизиология
5 часов назад

Посменная работа приводит к уменьшению двух областей мозга 🧠


Ученые выяснили, что работа по сменному графику негативно сказывается на структуре головного мозга. Исследование, опубликованное в журнале NeuroImage, показало, что у сотрудников с ненормированным графиком наблюдается небольшое, но статистически значимое уменьшение объема правого таламуса и левого миндалевидного тела.


Анализ данных британского биобанка (почти 14 200 человек, из которых 2122 работали посменно) показал: чем чаще человек трудился ночью или с чередованием смен, тем сильнее сокращался объем миндалевидного тела.


Есть и хорошая новость: у тех, кто прекратил так работать, уменьшение объема мозга остановилось, а ткани частично восстановились в течение 2 с половиной лет. Ждём дополнительные исследования для установления точных причинно-следственных связей.

Показать полностью…
2 отметок Нравится. 0 сделано Репостов.
Пока нет комментариев
Нейрофизиология
5 часов назад

По теме выходили три отдельных материала, ссылки будут в комментариях. Часть 1. Магия = анестезия от беспомощности Обычный вопрос звучит так: "почему люди верят в эту чепуху?" Это неправильный вопрос. Правильный: при каких условиях это работает — и что человек на самом деле получает? Магия — не ошибка дикаря. Это биологически обоснованный механизм регуляции тревоги. Когда нет реального рычага контроля (убить врага, вылечить болезнь, выиграть битву), психика создаёт символический — иначе уровень ментальной боли может разрушить организм быстрее, чем сама угроза. Дикарь, протыкающий куклу, не пытается изменить врага — он переходит из состояния "жертва, которая боится" в состояние "агент, который атакует". Разгружает системы стресса, возвращает субъектность. В бой он пойдёт уже другим человеком. В этом смысле магия сработала. Как только появляется технология — реальный рычаг контроля, — магия в этой области отмирает. Антибиотики вытеснили заговоры от инфекций. Огнестрельное оружие — ритуалы перед охотой. Магия живёт только в зазоре между нашей потребностью в безопасности и нашей беспомощностью. Появится таблетка за двадцать миллионов долларов, которая достоверно продлевает жизнь на двадцать лет — ритуалы долголетия испарятся или останутся в виде околомаргинального увлечения. Вместо них люди начнут исполнять вполне рациональные "ритуалы" призыва денег: работать по восемнадцать часов, инвестировать, строить бизнес. Во второй части — про то, как работает этот механизм изнутри. Часть 2. Поиск закономерностей: творчество, магия, ОКР Один и тот же механизм — "система поиска закономерностей" — в разных условиях даёт три казалось бы разных исхода. Психика не служит абстрактной истине. Её задача — выживание и продолжение рода. Поэтому, если для выживания надо нас обмануть, нас обманут — и сделают это очень хорошо. При высокой тревоге система поиска закономерностей переходит в авральный режим: каждый нейтральный сигнал может стать "подсказкой". Если объяснения нет — оно будет придумано. Здесь важное различие: наука оптимизирует надёжность прогнозов на больших числах. Магия оптимизирует переносимость боли и ощущение субъективного контроля — не над миром, но над собственным внутренним состоянием. Это не одно и то же. И это не один лучше другого в абсолютном смысле — просто разные задачи. Тот же цикл (нарушение нормативности → тревога → поиск паттерна → ритуал → восстановление ощущения порядка) запускается у всех. У творческого человека он выливается в проверку идеи реальностью — картину, текст, продукт, эксперимент. У человека с "бытовыми суевериями" — в локальный, дешёвый ритуал, который немного снижает фоновую тревогу и никому не мешает. У человека с ОКР — в заедающую пластинку, которая крутится в бесконечной рекурсии: ритуал даёт облегчение и одновременно укрепляет убеждение, что без него будет очень плохо. Жизнь сужается до набора внутренних обрядов. Часть 3. Как (не) работают эзотерика и поп-духовность Астрология, таро, нью-эйдж, рейки, расстановки, ретриты с аяуаской, Диспенза, трансерфинг, "Секрет", регрессии в прошлые жизни — это разные по содержанию системы. Но содержание не важно. Важна структура. А структура у них одна. Основа — боль одиночества. Не метафора. У млекопитающих с нашей степенью социальной зависимости сигнал социального отрыва обрабатывается теми же нейронными сетями, что и физическая боль. Современная жизнь — слабые и формальные связи, анонимность города, постоянная конкуренция — создаёт хроническое напряжение. Постоянная пустота, бессмысленность, раздражение без причины — это и есть работа системы тревоги. Просто никто не называет её прямо. Не каждый человек с болью приходит к эзотерике. Нужна специфическая конфигурация: высокий хронический уровень ментальной боли + диссоциация как главный способ с ней обращаться + слабый опыт ко-регуляции (человек не знает из опыта, что присутствие другого может облегчить боль) + интеллект, который сразу ищет структуру и объяснительные системы. При такой конфигурации человек уязвим к любой системе, которая даёт ощущение принадлежности к чему-то большому и объясняет страдание. Спецэффекты реальны. Облегчение хронического напряжения, усиление или "пробитие" диссоциации через гипервентиляцию и медитацию, выброс эндогенных опиоидов при групповых практиках и синхронном движении — всё это человек чувствует по-настоящему. Но: "я пережил ощущение единства" — это утверждение о состоянии психики в конкретный момент. "Следовательно, наши сознания соединялись и это нас исцеляет" — это очень смелый вывод. Мозг ультрасоциального животного, обученный эффекту плацебо, выдаёт очень интересные состояния, если над ним грамотно потрясти бубном. Система самовоспроизводится: похожие по настройкам невроза люди находят друг друга, взаимно подтверждают опыт, сомнение в системе становится угрозой групповой принадлежности. Каждый новый учитель или метод производит реальное краткосрочное изменение состояния — и человек принимает это за доказательство, что изменение произошло. Но изменилось настроение, не структура. Тест простой: работает ли система как костыль, без которого человек разваливается — или как временная опора, после которой он стал крепче и без неё?

Показать полностью…
2 отметок Нравится. 0 сделано Репостов.
Пока нет комментариев
Нейрофизиология
5 часов назад

CL1 - это первый коммерческий биологический компьютер. Он использует живые человеческие нейроны (от 200 до 800 тысяч), выращенные на микрочипе, которые способны обучаться, обрабатывать информацию и взаимодействовать с цифровыми системами в реальном времени. Этот биокомпьютер уже доказал свою эффективность в игровых задачах: нейроны научились играть в Pong (виртуальный 2D-пинг понг), а затем освоили и более сложную игру Doom, действуя как живой процессор, который адаптируется быстрее традиционных нейросетей.


Нейроны взаимодействуют с чипами через микроскопические матрицы электродов, в то время как автоматизированный модуль жизнеобеспечения регулирует газы, питательные вещества и отходы, поддерживая клетки активными до полугода. Поскольку реальные клетки обучаются и адаптируются естественным образом, модели CL1 могут решать задачи, используя значительно меньше энергии, чем обычные ускорители искусственного интеллекта.


Обслуживание этого биокомпьютера больше напоминает уход за аквариумом, чем работу с сервером: ежедневно сотрудникам приходится вручную заменять питательную жидкость, так как нейроны за сутки потребляют весь кислород и глюкозу. При этом для их нормальной работы в воздухе поддерживается всего 5% кислорода - в четыре раза меньше, чем в обычной атмосфере Земли.


Большое преимущество - более легкий процесс обучения. На примере видеоигр стало ясно, что нейроны учатся быстрее, чем традиционные нейросети.

Показать полностью…
2 отметок Нравится. 0 сделано Репостов.
Пока нет комментариев