ISSN 3033-7186 (Online)

Как голос меняется при усталости и стрессе и зачем это нужно машинам

7
7-9 минут
10.05.2026

Представьте: вы бежите в гору и пытаетесь объяснить другу по телефону, как доехать до кафе. Голос становится отрывистым, тон ползёт вверх, слова рваные. Вы наверняка замечали это за собой, но новые акустические исследования показывают — за этими «случайными» изменениями стоит очень чёткая, измеримая физиология. И именно её, скорее всего, в ближайшие годы начнут читать машины: голосовые помощники, носимые гаджеты, системы связи в спецтехнике и медицинские приложения. В этой статье разберёмся, что именно меняется в голосе, когда человек устал или напряжён, почему это часто не слышит ухо, но видит спектрограмма, и зачем это всё нужно алгоритмам.

Каждый из нас несколько раз в день сталкивается с тем, как тело влияет на речь — после подъёма по лестнице, после долгого совещания, перед экзаменом или дедлайном. Просто раньше об этом думали как о бытовой мелочи, а сейчас это превратилось в отдельное направление акустики речи.

Тест разговором

Спортивные физиологи давно пользуются «talk test» — простым тестом разговора. Идея банальная: если во время нагрузки вы спокойно болтаете и даже можете спеть пару строчек, нагрузка лёгкая. Если получается говорить только короткими фразами — это уже средняя интенсивность. А если речь рвётся на отдельные слова — вы работаете на высокой мощности.

Так вот, недавняя работа, представленная на одной крупной акустической конференции в мае, показала, что за этим простым тестом стоит механизм, который можно описать в цифрах. Исследовательница из американского университета (специализирующаяся как раз на акустике речи) объясняет это так: физическая нагрузка напрямую меняет дыхание и фонацию, а поскольку речь использует ту же дыхательную систему, эти изменения «протекают» дальше — в высоту голоса, в тайминг, в качество звука.

Иначе говоря, лёгкие и гортань не могут одновременно обслуживать максимальный газообмен и нормальную речь. Тело выбирает дыхание. Речь подстраивается.

Что именно меняется в голосе

Если коротко — почти всё, что можно измерить. Если подробно — есть несколько ключевых параметров, на которые акустики смотрят в первую очередь:

  • Высота тона. Под нагрузкой и при стрессе она, как правило, растёт. Голосовые складки натягиваются сильнее, мышцы гортани напрягаются — и вибрация ускоряется. Любопытная деталь: рост высоты тона при психологическом стрессе хорошо коррелирует с уровнем кортизола в слюне. В одном исследовании заметные изменения F0 наблюдались только у тех людей, у кого кортизол под стрессом вырастал больше чем вдвое от базового уровня. То есть голос «выдаёт» именно тех, кто реально сильно реагирует физиологически, а не просто волнуется на словах.
  • Громкость. Тоже растёт — мы инстинктивно говорим громче, когда подналегаем. Но интересно другое: одновременно с ростом громкости она становится менее стабильной. Появляются колебания амплитуды, которые называют шиммером. Он связан с регулярностью колебаний голосовых складок и эффективностью прохождения воздуха через гортань. При усталости, паническом дыхании, неглубоком и нерегулярном вдохе шиммер ползёт вверх — и это очень удобный маркер для алгоритмов.
  • Структура пауз и темп речи. Здесь самое интересное для повседневной жизни. Когда телу нужно больше времени на вдох, оно его берёт. Речь становится более сегментированной — паузы становятся длиннее и встречаются чаще. Темп замедляется. То есть фраза, которая в покое произносится одним дыхательным движением, во время бега разбивается на три-четыре фрагмента. Машинам это особенно мешает: системы распознавания речи привыкли к более-менее ровному ритму.
  • Джиттер. Это микроколебания в высоте тона от цикла к циклу. Связан с тонким контролем голосовых складок. При усталости, эмоциональном напряжении или утомлённой гортани он часто растёт. Сам по себе джиттер — не единственный маркер, но в паре с шиммером и отношением гармоник к шуму (HNR) даёт довольно надёжный сигнал.
  • Спектральные характеристики и формантные частоты. Тоже сдвигаются — отчасти из-за того, что под стрессом меняется напряжение мышц гортани и положение голосового тракта. Энергия часто перераспределяется в сторону более низких частот; это связывают с увеличенным ларингеальным натяжением и изменённой вибрацией складок.

Почему это часто не слышно ухом

Тут начинается самое интересное. Многие из этих изменений настолько тонкие, что собеседник их попросту не замечает. Голос звучит «как обычно», ну может чуть напряжённее. А приборы фиксируют чёткий, систематический сдвиг.

Автор того самого недавнего исследования формулирует это так: высота тона, громкость и временны́е характеристики показывают ясные и согласованные изменения, даже если на слух разница не очевидна. То есть физический стресс может работать ниже порога слухового восприятия, но при этом давать измеримые изменения в механизме речи. Для ухо — норма, для машины — флаг.

И это, кстати, объясняет, почему люди обычно недооценивают, насколько сильно их состояние влияет на голос. Мы слышим грубые перепады — хрип, одышку, явную дрожь. А вот микросдвиг в 5–10 Гц по F0 или прибавка пары процентов в шиммере — это уже за пределами нашего слуха.

Физиология

Речь — это поток воздуха, который выдавливают лёгкие, проходит через голосовые складки в гортани и резонирует в полостях рта, носа и глотки. Любое изменение в этой цепочке — изменение дыхания, тонуса мышц, состояния складок — мгновенно отражается в звуке. Поэтому голос фактически работает биомаркером того, как тело в целом справляется с нагрузкой.

Когда вы устаёте или напрягаетесь, происходят сразу несколько вещей. Дыхательная мускулатура работает интенсивнее, объёмы вдоха меняются. У людей с повышенной голосовой утомляемостью, как показала отдельная работа по голосовой нагрузке, фонация начинается на меньших лёгочных объёмах — то есть человек буквально «не добирает» воздуха перед фразой. Это видно в акустике: гласные становятся короче и тише.

Параллельно растёт мышечное напряжение в гортани. Кортикальный тонус идёт вверх, голосовые складки натягиваются, иногда добавляется избыточное сжатие крикотиреоидной мышцы. Всё это поднимает высоту и амплитуду тона — но одновременно ухудшает мелкую регуляцию, отсюда рост джиттера и шиммера.

Есть и гендерные нюансы. У женщин голосовые складки тоньше и нейромышечный контроль более динамичный — поэтому изменения под стрессом у них обычно выражены сильнее. У мужчин складки массивнее, и голос ведёт себя чуть стабильнее. Но направление изменений — у всех одинаковое.

Где машины уже спотыкаются

Современные системы распознавания речи натренированы в основном на «нейтральном» голосе — спокойный человек в тихой комнате, ровное дыхание. Стоит вывести его в реальные условия, и точность падает.

Подумайте, где это критично. Спасатели, кричащие в рацию на бегу. Военные, которые передают координаты под нагрузкой. Пилоты, у которых руки заняты, а реакция на вопрос диспетчера должна быть моментальной. Курьеры и доставщики с голосовыми интерфейсами. Носимая электроника — наушники, умные часы — где люди разговаривают на тренировке. Везде, где речь отклоняется от «нейтрала», точность распознавания проседает, иногда сильно.

Именно поэтому сейчас столько усилий уходит на то, чтобы научить алгоритмы понимать не только что человек сказал, но и в каком состоянии. Если модель знает, что говорящий бежит, она может перенастроить параметры распознавания — учесть более длинные паузы, расширенный диапазон F0, повышенный шиммер.

Голос как биомаркер

Тот же набор признаков работает не только для физической нагрузки. Усталость от недосыпа, эмоциональный стресс, выгорание, тревожность — всё это даёт похожие, хотя и не идентичные акустические следы.

В одной работе, например, показали, что по голосу можно с точностью около 94% определять степень утомления у людей, прошедших процедуру депривации сна — модель сопоставляла речевые признаки с уровнем кортизола в слюне и опросниками. В другой — голос использовался для оценки состояния пилотов после длительных смен в симуляторе. Параметры, которые лучше всего предсказывали изменения в мозговой активности по ЭЭГ, относились как раз к категории «энергия» и «стресс» в голосе.

Эта же логика лежит в основе использования голоса как клинического маркера. Прозодические признаки — высота, паузы, джиттер, шиммер, HNR — связывают с когнитивными изменениями, депрессией, расстройствами вокальных складок, нейродегенеративными процессами. То есть голос меняется, когда человек устаёт или напрягается, и тот же подход позволяет ловить более глубокие изменения здоровья.

Размышления

Если суммировать, почему именно физический стресс — удобный объект для обучения машин: его изменения чёткие, системные и воспроизводимые. В отличие от эмоций, где у разных людей реакция «расползается» по тембру, физическая нагрузка действует через очень понятный канал — дыхание и тонус мышц гортани. Это значит, что обученная на таких данных модель имеет шанс хорошо обобщаться.

Голос меняется, когда вы устаёте или напрягаетесь, и вскоре машины смогут использовать этот сигнал не как помеху, а как полезный канал информации. Они смогут понять, что человек запыхался, что у него повышенная нагрузка, что у него, возможно, проблема со здоровьем — и адаптироваться. Микрофон на ухе превращается из простого приёмника звука в маленький датчик состояния, который читает между строк именно то, чего мы сами в своём голосе не слышим.

Автор статьи

: журналист, специалист здравоохранения, Штык Аркадий Егорович — о враче.

Материалы используемые при написании

Фото: Ерибекян Иван Георгиевич
Фото: Ерибекян Иван Георгиевич

Статью проверил врач

Ерибекян Иван Георгиевич
стоматолог
Опыт 13 лет

Информация в статье носит ознакомительный характер, не является руководством к действию и не заменяет очную консультацию врача. Используя материалы вы соглашаетесь с правилами: [Мединский дисклеймер →] и [Пользовательсткое соглашение →]

Я искусственный интеллект, отвечу на любой вопрос. Спросите что-нибудь…

Другие статьи рубрики «Познавательное»:

📰 Как похудеть с инвалидностью: реальные методы снижения веса при запрете на физические нагрузки
📰 Советы врача детям
📰 Исследования стволовых клеток: омоложение организма и лечение заболеваний
📰 Как рассчитать БЖУ и суточную норму калорий для похудения и набора массы
📰 Что нового известно о лечении болезни Альцгеймера после недавних исследований
📰 Инфразвук объясняет паранормальные явления и появление призраков в домах
📰 Как получить освобождение от физкультуры по состоянию здоровья
📰 Как увеличить продолжительность жизни с помощью сна, питания и упражнений
📰 Что спросить у врача перед приёмом антидепрессантов: 6 важных вопросов
📰 Бег и колени: правда ли что он вреден для суставов и что говорят врачи
Все статьи
Спросите у искусственного интеллекта и получите мгновенный ответ
bot