Кохлеарная имплантация. Стратегии кодирования речи

28 Февраля в 0:02 904 0


Аналоговые стратегии

Принцип аналоговой стратегии кодирования речевой информации заключается в передаче акустической информации без селективной фильтрации входного сигнала. Основным критерием является способность системы имплантации активировать несколько электродов одновременно. Набор полосовых фильтров перекрывает весь спектр речи.

Сегмент речи проходит через каждую полосу, связанную с определенным электродом. В зависимости от частот, присутствующих в сегменте речи, соответствующие электроды будут активироваться при определенной амплитуде сигнала.

Основные различия между современными стратегиями кодирования речи могут быть представлены количеством возможных точек стимуляции в карте процессора, максимальным количеством используемых каналов и скоростью стимуляции, подведенной к выбранным каналам.

Главной характеристикой речи является основная частота (F0), обеспечивающая значительную супрасегментальную информацию. Другие свойства связаны с формантами. Для гласных - это первая (F1 и вторая (F2) форманты, а также высокочастотные элементы, способствующие восприятию согласных.

Каждое из этих свойств связано с конкретными частотами: например, основная частота является самой низкой (около 135 Гц для мужского голоса, 235 Гц - для женского и 275 Гц для детского). Первая форманта располагается в диапазоне от 270 до 1000 Гц, а вторая - от 1000 до 3200 Гц. Из этого следует, что перечисленные свойства могут быть подчеркнуты при помощи фильтрации.

Полосовые фильтры сортируют (анализируют) входящие сигналы для определенных частот, после чего они передаются к соответствующим электродам. Максимальное количество каналов, стимулируемых за цикл в системе Nucleus при использовании данной стратегии кодирования, соответствует 4. При этом электроды стимулируются не одновременно.

Стратегия SPEAK (стратегия выделения спектральных пиков)

При использовании данной стратегии кодирования электроды активируются в зависимости от того, какие фильтры получают информацию, имеющую амплитуду большую, чем пороговая амплитуда (может стимулироваться любой из 22 электродов). Это означает, что сигнал в пределах определенной частотной полосы должен иметь интенсивность, достаточную для того, чтобы быть распознанным. Как правило, выбираются от 3 до 10 амплитудных значений с определением соответствующих электродов, которые должны стимулироваться.

Данный принцип определяется как принцип выделения максимального спектрального пика. Он также зависит от порогов и уровней комфорта у конкретного больного, что обусловлено тем, что при увеличении стимула увеличивается и ширина импульса (его длительность). Иными словами, при использовании системы Nucleus количество каналов, которое будет выделено, будет зависеть от интенсивности входного сигнала и заданного выхода на электродах.

Если входной сигнал имеет небольшую амплитуду, меньше частот будет определено в системе фильтрации (меньшее количество пиков, достигающих максимального уровня), а, следовательно, меньшее количество каналов (электродов) будет выбрано для стимуляции.



Другим фактором, оказывающим влияние, является интенсивность. Чем громче должен быть сигнал для восприятия имплантированным больным тихих звуков и восприятия на комфортном уровне (программируемое значение), тем меньшее количество каналов будет стимулироваться. Прежде всего, это имеет место при высоких уровнях стимуляции, так как при этом необходимо использование широких импульсов (цикл стимуляции определяется временем).

При расширении импульсов меньшее количество каналов будет стимулироваться. Дополнительной характеристикой стратегии SPEAK является то, что обычно активируются несколько электродов, расположенных друг за другом. Это происходит потому, что максимальная энергия обеспечивается в области близко расположенных частот. Количество каналов стимуляции при данной стратегии варьирует от 3 до 10 (в среднем 6), а электроды стимулируются неодновременно со средней скоростью 250 Гц.

CIS (непрерывная чередующаяся стимуляция)

Основным принципом данной стратегии является стимуляция всех активных электродов в каждый цикл, но не одновременно. Данная стратегия отличается от SPEAK и стратегии выделения характеристик сигнала тем, что в последних стратегиях электроды (каналы) для стимуляции выбираются из набора активных электродов.

Она отличается от аналоговых стратегий тем, что электроды стимулируются не одновременно. При этом происходит непрерывная стимуляция, не происходит выделение максимумов спектра, а отображается весь спектр. Стратегия ориентирована на выделение временных характеристик звука. Данная стратегия отличается высокими скоростями стимуляции, достигающими 2500 импульсов в с. Максимальное количество каналов за один цикл соответствует 12 при скорости, равной 18000 имп./с (Med-El).

АСЕ

Стратегия АСЕ объединяет стратегии SPEAK и CIS, что значительно расширяет возможности. Данная стратегия кодирования обеспечивает максимально индивидуальный выбор параметров. При этом может стимулироваться любая из 22 точек при выборе до 12 каналов стимуляции при скорости до 1000 имп./с на канал. Данная стратегия обеспечивает возможность оптимизировать объем спектральной информации путем кодирования "по месту", а объем временной информации - путем кодирования скорости. Данный подход обеспечивает передачу информации с минимальными затратами энергии.

Основным принципом данной стратегии кодирования является выбор аудиологом 3 параметров:
1. какая из 22 точек (электродов) должна стимулироваться;
2. сколько каналов (количество электродов стимулируемых при проходе от основания к верхушке) должны стимулироваться и следует ли стимулировать все эти точки динамически или лишь их фиксированные группы;
3. выбор соответствующей скорости стимуляции.

Максимальная скорость стимуляции на каждом электроде, установленная программой, равна 2400 имп./с. Общая же максимальная скорость соответствует 14400 имп./с.

Я.А. Альтман, Г. А. Таварткиладзе
Похожие статьи
  • 24.02.2013 36880 15
    Тональная пороговая аудиометрия

    Тональная пороговая аудиометрия осуществляется при помощи аудиометров, которые производятся многими фирмами и отличаются друг от друга по функциональным возможностям и по возможностям управления. В них предусмотрен набор частот 125, 250, 500, 750, 1000, 1500, 2000, 3000, 4000, 6000, и 8000 Гц (в...

    Аудиология
  • 24.02.2013 24365 7
    Тимпанометрия

    Первые работы, посвященные тимпанометрии, содержали описание отдельных тимпанограмм, характерных для той или иной патологии (Terkildsen, Thomsen, 1959; Brooks, 1968; 1969). Позднее были разработаны классификации тимпанограмм, из которых наибольшее распространение получили взаимно дополняющие...

    Аудиология
  • 20.02.2013 7054 10
    Слуховые вызванные потенциалы. Часть 1

    Исследование этого класса реакций определяется возможностью неинвазивной (т.е. с поверхности черепа) регистрации суммарной электрической активности слуховых центров у человека и животных. В виду малой амллитуды реакций при таком способе регистрации и значительного уровня помех за счет других...

    Аудиология
показать еще
 
Оториноларингология