Информация >> Публикации сотрудников компании >>Кинцов Ю.Г., Смирнов В.А., Сотов А.В. «Защита переговоров в сетях GSM связи»
«Безопасность сетей и средств связи» №2, 2007

«БЕЗОПАСНОСТЬ СЕТЕЙ И СРЕДСТВ СВЯЗИ»
№2, 2007, стр. 40-42

Введение

Теоретические аспекты защиты речевой информации при передаче ее по каналам связи достаточно хорошо известны и появление подобных статей, как правило, связано с особенностями конкретных реализаций. Сегодня мы рассмотрим некоторые вопросы защиты переговоров в сетях GSM на основе результатов, полученных компанией «Сигнал-КОМ» при разработке программного комплекса Voice Coder Mobile (VCM).

Данная разработка реализована на базе стандартной услуги передачи данных операторов сотовой связи - Circuit Switched Data (CSD) и ориентирована на использование мобильных устройств - коммуникаторов и смартфонов, работающих под управлением ОС Windows Mobile 2003/5.0.

На сегодняшний день нам известно не более 3-х реальных конкурентных продуктов, выполненных по схожей технологии, среди разработчиков которых компании «SecureGSM» (Австралия), «Cryptophone» (Германия) и «CasperTech» (Италия). Формат данной статьи в совокупности с необходимостью обеспечения конфиденциальности некоторых примененных при разработке VCM подходов и решений не позволяют в полной мере удовлетворить любопытство всех разработчиков. Мы это понимаем, но надеемся, что сами проблемы и обозначение путей их решений будут, тем не менее, интересны широкой аудитории.

Основные вопросы, которые задают потребители подобных устройств, кроме их стоимости, в основном касаются уровня защищенности и качества синтезированной речи. Рассмотрим, каким образом эти проблемы решались при проектировании комплекса VCM.

1. Защищенность переговоров

Напомним, что принцип гарантированной защиты телефонных переговоров основан на передаче речевого сигнала по каналу связи в цифровом виде с применением алгоритмов шифрования. Этот принцип, реализуемый на абонентском уровне, позволяет обеспечить защиту информации в канале связи на всем его протяжении.

Традиционно подобные задачи могут решаться на основе криптографических преобразований с симметричными и асимметричными (открытыми) ключами. В первом случае обеспечивается более простая реализация, но естественным образом возникают проблемы с распределением ключей. Во втором случае проблема с распределением ключей решается проще, но усложняется техническая реализация. Немаловажно также помнить, что, проектируя защищенные абонентские системы, необходимо учитывать удобство в части работы с ключевой информацией – желательно, чтобы вся работа происходила незаметно для пользователя и не создавала ему проблем при возможной потере мобильного устройства с хранящимся там секретным ключом.

Исходя из этих требований, в комплексе VCM были реализованы современные криптографические технологии с формированием сеансовых ключей шифрования на базе алгоритма Диффи-Хеллмана на эллиптических кривых в рамках процедуры «рукопожатия» (handshake) при использовании протокола TLS. Для успешной работы процедуры «рукопожатия» в условиях высокого уровня канальных ошибок (вероятность ошибок - 10-3) используется протокол PPP в режиме надежной передачи данных (PPP Reliable Transmission).

Конфиденциальность передаваемых данных обеспечивается симметричным шифрованием (по ГОСТ 28147-89) каждого пакета на уникальном ключе (длиной 256 бит), полученном с помощью сеансового ключа.

Использование подобного решения не только обеспечивает надежную защиту информации и удобство пользователя при работе с ключами, но также и защиту от наиболее распространенной атаки в системах с использованием открытых ключей – man-in-the-middle, суть которой состоит в навязывании взаимодействующим абонентам режима обмена через третью, заинтересованную сторону.

2. Качество речи.

Это, пожалуй, самая важная характеристика для устройств защиты переговоров, поскольку потребители привыкли к определенному качеству мобильной связи и не готовы мириться с его потерей, даже за счет гарантированной безопасности. Говоря о качестве речевого сигнала, необходимо определить основные факторы непосредственно на него влияющие.

К ним относятся:
  • эффективность параметрического сжатия речевого сигнала - определяется требованиями канала связи в части максимальной скорости передачи и зависит от типа используемого кодека. Для оценки качества кодеков используются субъективные критерии, например, MOS (Mean Opinion Score) и/или DRT (Diagnostic Rhyme Test);
  • задержка при передаче сигнала и кратковременные искажения речи – определяются характеристиками канала связи;
  • наличие эха – определяется типом мобильного устройства и применяемыми алгоритмами эхоподавления.

  • Рассмотрим эти составляющие поподробнее.

      2.1 Кодек.

      Современные алгоритмы параметрического сжатия речи работают на скоростях передачи начиная с 600 бит/с, но для высококачественного представления речи требуется скорость порядка 9600 бит/с и выше. Достаточно сказать, что в современной сотовой 3G -телефонии используется Adaptive Multi-Rate (AMR) кодек, работающий на скорости передачи 12,2 кбит/c.
      Этот кодек, по разным источникам, соответствует оценкам 4,1/4,2 по методу MOS, и обеспечивает качество речи эквивалентное ИКМ-64 (MOS - 4,1/4,4).

      В нашем случае использование услуги CSD накладывает чисто теоретические ограничения на скорость передачи речи и позволяет ориентироваться только на кодеки, работающие со скоростями не выше 9600 бит/с. В этом диапазоне, с нашей точки зрения, заслуживают внимание кодеки стандартов MELP (2400 бит/с, MOS – 3,5), G.723.1 /ACELP (5300 бит/с, MOS-3,7), TETRA/ACELP (4567бит/с, MOS – 3,4) и AMR/ACELP (4750бит/с, MOS- 3.847).

      Несмотря на хорошие результаты по MOS, публикуемые для кодека MELP, тем не менее, при наличии канала с пропускной способностью 9600 бит/с, для достижения максимального качества синтезированной речи лучше ориентироваться на кодеки со скоростями передачи от 4800 бит/с и выше.

      Нами были протестированы кодеки на базе алгоритма ACELP, стандартов TETRA и AMR на скоростях передачи около 4800 бит/с. Наилучшие результаты по субъективным оценкам качества синтезированной речи были получены для алгоритма ACELP в стандарте AMR, что соответствует имеющимся оценкам MOS.

      Выбор кодека для построения систем защиты переговоров, безусловно, очень важен, но главная проблема при разработке программного решения для реально выпускаемых мобильных устройств – это обеспечение его работы в реальном времени. При проектировании VCM мы ориентировались на мобильные устройства с процессорами типа ARM9 (400 мГц и выше, 700 MIPS) и/или OMAP 850 (200 мГц, 250 MIPS) и работающие под управлением ОС Windows Mobile 2003/5.0.

      Анализ существующих программных решений кодеков тестируемых стандартов, широко представленных в Интернете, показал, что их фактическая производительность при ориентации на вышеуказанные процессоры требует снижения трудоемкости вычислений более чем на порядок. Этот результат вполне объясним, поскольку при проектировании аппаратуры реального времени указанные кодеки, как правило, реализуются на процессорах типа TMS320C5000™ DSP Platform C54x™DSP, C55x & C64x™DSP, при этом для анализа и синтеза алгоритма требуется суммарная производительность порядка 20 MIPS.

      Опуская подробности, скажем, что задача обеспечения реального времени для кодеков тестируемых стандартов при проектировании комплекса VCM применительно к обозначенным типам мобильных устройств была успешно решена.

      2.2 Задержка в канале и кратковременные искажения речи

      Как уже отмечалось, задержка при распространении сигнала в канале связи заметно влияет на комфортность переговоров: многие не раз с ней сталкивались при разговоре с абонентами из-за рубежа, когда в состав канала передачи данных входят спутниковые вставки. В этом случае задержка может доходить до 2 –х секунд и разговор становится некомфортным. Вообще говоря «незаметная» для абонентов задержка не должна превышать 300 мс в одну сторону. В нашем случае задержка определяется двумя составляющими: собственно мобильным устройством – минимальным временем взаимодействия аудио-драйвера с ядром программы (порядка 150 мс) и задержкой при передаче информации в канале связи.

      Для демонстрации последней, ниже, на рис. 1, приведены экспериментальные графики задержки пакетов (длина 40 байт, передача – каждые 200 мс), полученные для прозрачного (синий) и непрозрачного (красный) режимов работы GSM модема. Измерялось время полного оборота пакета в канале.

      График задержки полного оборота пакетов в канале CSD

      Рис. 1 График задержки полного оборота пакетов в канале CSD

      Из графиков видно, что минимальная задержка при передачи данных в одну сторону практически не бывает меньше чем 700 мс, при этом в непрозрачном режиме она в среднем в полтора раза больше, чем в прозрачном. В обоих режимах наблюдаемая задержка не равномерная – присутствуют значительные выбросы.

      Другой характеристикой канала, влияющей на качество речи, является его эффективная пропускная способность. В ходе наших экспериментов было обнаружено, что средняя пропускная способность канала заметно ниже 9600 бит/с, что может объясняться паузами в передаче данных, связанными с особенностями предоставления услуги CSD. Более того, эта скорость имеет высокую неравномерность, что в свою очередь может приводить к ухудшению качества речи в виде искажений и накопления задержки. Выходом из этой ситуации может служить периодическая «разгрузка» канала за счет исключения из передачи пауз в речи. Данная задача решается путем введения в алгоритм кодека модуля VAD (Voice Activity Detector), выполняющего функции вырезания пауз в речи на передаче.

      2.3 Эхо

      Проблема эха также достаточно хорошо известна и в настоящее время наработано немало методов ее решения. Один из методов основан на использовании эхокомпенсатора, структурная схема которого приведена на рис. 2.

      Структурная схема эхокомпенсатора

      Рис.2 Структурная схема эхокомпенсатора

      Эхокомпенсатор представляет собой адаптивный цифровой фильтр, коэффициенты которого рассчитываются по критерию минимизации среднеквадратичного отклонения между реальным сигналом эха, проникающим различными путями от динамика на микрофон мобильного устройства, и этим же сигналом, но моделируемым с помощью фильтра. Фактически фильтр эхокомпенсатора аппроксимирует передаточную функцию H(jw) канала, по которому эхо-сигнал наводится на микрофон. Понятно, что одним из необходимых условий его работы является четкая временная синхронизация между реальным сигналом эха и его моделью на основе адаптивного фильтра.

      Однако в реальных мобильных устройствах, работающих под управлением OC Windows Mobile 2003/5.0, вышеупомянутое условие по синхронизации не всегда выполняется. Это связано со спецификой взаимодействия ядра программы с вводом/выводом через драйвера и ОС, что приводит к периодической рассинхронизации входного и выходного потоков.

      Кроме этого, во многих мобильных устройствах доступ со стороны разрабатываемых приложений обеспечивается только к дополнительному динамику, расположенному на обратной стороне этих устройств. Уровень сигнала в этих динамиках достаточно высокий, а его регулировка средствами ОС достаточно ограничена, что приводит к значительному уровню эха и повышенным требованиям к эхокомпенсатору.

      Все эти факторы приводят к необходимости разработки дополнительных подходов к синхронизации потоков и понижению уровня эха, а также к рекомендациям по использованию конкретных типов мобильных устройств, пригодных для работы комплекса VCM, что и было сделано в ходе реализации проекта.