1.2. Преобразование сообщения в сигналы
1.2.1. Кодирование сообщений
Процесс передачи информации заключается в том, что сообщения преобразуются в сигналы и по системе связи передаются получателю. Получатель, зная закон соответствия между сообщениями и сигналами, может извлечь содержащуюся в сообщении информацию. Для верного декодирования каждому сигналу должно соответствовать одно определенное сообщение.
Преобразование сообщений в сигналы осуществляется с помощью кодирования и модуляции. Кодирование представляет собой отображение дискретных сообщений последовательностью символов позиционной системы счисления.
Последовательность символов, сопоставляемая одному элементарному сообщению (букве, знаку и т.д.) называется кодовой комбинацией. Систему правил преобразования элементарных сообщений в кодовые комбинации называют кодом. Основание используемой системы счисления называют основанием кода. Как правило, первичные коды задаются в виде таблиц.
При выборе основания системы счисления учитывают простоту, удобство и экономичность реализации цифрового представления информации в системе, ее преобразований и передачи по каналам связи. Наибольшее применение в технике передачи дискретной информации нашли колы с основанием 2, которые называются двоичными или бинарными. Поэтому в дальнейшем во всех случаях, где это не будет оговорено, рассматриваются двоичные коды. Символы двоичных кодов единица (1) и нуль (0) называются единичными элементами. Количество единичных элементов, образующих кодовую комбинацию, называется длиной кодовой комбинации.
Кодирование сообщений производится специальным устройством, которое называется кодером (кодирующим устройством) источника сообщения (датчика информации). В кодере кодовые комбинации представляются в виде определенных состояний накопительных элементов (триггеров, ферритов, механических рычагов, линеек и т.д.). Для передачи сообщения состояния накопительных элементов преобразуются в последовательность элементов дискретного электрического сигнала, как правило, в импульсы тока или напряжения. Каждый символ кодовой комбинации представляется единичным элементом цифрового сигнала. Процесс преобразования элементов кодовой комбинации в последовательность элементов сигнала называется модуляцией. (Ранее применялся и термин манипуляция).
По рекомендациям MKKIT при представлении единичных элементов кодовых комбинаций токовыми и бестоковыми (или положительными и отрицательными) посылками, токовые (положительные) обозначаются "I", бестоковые (отрицательные) - "О". На рис.1.5 показан пример представления кодовой комбинации посылками постоянного тока а) - положительными и отрицательными, б) - токовыми и бестоковыми.
В кодирующем устройстве производится первичное кодирование и первичная модуляция. Термин "первичное" подчеркивает то обстоятельство, что в процессе передачи по каналу связи сигналы, как правило, подвергаются дополнительному кодированию и модуляции.
Коды можно разделить на две большие группы: простые и корректирующие. Корректирующие коды (называют также помехоустойчивые) применяют для повышения верности информации. Простые коды (называют также: первичные, обыкновенные, безызбыточные) используются для первичного преобразования дискретных сообщений в сигналы и получаются на выходе кодера источника сообщения.
Простые код» делят на равномерные и неравномерные.
Равномерными называются такие коды, в которых все кодовые комбинации имеет одинаковую длину, т.е. имеют одинаковое число единичных элементов.
Неравномерными называют такие коды, кодовые комбинации которых могут отличаться одна от другой числом единичных элементов.
Оценка простых кодов производится по скорости передачи, помехоустойчивости и сложности технической реализации.
1.2.2. Равномерные простые коды
Как следует из определения, простые равномерные коды состоят из комбинаций одинаковой длины. Естественно, возникает вопрос:
Хорошо это или плохо?" Для ответа на этот вопрос рассмотрим следующий пример.
Пусть имеется некоторое сообщение, состоящее из М элементов, представляющее собой некоторую последовательность m(m<<M) знаков (например, книга имеет M =100000 элементов, представляющая собой некоторую последовательность из 32 букв, 10 цифр и 11 знаков препинания, т.е. из m = 53 знаков). Как известно, это сообщение несет некоторое количество информации I, равное:
I=log2N
где N - число возможных вариантов последовательностей из M элементов.
Поскольку последовательность из M элементов составлена знаками, каждый из которых ( xi) появляется в последовательности с различными вероятностями рi , то, используя формулу Стерлинга, можно показать, что количество информации в этой последовательности будет:
На один элемент сообщения будет приходиться в среднем количество информации:
Если каждый знак сообщения кодируется n -элементной кодовой комбинацией, состояний из двоичных символов, то каждый из них будет содержать Нэ количества информации
Очевидно, что код следует считать наилучшим с точки зрения скорости передачи тогда, когда Нэ будет максимально возможным.
Из теории информации известно, что один двоичный элемент может содержать максимальное количество информации равное 1-му биту, т.е. всегда Нэ <= I.
Следовательно, величина
может служить мерой, информационной недогрузки каждого двоичного элемента.
Если число знаков, из которых состоит сообщение, m=2n и все знаки равновероятны pi=1/m , то величина R = 0 Действительно.
Таким образом, максимальная скорость передачи равномерного простого кода будет тогда и только тогда, когда выполняются условия
где n - целое число.
На практике, как правило, знаки сообщения неравновероятны, а также не выполняется условие , Поэтому равномерные коды имеют , т.е. скорость их практически всегда ниже максимально возможной. Далее будет показано, что в ряде случаев с помощью неравномерного кода можно получить большую старость передачи. Однако, тот факт, что каждая кодовая комбинация в равномерных кодах имеет одинаковое количество двоичных элементов, позволяет получать простые правила кодирования и декодирования и, соответственно, простую техническую реализация кодирующих и декодирующих устройств.
Кроме того, за счет простых способов определения на приемной стороне начала и конца каждой кодовой комбинации, что является необходимым условием однозначного декодирования, помехоустойчивость равномерных кодов достаточно высокая. Важным фактором является также то, что простые равномерные коды легко преобразуются в корректирующие коды для повышения достоверности информации. Все это привело к тому, что равномерные коды получили широкое применение на практике.
Для расширения возможностей равномерных кодов используют следующие меры. Например, число русских букв, цифр и знаков препинания составляет 53, что требует применения 6-элементных кодовых комбинаций (). Поэтому все множество знаков разбивается на два множества (регистра): буквенный и цифровой, что позволяет использовать 5-элементные кодовые комбинации. Для правильного декодирования вводятся специальные комбинации, указывающие о переходе с одного регистра на другой.
Современные отечественные телеграфные аппараты имеют три регистра: русский, латинский и цифровой.
Увеличение алфавита может быть достигнуто за счет того, что кодируются не только отдельные буквы (цифры), а и целые слова и даже отдельные фразы. Естественно - это вызывает необходимость увеличения числа регистров при использовании того же 5-элементного равномерного кода.
1.2.3. Неравномерные коды
Как отмечалось выше, неравномерными кодами называют такие коды, которые содержат разное число элементов.
Эти коды, как и равномерные коды, с точки зрения скорости передачи информации могут оцениваться величиной информационной недогрузки каждого двоичного символа:
где - средняя длина кодовой комбинации;
- длина комбинации, соответствующей i-му символу сообщения;
- вероятность появления i-го символа в сообщении.
Если более вероятным символам сообщения сопоставить более короткие кодовые комбинации и наоборот, то средняя длина кодовой комбинации будет меньше, т.е. скорость передачи информации таким кодом будет выше.
Такие коды называют оптимальными. Если символы сообщения резко неравновероятны, то, целая код оптимальным, иногда можно увеличить скорость по сравнению с равномерным кодом.
При построении неравномерных кодов необходимо учитывать требование однозначного декодирования сообщения, первым этапом которого является правильное определение начала и конца каждой кодовой комбинации. Этого можно достичь, если между комбинациями ставить специальные разделительные группы или использовать неприводимые коды. Неприводимость кодов заключается в том, что в них из более длинной комбинации нельзя составить более короткие комбинации. В настоящее время разработан целый ряд неприводимых кодов.
Примером неприводимого кода может служить код, состоящий из следующих комбинация:
11, 10, 011, 001, 000, 00001, 000001
Неприводимость этого кода заключается в том, что короткие кодовые комбинация не могут быть началом более длинных кодовых комбинаций и, следовательно, любая двоичная последовательность однозначно разбивается на указанные кодовые комбинации.
Например, последовательность
- 1011100000110000101111101000111 -
однозначно разбивается на комбинации
10, 11, 10, 00001, 10, 0001, 011, 11, 10, 10, 001, 11
Необходимо отметить, что применение оптимальных неравномерных кодов не всегда будет обеспечивать большую скорость передачи по сравнению с равномерным кодом. Предпосылкой получения более высокой скорости передачи путем применения неравномерного кода может служить заметная неравновероятность символов сообщения и хорошая согласованность выбранного неравномерного кода со статистической структурой сообщения.
Пример. Пусть имеется сообщение, состоящее из достаточно большого числа элементов. Каждый элемент представляет собой один из восьми различных символов. Вероятность появления t-го символа определяется из выражения
Определить:
1) во сколько раз изменится скорость передачи информации при передаче указанного сообщения вышерассмотренным неприводимым кодом по сравнению с равномерным кодом;
2) может ли существовать другой код, с помощью которого можно получить более высокую скорость передачи информации при передаче данного сообщения.
Сопоставим комбинации неприводимого кода символам сообщения в соответствии с табл.1.1.
Таблица 1.1
Комбинация |
11 |
10 |
011 |
010 |
001 |
0001 |
00001 |
000001 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
64 |
49 |
36 |
25 |
16 |
9 |
4 |
1 |
|
2 |
2 |
3 |
3 |
3 |
4 |
5 |
6 |
Определим среднюю длину кодовой комбинации неприводимого кода
При использовании равномерного кода число элементов в кодовой комбинации
Следовательно, при применении данного неприводимого кода скорость увеличивается в 3 gl.18 раз по сравнению с применением равномерного кода. 'ч0"
Далее определим количество информации, которую несет один элемент кодовой комбинации неприводимого кода.
Поскольку один двоичный элемент кодовой комбинации может нести I бит информации, то возможно существует другой код или другая процедура кодирования, обеспечивающие большую скорость передачи.
В последнее время широкое применение получил неравномерный неприводимый коц построенный по следующему правилу.
Элементы сообщения записываются в виде последовательности натуральных десятичных чисел, записанных в двоичной форме, начиная с числа 2 (т.е.10):
10, II, 100, 101, 110, III, 10000,...
Полученные комбинации преобразуются в новые комбинации путем добавления в них нулей перед каждым нечетным элементом, начиная с третьего элемента.
Комбинации будут иметь вид
10, Ц, 1000, 1001, 1100, IIOI, 10000 и т.д.
Полученный таким образом коц обладает свойствами:
- каждая комбинация начинается единицей} на нечетных позициях стоят нули;
- каждая комбинация имеет четное число элементов.
Эти свойства делают код неприводимым и обеспечивают простоту декодирования.
1.2.4. Первичные коды.
Вопросами координации стандартных кодов в международном масштабе занимается Международный консультативный комитет по телеграфии и телефонии (МККТТ) и Международная организация стандартов (МОС).
Для телеграфной связи в 1932 году был принят стандартный Международный телеграфный код » 2 (МТК-2). Этот код представляет собой равномерный пятиэлементный код с двумя регистрами "буквы латинские" и "цифры". Для возможности передачи текстов на русском языке МТК - 2 был дополнен третьим регистром "русские буквы" (табл.1.2). Этот код на регистрах "буквы латинские" и "цифру" совпадает с УТК-2, что позволяет использовать его на международных связях.
Код МТК-2 не полностью удовлетворяет ряду требований телеграфной связи. Ограниченность числа комбинаций пятизначного кода не позволяет передавать весьма важные служебные знаки, например: "Понял", "Ждите", квитанция", "Конец адреса" и др.
Поэтому ряд функциональных символов передают с помощью четырехкратного повторения комбинаций стандартного кода. Например, для обозначения начала текста передают В-Q'Cflt , конца телеграммы-++++, конца сообщения - /VNNM и т.д. Однако многобуквенные сочетания можно использовать для передачи только служебных знаков или переключении аппаратуры, но их нельзя использовать для передачи графических печатных символов.
С появлением нового вида электросвязи - передачи данных •возникла потребность введения новых служебных, арифметических, логических и других символов, отсутствующих в MТK-2. Это привело к необходимости создания нового стандартного кода, пригонного как для телеграфии, так и для передачи данные. Был разработан и утвержден в 1966 году МККТТ и МОС новый международный стандартней код МТК-5, который содержит на только строчные, но и прописные буквы, дополнительные знаки препинания, большое число символов управления устройствами связи и печати.
Код обеспечивает:
- обработку и передачу машинной символики в пределах машинного языка "КОБОЛ";
- простоту выделения при декодировании групп символов различного характера: служебных символов, цифр, букв и специальных знаков;
- простой алгоритм работы ЭВМ при обработке цифровой информации;
- упрощение процессов упорядочения информации по цифрам и буквам;
- передачу информации по каналам связи и телеуправления устройствами обработки данных;
- построение клавиатуры аппаратов с расположением клавиш, близким к расположению на клавиатуре пишущей машинки.
Международный код МТК-5 является равномерным семиэлементным однорегистровым кодом и содержит только буквы латинского языка. Поэтому для нашей страны был разработан стандартный коц (ГОСТ 13052-67), который отличается от кода № 5 тем, что он является двухрегистровым: первый регистр соответствует латинскому алфавиту, а второй - русскому.
Указанный код приведен в табл.1,3. Таблица состоит из 16 столбцов и 16 строк. Место пересечения столбов и строки называют позицией. Всего в коде 16 х 16 = 256 позиций, из них 127 принадлежит первому регистру и 127 - второму.
Каждой из позиций соответствует свой символ и своя кодовая комбинация. Первые семь столбцов составляют латинский регистр, последние семь - русский регистр. С левой стороны таблицы записаны первые четыре элемента Э1 Э2 Э3 Э4 кодовой комбинации в виде двоичного числа, указывающего номер строки. Над каждым столбцом записаны три последние элемента Э5 Э6 Э7 кодовой комбинации в виде двоичного числа, указывающего номер столбца в регистре. Символы обоих регистров делятся на служебные» предназначенные для организации процедуры обмена и обработки информации ЭВМ, и графические, которые при необходимости могут быть выведены на печать. Служебные символы располагаются в первых двух столбцах, а графические - в последних пяти. Указанное построение кода позволяет упростить декодирование служебных и графических символов, и создает дополнительные удобства ее использования в системах передачи данных.
При вводе информации в ЭВМ двухрегистровый код целесообразно заменить однорегистровым, путем добавления восьмого элемента, указывающего признак регистра: 0 - первый регистр, I -второй регистр.
В единой системе электронных вычислительных машин (ЕС ЭВМ) для ввода - вывода информации применяют восьмиразрядный код КОИ-8 (табл.1.4). Этот код разработан на основе семиразрядного кода (ГОСТ 13052-67), но имеет несколько иной перечень функциональных символов и иное расположение колонок. Поэтому при сопряжении аппаратуры передачи данных с ЭВМ вводно-выводные устройства должны содержать кодопреобразователи.
Контрольные вопросы
1. Что является содержанием информации при тестовой проверке каналов связи?
2. Изобразите временные диаграммы троичного ЦСД, четверичного ЦСД.
3. Изобразите временные диаграммы ЦСД с двумя значащими позициями и различными единичными интервалами.
4. К чему приведет искажение одной посылки при использовании простых равномерных кодов?
5. Как увеличить возможности простых кодов при передаче часто применяемых сокращений типа СОД, МСД и т.п.?