Статья Автор: Александр Ф. Алейников

1.2.2 Язык – средство кодирования

Естественные и формальные языки

В любом естественном языке есть исключения из правил и есть неоднозначности. Например, одно и то же слово может иметь различный смысл.

Что означает слово «рукав» в следующих предложениях на русском языке?

  • Дельта Волги делится на множество рукавов.
  • Рукав слишком длинный, но его легко укоротить.

Как вы это определили?

Смысл слова часто можно установить только из контекста, т. е. отрывка текста, в котором оно употребляется. Часто, например в научных публикациях, такая ситуация недопустима, потому что смысл текста должен быть понят однозначно. В таких случаях используют языки специального типа, в которых каждое слово и словосочетание имеют чётко определённое единственное значение и нет никаких исключений.

Формальный язык — это язык, в котором однозначно определяется значение каждого слова, а также правила построения предложений и придания им смысла. 

Вот некоторые примеры формальных языков:

  • математические формулы: S = v • t;
  • правила записи чисел: 12345;
  • нотная запись: 
  • язык записи шахматных партий: 1. е2-е4 е7-е5...

Все формальные языки — искусственные, они созданы людьми. В таблице 2.1 сравниваются естественные и формальные
языки.

Естественные языки Формальные языки
Сформировались в результате развития общества Созданы людьми специально
Используются для общения в быту Используются в специальных областях знаний
Часто встречаются слова с неточным и неясным содержанием Нет слов с неточным и неясным содержанием
Значения отдельных слов и предложений зависят не только от них самих, но и от их окружения (контекста) Значения слов и предложений не зависят от контекста
Встречаются синонимы (разные слова имеют одинаковый смысл) Как правило, синонимов нет
Встречаются омонимы (одно слово может иметь несколько значений) Омонимов нет
Нет строгих правил образования предложений Правила образования предложений строго определены
Для многих правил существуют исключения

Нет исключений из правил

 
Сообщения и их количество

С точки зрения теории информации, сообщение — это любой набор знаков некоторого алфавита. Пусть мы хотим отправлять различные сообщения одинаковой длины, используя какой-то алфавит. Конечно, чем короче будет длина сообщений, тем быстрее можно будет их передать. Но вместе с тем если сообщения будут слишком короткими, то количество различных сообщений может оказаться недостаточным. Например, из двух двоичных цифр можно составить только четыре разных сообщения: 00, 01, 10 и 11 — больше, как ни комбинируй, не получится.

Для алфавита @#$% в сообщении из двух знаков первый знак можно выбрать четырьмя способами, и для каждого из них есть 4 варианта выбора второго знака. Поэтому сообщений, состоящих из двух знаков, будет 42 = 16

Для алфавита из четырёх знаков определите:
а) количество сообщений из двух знаков;
б) количество сообщений из трёх знаков;
в) количество сообщений из четырёх знаков;
г) количество сообщений из L знаков.

Для алфавита из М знаков определите:
а) количество сообщений из двух знаков;
б) количество сообщений из трёх знаков;
в) количество сообщений из четырёх знаков;
г) количество сообщений из L знаков.

Если алфавит языка состоит из М знаков (имеет мощность М), количество различных сообщений длиной L знаков вычисляется как N = МL.

Для двоичного алфавита (его мощность равна М = 2), получается: N = 2L.

Если длина сообщений может меняться (может быть равна L1, L2, ..., LK то для вычисления общего количества различных сообщений нужно сложить количества сообщений для каждой возможной длины: N = N1 + N2 + ... + NK.

 

Печать