Естественные и формальные языки
В любом естественном языке есть исключения из правил и есть неоднозначности. Например, одно и то же слово может иметь различный смысл.
Что означает слово «рукав» в следующих предложениях на русском языке?
- Дельта Волги делится на множество рукавов.
- Рукав слишком длинный, но его легко укоротить.
Как вы это определили?
Смысл слова часто можно установить только из контекста, т. е. отрывка текста, в котором оно употребляется. Часто, например в научных публикациях, такая ситуация недопустима, потому что смысл текста должен быть понят однозначно. В таких случаях используют языки специального типа, в которых каждое слово и словосочетание имеют чётко определённое единственное значение и нет никаких исключений.
Формальный язык — это язык, в котором однозначно определяется значение каждого слова, а также правила построения предложений и придания им смысла.
Вот некоторые примеры формальных языков:
- математические формулы: S = v • t;
- правила записи чисел: 12345;
- нотная запись:

- язык записи шахматных партий: 1. е2-е4 е7-е5...
Все формальные языки — искусственные, они созданы людьми. В таблице 2.1 сравниваются естественные и формальные
языки.
Естественные языки |
Формальные языки |
Сформировались в результате развития общества |
Созданы людьми специально |
Используются для общения в быту |
Используются в специальных областях знаний |
Часто встречаются слова с неточным и неясным содержанием |
Нет слов с неточным и неясным содержанием |
Значения отдельных слов и предложений зависят не только от них самих, но и от их окружения (контекста) |
Значения слов и предложений не зависят от контекста |
Встречаются синонимы (разные слова имеют одинаковый смысл) |
Как правило, синонимов нет |
Встречаются омонимы (одно слово может иметь несколько значений) |
Омонимов нет |
Нет строгих правил образования предложений |
Правила образования предложений строго определены |
Для многих правил существуют исключения |
Нет исключений из правил
|
Сообщения и их количество
С точки зрения теории информации, сообщение — это любой набор знаков некоторого алфавита. Пусть мы хотим отправлять различные сообщения одинаковой длины, используя какой-то алфавит. Конечно, чем короче будет длина сообщений, тем быстрее можно будет их передать. Но вместе с тем если сообщения будут слишком короткими, то количество различных сообщений может оказаться недостаточным. Например, из двух двоичных цифр можно составить только четыре разных сообщения: 00, 01, 10 и 11 — больше, как ни комбинируй, не получится.
Для алфавита @#$% в сообщении из двух знаков первый знак можно выбрать четырьмя способами, и для каждого из них есть 4 варианта выбора второго знака. Поэтому сообщений, состоящих из двух знаков, будет 42 = 16
Для алфавита из четырёх знаков определите:
а) количество сообщений из двух знаков;
б) количество сообщений из трёх знаков;
в) количество сообщений из четырёх знаков;
г) количество сообщений из L знаков.
Для алфавита из М знаков определите:
а) количество сообщений из двух знаков;
б) количество сообщений из трёх знаков;
в) количество сообщений из четырёх знаков;
г) количество сообщений из L знаков.
Если алфавит языка состоит из М знаков (имеет мощность М), количество различных сообщений длиной L знаков вычисляется как N = МL.
Для двоичного алфавита (его мощность равна М = 2), получается: N = 2L.
Если длина сообщений может меняться (может быть равна L1, L2, ..., LK то для вычисления общего количества различных сообщений нужно сложить количества сообщений для каждой возможной длины: N = N1 + N2 + ... + NK.

