Главные вкладки
Дистанционное обучение 2025-2026
Лекция для групп 112 и 113(16.01.26)
Скачать:
| Вложение | Размер |
|---|---|
| 2.24 МБ |
Предварительный просмотр:
Подписи к слайдам:
КЛЮЧЕВЫЕ СЛОВА ✦ измерение информации ✦ содержательный подход ✦ алфавитный подход ✦ кодовая таблица
ПОДХОДЫ К ИЗМЕРЕНИЮ ИНФОРМАЦИИ Теория информации Кибернетика Семиотика ИНФОРМАЦИЯ И ЕЕ СВОЙСТВА Теория массовой коммуникации Информатика математическая теория систем передачи информации наука о знаках и знаковых системах изучение процессов сбора, преобразования, хранения, защиты, поиска и передачи всех видов информации и средств их автоматизированной обработки исследование СМИ и их влияния на общество наука о закономерностях процессов управления и передачи информации в машинах, живых организмах и обществе
СОДЕРЖАТЕЛЬНЫЙ ПОДХОД Информация – это снятая неопределенность. Величина неопределённости некоторого события – это количество возможных результатов данного события. Шеннон (1916-2001) – инженер и основателем математик . теории Клод Элвуд американский Является информации, современных нашедшей применение в высокотехнологических системах связи . предложил В 1948 году слово « бит » для использовать обозначения наименьшей единицы информации .
СОДЕРЖАТЕЛЬНЫЙ ПОДХОД Сообщение, уменьшающее неопределённость знания о результате какого - либо события в 2 раза, несёт 1 бит информации. Такой подход к измерению информации называют содержательным .
ЗАДАЧА 1 В книжном шкафу восемь полок . Книга может быть поставлена на любую из них . Сколько бит информации несёт сообщение о том, что книга поставлена на третью полку? Книга поставлена на полку не выше четвертой 1 бит информации Книга поставлена на полку выше второй 1 (второй) бит информации Книга поставлена на третью полку Получен третий бит информации
ЗАДАЧА 2 метод половинного деления 0 : 0 0 : 1 0 : 2 0 : 3 1 : 0 1 : 1 1 : 2 1 : 3 2 : 0 2 : 1 2 : 2 2 : 3 3 : 0 3 : 1 3 : 2 3 : 2 О результатах футбольного матча между клубами «Спартак» и «Динамо» известно, что больше трёх мячей никто не забил. Всего возможных вариантов счёта матча — 16: «Спартак» «Динамо» Нам удалось выяснить счёт матча, задав четыре вопроса, ответ на каждый из которых уменьшал н « « « е С С С о п п п п р а а е а р р д р т е т т л а ё а к а н к » н к » о » п с з р т п а ь о р б п р о е у и з п с л у т у л о б с ь и т т д о а л л и т и а б ь н л о в ш м л д о е ь в я д а ш ч о и р ? е д н а з н о м а о д , я г н т . ч о о е ? г . м о н я ё м с ч я 1 а ч ? б а и ? т « и « н Н Д Д ф А Е А о » Т р » м » ации. Сообщение о счёте матча несёт четыре бита информации.
Количество информации i , содержащееся в сообщении об одном из N равновероятных результатов некоторого события, определяется из формулы 2 i = N . При N , равном целой степени двойки (2, 4, 8, 16, 32 и т. д.), это уравнение легко решается в уме При других значениях N будем считать, что i = n , где n — минимально возможное значение, при котором 2 n > N .
ЗАДАЧА 3 Петя и Вася заинтересовались игрой «Крестики - нолики» на поле размером n × n . Количество информации, полученное вторым игроком после первого хода первого игрока, составляет 6 бит . Требуется выяснить максимальные размеры поля, на котором играют Петя и Вася . Решение: i = 6 n – ? Ответ: 8 × 8. 2 i = N n × n = N 2 6 = 64 64 = 8 × 8
Андрей Николаевич Колмогоров (1903-1987) Один из крупнейших математиков ХХ века . Им получены основополагающие результаты в математической теории сложности алгоритмов, информации, теории множеств логике, теории и ряде других областей математики и её приложений . Алфавитный подход последовательность Информация – символов (букв, цифр, кодов точек изображения) некоторого алфавита .
АЛФАВИТНЫЙ ПОДХОД Согласно Колмогорову, количество информации, содержащейся в последовательности символов, определяется минимально возможным количеством двоичных знаков, необходимых для кодирования этой последовательности, безотносительно к содержанию представленного ею сообщения . Данный подход к определению количества информации называют алфавитным . Информационным объёмом сообщения называется количество двоичных символов, которое используется для кодирования этого сообщения . В двоичном коде один двоичный разряд несёт 1 бит информации .
КОДИРОВАНИЕ Равномерный код А 192 11000000 Б 193 11000001 В 194 11000010 Г 195 11000011 Е 197 11000101 Неравномерный код А Б В Г Е Фрагмент кодовой таблицы кода Бодо
ПРИМЕР 1 Слово WORD, закодированное с помощью кода Бодо, будет выглядеть так: Информационный объём такого сообщения равен 20 бит; таково количество двоичных символов, которое используется для кодирования этого сообщения.
ПРИМЕР 2 Для двоичного представления текстов в компьютере можно использовать равномерный восьмиразрядный код . С его помощью можно закодировать алфавит из 256 символов (28 = 256). Слово WORD, закодированное с помощью таблицы ASCII: Информационный объём такого сообщения равен 32 бит.
АЛФАВИТНЫЙ ПОДХОД Алгоритм вычисления информационного объёма сообщения : определить N – мощность используемого алфавита определить i – информационный вес символа алфавита в битах (2 i = N) вычислить информационный объём сообщения I ( I = i*K)
ЗАДАЧА 4 Для регистрации на некотором сайте пользователю надо придумать пароль, состоящий из 10 символов . В качестве символов можно использовать десятичные цифры и шесть первых букв латинского алфавита, причём буквы используются только заглавные . Пароли кодируются посимвольно . Все символы кодируются одинаковым и минимально возможным количеством бит . Для хранения сведений о каждом пользователе в системе отведено одинаковое и минимально возможное целое число байт . Необходимо выяснить, какой объём памяти потребуется для хранения 100 паролей. Решение: N = 10 + 6 =16 K = 10 n – ? Ответ: 500 байт. I 100 = 100 ∙ I I = K ∙ I N = 2 i 16 = 2 i , i = 4 (бит на символ) I = 10 ∙ 4 = 40 (бит) = 5 (байт) I 100 = 100 ∙ 5 = 500 (байт)
ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ 1 Кбайт 1 Мбайт 1 Гбайт 1 Тбайт 1 Пбайт (килобайт) = 2 10 байт (мегабайт) = 2 10 Кбайт = 2 20 байт (гигабайт) = 2 10 Мбайт = 2 20 Кбайт = 2 30 байт (терабайт) = 2 10 Гбайт = 2 20 Мбайт = 2 30 Кбайт = 2 40 байт (петабайт) = 2 10 Тбайт = 2 20 Гбайт = 2 30 Мбайт = 2 40 Кбайт = 2 50 байт
ЗАДАЧА 5 Объём сообщения, состоящего из 8192 символов, равен 16 Кбайт . Какова максимальная мощность алфавита, использованного при передаче сообщения? Решение: I = 16 Кбайт = =16 ∙ 2 13 бит K = 8192 символа N – ? Ответ: максимальная мощность алфавита – 65 536 символов. I = K ∙ i, I = I/K N = 2 i i = 16 ∙ 2 13 /8192 = 16 (бит) N = 2 16 = 65 536 (символов)
САМОЕ ГЛАВНОЕ Информация (по Шеннону) — это снятая неопределённость. Величина неопределённости некоторого события — это количество возможных результатов (исходов) данного события. Сообщение, уменьшающее неопределённость знания о результате какого - либо события в 2 раза, несёт 1 бит информации. Количество информации i , содержащееся в сообщении об одном из N равновероятных результатов некоторого события, определяется из формулы 2 i = N . Такой подход к измерению информации называют содержательным . Всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. Согласно Колмогорову, количество информации , содержащееся в последовательности символов, определяется минимально возможным количеством двоичных знаков, необходимых для кодирования этой последовательности, безотносительно к содержанию представленного ею сообщения. Информационным объёмом сообщения называется количество двоичных символов, которое используется для кодирования этого сообщения. В двоичном коде один двоичный разряд несёт 1 бит информации. Такой подход к измерению информации называют алфавитным . При алфавитном подходе информационный объём сообщения I, состоящего из K символов, вычисляется по формуле I = K · i , где i — информационный вес символа в битах, связанный с мощностью используемого алфавита N соотношением 2 i = N .
САМОЕ ГЛАВНОЕ Единицы измерения информации: 1 байт = 8 бит 1 Кбайт = 2 10 байт 1 Мбайт = 2 10 Кбайт = 2 20 байт 1 Гбайт = 2 10 Мбайт = 2 20 Кбайт = 2 30 байт 1 Тбайт = 2 10 Гбайт = 2 20 Мбайт = 2 30 Кбайт = 2 40 байт 1 Пбайт = 2 10 Тбайт = 2 20 Гбайт = 2 30 Мбайт = 2 40 Кбайт = 2 50 байт
Что такое неопределённость знания о результате какого - либо события? Приведите пример. ВОПРОСЫ И ЗАДАНИЯ
В чём состоит суть содержательного подхода к определению количества информации? Что такое бит с точки зрения содержательного подхода? ВОПРОСЫ И ЗАДАНИЯ
Паролем для приложения служит трёхзначное число. Возможные варианты пароля: Ответ на какой вопрос содержит 1 бит информации? Это число может быть записано в двоичной системе счисления? Это число может быть записано в четверичной системе счисления? Это число может быть записано в восьмеричной системе счисления? Это число может быть записано в десятичной системе счисления? Это число может быть записано в шестнадцатеричной системе счисления? ВОПРОСЫ И ЗАДАНИЯ
При угадывании целого числа в некотором диапазоне было получено 5 бит информации . Каковы наибольшее и наименьшее числа этого диапазона? ВОПРОСЫ И ЗАДАНИЯ
Какое максимальное количество вопросов достаточно задать вашему собеседнику, чтобы точно определить день и месяц его рождения? ВОПРОСЫ И ЗАДАНИЯ
В чём состоит суть алфавитного подхода к измерению информации? Что такое бит с точки зрения алфавитного подхода? ВОПРОСЫ И ЗАДАНИЯ
Закодируйте фразу ALL IN GOOD TIME кодом Бодо и восьмиразрядным компьютерным кодом . Сравните полученные информационные объёмы закодированного текста . ВОПРОСЫ И ЗАДАНИЯ
измерения объёма Какие единицы используются для информации, хранящейся на компьютере? ВОПРОСЫ И ЗАДАНИЯ
символа, равен 11 Объём сообщения, содержащего 11264 Кбайт . Определите максимальную мощность алфавита, который мог быть использован для кодирования этого сообщения . Какова минимальная мощность алфавита, использование которого привело бы к такому же информационному объёму закодированного сообщения? ВОПРОСЫ И ЗАДАНИЯ
В школе 750 учащихся, коды учащихся записаны в школьной информационной системе с помощью одинакового минимально возможного количества бит . Каков информационный объём в байтах сообщения о кодах 180 учащихся начальных классов? ВОПРОСЫ И ЗАДАНИЯ
В школьной базе данных каждый ученик получил идентификатор, состоящий ровно из 6 символов . В качестве символов используются все заглавные буквы русского алфавита, кроме Ё, Ы, Ъ и Ь, а также все десятичные цифры за исключением цифры 0. Каждый такой идентификатор в информационной системе записывается минимально возможным и одинаковым целым количеством байт (при этом используют посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством бит) . Определите объём памяти, необходимый для хранения в этой системе 180 идентификаторов учащихся старших классов . Ответ выразите в килобайтах . ВОПРОСЫ И ЗАДАНИЯ
В ходе телевизионного шоу проводится СМС - голосование : каждый телезритель отдаёт свой голос за одного из 12 артистов — участников шоу, отправляя сообщение с его номером . Голос каждого телезрителя, отданный за того или иного участника, кодируется одинаковым и минимально возможным количеством бит и сохраняется для подведения итогов . За время телевизионного шоу в голосовании приняли участие 163 840 зрителей . Определите объём сохранённой информации о голосовании и выразите его в килобайтах . ВОПРОСЫ И ЗАДАНИЯ
При регистрации в компьютерной системе каждому пользователю выдаётся пароль, состоящий из 6 символов и содержащий только символы из шестибуквенного набора А, В, С, D, E, F. Для хранения сведений о каждом пользователе отведено одинаковое и минимально возможное целое число байт . При этом используют посимвольное кодирование паролей и все символы кодируются одинаковым и минимально возможным количеством бит . Кроме собственно пароля, для каждого пользователя в системе хранятся дополнительные сведения, занимающие 15 байт . Определите объём памяти в байтах, необходимый для хранения сведений о 120 пользователях . ВОПРОСЫ И ЗАДАНИЯ
Каждый сотрудник предприятия получает электронный пропуск, на котором записаны личный код сотрудника, номер подразделения и дополнительная информация . Личный код состоит из 10 символов, каждый из которых может быть одной из 20 разрешённых латинских букв (6 букв не используется для записи кодов) или одной из цифр от 1 до 9 (ноль не используется) . Для записи кода на пропуске отведено минимально возможное целое число байт, при этом используют посимвольное кодирование, все символы кодируют одинаковым минимально возможным количеством бит . Номер подразделения — целое число от 1 до 100, он записан как двоичное число и занимает минимально возможное целое число байт . Всего на пропуске хранится 16 байт данных . Сколько байт выделено для хранения дополнительных сведений об одном сотруднике? ВОПРОСЫ И ЗАДАНИЯ