Кодирование данных и информации. Презентация «Методы кодирования информации


Государственное образовательное учреждение
Среднего профессионального образования
Курганинский аграрно-технологический техникум.


Реферат

Тема: «Современные способы кодирования информации в вычислительной технике».

Подготовила : Аванесян Вероника
Аркадьевна
Учащаяся группы № 6 «А»
Проверил : Ткачев Сергей
Николаевич

Оценка ______________

г. Курганинск
2011-2012 учебный год

Содержание:

1. Введение
2. История кодирования информации
3. Способы кодирования информации
4.Кодирование текстовой информации
5. Кодирование графической информации
6. Кодирование звуковой информации
7. Заключение и выводы
8. Список используемой литературы

Введение:

Кодирование. Основные понятия и определения

Рассмотрим основные понятия, связанные с кодированием информации. Для передачи в канал связи сообщения преобразуются в сигналы. Символы, при помощи которых создаются сообщения, образуют первичный алфавит, при этом каждый символ характеризуется вероятностью его появления в сообщении. Каждому сообщению однозначно соответствует сигнал, представляющий определенную последовательность элементарных дискретных символов, называемых кодовыми комбинациями. Кодирование - это преобразование сообщений в сигнал, т.е. преобразование сообщений в кодовые комбинации. Код - система соответствия между элементами сообщений и кодовыми комбинациями. Кодер - устройство, осуществляющее кодирование. Декодер - устройство, осуществляющее обратную операцию, т.е. преобразование кодовой комбинации в сообщение. Алфавит - множество возможных элементов кода, т.е. элементарных символов (кодовых символов) X = {x i }, где i = 1, 2,..., m. Количество элементов кода - m называется его основанием . Для двоичного кода x i = {0, 1} и m = 2. Конечная последовательность символов данного алфавита называется кодовой комбинацией (кодовым словом). Число элементов в кодовой комбинации - n называется значностью (длиной комбинации). Число различных кодовых комбинаций (N = m n ) называется объемом или мощностью кода.
Если N 0 - число сообщений источника, то N ? N 0 . Множество состояний кода должно покрывать множество состояний объекта. Полный равномерный n - значный код с основанием m содержит N = m n кодовых комбинаций. Такой код называется примитивным.

Классификация кодов

Коды можно классифицировать по различным признакам:
1. По основанию (количеству символов в алфавите):
бинарные (двоичные m=2) и не бинарные (m ? 2).
2. По длине кодовых комбинаций (слов):
равномерные - если все кодовые комбинации имеют одинаковую длину;
неравномерные - если длина кодовой комбинации не постоянна.
3. По способу передачи:
последовательные и параллельные;
блочные - данные сначала помещаются в буфер, а потом передаются в канал и бинарные непрерывные .

4. По помехоустойчивости:
простые (примитивные, полные) - для передачи информации используют все возможные кодовые комбинации (без избыточности);
корректирующие (помехозащищенные) - для передачи сообщений используют не все, а только часть (разрешенных) кодовых комбинаций.
5. В зависимости от назначения и применения условно можно выделить следующие типы кодов:
Внутренние коды - это коды, используемые внутри устройств. Это машинные коды, а также коды, базирующиеся на использовании позиционных систем счисления (двоичный, десятичный, двоично-десятичный, восьмеричный, шестнадцатеричный и др.). Наиболее распространенным кодом в ЭВМ является двоичный код, который позволяет просто реализовать аппаратно устройства для хранения, обработки и передачи данных в двоичном коде. Он обеспечивает высокую надежность устройств и простоту выполнения операций над данными в двоичном коде. Двоичные данные, объединенные в группы по 4, образуют шестнадцатеричный код, который хорошо согласуется с архитектурой ЭВМ, работающей с данными кратными байту (8 бит).
Коды для обмена данными и их передачи по каналам связи . Широкое распространение в ПК получил код ASCII (American Standard Code for Information Interchange). ASCII - это 7-битный код буквенно-цифровых и других символов. Поскольку ЭВМ работают с байтами, то 8-й разряд используется для синхронизации или проверки на четность, или расширения кода. В ЭВМ фирмы IBM используется расширенный двоично-десятичный код для обмена информацией EBCDIC (Extended Binary Coded Decimal Interchange Code).
В каналах связи широко используется телетайпный код МККТТ (международный консультативный комитет по телефонии и телеграфии) и его модификации (МТК и др.).
При кодировании информации для передачи по каналам связи, в том числе внутри аппаратным трактам, используются коды, обеспечивающие максимальную скорость передачи информации, за счет ее сжатия и устранения избыточности (например: коды Хаффмана и Шеннона-Фано), и коды обеспечивающие достоверность передачи данных, за счет введения избыточности в передаваемые сообщения (например: групповые коды, Хэмминга, циклические и их разновидности).
Коды для специальных применений - это коды, предназначенные для решения специальных задач передачи и обработки данных. Примерами таких кодов является циклический код Грея, который широко используется в АЦП угловых и линейных перемещений. Коды Фибоначчи используются для построения быстродействующих и помехоустойчивых АЦП.
Основное внимание в курсе уделено кодам для обмена данными и их передачи по каналам связи.
ЦЕЛИ КОДИРОВАНИЯ:
1) Повышение эффективности передачи данных, за счет достижения максимальной скорости передачи данных.
2) Повышение помехоустойчивости при передаче данных.
В соответствии с этими целями теория кодирования развивается в двух основных направлениях:
1. Теория экономичного (эффективного, оптимального) кодирования занимается поиском кодов, позволяющих в каналах без помех повысить эффективность передачи информации за счет устранения избыточности источника и наилучшего согласования скорости передачи данных с пропускной способностью канала связи.
2. Теория помехоустойчивого кодирования занимается поиском кодов, повышающих достоверность передачи информации в каналах с помехами.

3. Способы представления кодов

В зависимости от применяемых методов кодирования, используют различные математические модели кодов, при этом наиболее часто применяется представление кодов в виде: кодовых матриц; кодовых деревьев; многочленов; геометрических фигур и т.д.

История кодирования информации:

Код - набор условных обозначений для представления информации.

Кодирование - процесс представления информации в виде кода (представление символов одного алфавита символами другого; переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки).

Обратное преобразование называется декодированием.

Для общения друг с другом мы используем код - русский язык.

При разговоре этот код передается звуками, при письме - буквами.

Водитель передает сигнал с помощью гудка или миганием фар.

Вы встречаетесь с кодированием информации при переходе дороги в виде сигналов светофора.

Таким образом, кодирование сводиться к использованию совокупности символов по строго определенным правилам.

Способ кодирования зависит от цели, ради которой оно осуществляется:

    сокращение записи;
    засекречивание (шифровка) информации;
    удобство обработки;
    и т. п.

Существуют три основных способа кодирования текста:
    графический – с помощью специальных рисунков или значков;
    числовой – с помощью чисел;
    символьный – с помощью символов того же алфавита, что и исходный текст.

Наиболее значимым для развития техники оказался способ представления информации с помощью кода, состоящего всего из двух символов: 0 и 1.

Для удобства использования такого алфавита договорились называть любой из его знаков «бит» (от английского « bi nary digi t » -двоичный знак ).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т.п.).

Двоичные числа очень удобно хранить и передавать с помощью электронных устройств.

Например, 1 и 0 могут соответствовать намагниченным и ненамагниченным участкам диска; нулевому и ненулевому напряжению; наличию и отсутствию тока в цепи и т.п.

Поэтому данные в компьютере на физическом уровне хранятся, обрабатываются и передаются именно в двоичном коде.

Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием .

Таким образом, двоичный код является универсальным средством кодирования информации.

Кодирование текстовой информации


Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.

Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно

Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов .

Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111.

Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.

Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице .

В системе ASCII закреплены две таблицы кодирования - базовая и расширенная .

Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д.).

Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.



Тогда слово COMPUTER с помощью ASCII таблицы кодируется следующим образом:


C

O

M

P

U

T

E

R

67

79

77

80

85

84

69

82

01000011

01001111

01001101

01010000

01010101

01010100

01000101

01010010

С распространением современных информационных технологий в мире возникла необходимость кодировать символы алфавитов других языков: японского, корейского, арабского, хинди, а также других специальных символов.

На смену старой системе пришла новая универсальная – UNICODE , в которой один символ кодируется не одним, а двумя байтами.

В настоящее время существует много различных кодовых таблиц (DOS, ISO, WINDOWS, KOI8-R, KOI8-U, UNICODE и др.), поэтому тексты, созданные в одной кодировке, могут не правильно отображаться в другой.

Кодирование графической информации


Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек.

Давайте посмотрим на экран компьютера через увелечительное стекло.

В зависимости от марки и модели техники мы увидим либо множество разноцветных прямоугольничков, либо множество разноцветных кружочков.

И те, и другие группируются по три штуки, причем одного цвета, но разных оттенков.

Они называются ПИКСЕЛЯМИ (от английского PICture"s ELement ).

Пиксели бывают только трех цветов - зеленого, синего и красного.

Другие цвета образовываются при помощи смешения цветов.

Рассмотрим самый простой случай - каждый кусочек пикселя может либо гореть (1), либо не гореть (0).

Тогда мы получаем следующий набор цветов:
Из трех цветов можно получить восемь комбинаций.

Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности, тогда количество различных вариантов их сочетаний, дающих разные краски и оттенки, увеличивается.

Шестнадцатицветная палитра получается при использовании 4-разрядной кодировки пикселя: к трем битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трех цветов одновременно.

Число цветов, воспроизводимых на экране монитора (N ), и число бит, отводимых в видеопамяти на каждый пиксель (I ), связаны формулой:

Величину I называют битовой глубиной или глубиной цвета.

Чем больше битов используется, тем больше оттенков цветов можно получить.

Итак, любое графическое изображение на экране можно закодировать c помощью чисел, сообщив, сколько в каждом пикселе долей красного, сколько - зеленого, а сколько - синего цветов.

Также графическая информация может быть представлена в виде векторного изображения.

Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг.

Положение этих элементарных объектов определяется координатами точек и длиной радиуса.

Для каждой линии указывается ее тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет.

Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.

Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается.

Чем больше разрешающая способность, т.е. чем больше количество строк растра и точек в строке, тем выше качество изображение.

Кодирование звуковой информации


С начала 90-х годов персональные компьютеры получили возможность работать со звуков
и т.д.................

10. Виды кодирования информации.

Код – условное обозначение объекта знаком или группой знаков по определенным правилам. После присвоения кодов создается классификатор – систематизированный свод однородных наименований и их кодовых обозначений. Классификаторы имеют двоякое применение. Первое – для ручного проставления кодов в документах. Во втором случае применения кодов предусматривается хранение всех классификаторов в памяти машины, на машинных носителях. Коды могут быть цифровыми, буквенными, буквенно-цифровыми и состоять из одного или нескольких знаков.

Кодирование информации - представление сведений в стандартной форме. Одни и те же сведения могут быть представлены в нескольких разных формах, и наоборот, разные сведения можно представить в похожей форме. Например, можно использовать словесное описание новой марки автомобиля, а можно представить его вид в нескольких детальных фотографиях. Другой пример - медицинские справки одной формы имеют одинаковый внешний вид, но описывают разные болезни, так как выданы разным людям.

С появлением компьютеров возникла необходимость кодирования всех видов информации, с которой имеет дело и отдельный человек и всё человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров: грандиозные достижения человечества - письменность и арифметика - не что иное, как системы кодирования речи и числовой информации.

Кодирование чисел

Чтобы использовать числа, нужно их как-то называть и записывать, нужна система нумерации. Различные системы счёта и записи чисел тысячелетиями сосуществовали и соревновались между собой, но к концу "докомпьютерной эпохи" особую роль при счёте стало играть число "десять", а самой популярной системой кодирования оказалась позиционная десятичная система. В этой системе значение цифры в числе зависит от её места (позиции) внутри числа. Десятичная система счисления пришла из Индии (не позднее VI века нашей эры). Алфавит этой системы: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} - всего 10 цифр, таким образом, основание системы счисления - 10. Число записывается как комбинация единиц, десятков, сотен, тысяч и так далее. Пример: 1998=8*10 0 + 9*10 1 + 9*10 2 + 1*10 3 .

В Вавилоне, например, использовалась 60-ричная система счисления, алфавит содержал цифры от 1 до 59, числа 0 не было, таблицы умножения были очень громоздкими, поэтому очень скоро она была забыта, но отголоски её былой распространённости можно наблюдать и сейчас - деление часа на 60 минут, деление круга на 360 градусов.

Двоичная система счисления

Двоичная система счисления была придумана математиками и философами ещё до появления компьютеров (XVII - XIX вв.). Позже двоичная система была забыта, и только в 1936 - 1938 годах американский инженер и математик Клод Шеннон нашёл замечательные применения двоичной системы при конструировании электронных схем.

Существуют системы счисления, родственные двоичной. При работе с компьютерами иногда приходится иметь дело с двоичными числами, так как двоичные числа заложены в конструкцию компьютера. Двоичная система удобна для компьютера, но неудобна для человека - слишком длинные числа неудобно записывать и запоминать. На помощь приходят системы счисления, родственные двоичной - восьмеричная и шестнадцатеричная.

Например, в шестнадцатеричной системе для записи чисел предназначены 10 арабских цифр и буквы латинского алфавита {А, В, С, D, Е, F}. Чтобы записать число в этой системе счисления, удобно воспользоваться двоичным представлением числа. Возьмём для примера то же число - 2000 или 11111010000 в двоичной системе. Разобьём его на четвёрки знаков, двигаясь справа налево, в последней четвёрке слева припишем незначащий 0, чтобы количество знаков в триадах было по четыре: 0111 1101 0000. Начнём перевод - числу 0111 в двоичной системе соответствует число 7 в десятичной (7 10 =1*2 0 +1*2 1 +1*2 2), в шестнадцатеричной системе счисления цифра 7 есть; числу 1101 в двоичной системе соответствует число 13 в десятичной (13=1*2 0 + 0*2 1 + 1*2 2 + 1*2 3), в шестнадцатеричной системе этому числу соответствует цифра D, и, наконец, число 0000 - в любой системе счисления 0. Запишем теперь результат:

11111010000 2 = 7D0 16 .

Кодирование координат

Закодировать можно не только числа, но и другую информацию. Например, информацию о том, где находится некоторый объект. Величины, определяющие положение объекта в пространстве, называются координатами. В любой системе координат есть начало отсчёта, единица измерения, масштаб, направление отсчёта, или оси координат. Примеры систем координат - декартовы координаты, полярная система координат, шахматы, географические координаты.

Кодирование текста

Текст закодировать довольно просто. Для этого достаточно как-нибудь перенумеровать все буквы, цифры, знаки препинания и другие, используемые при письме символы. Для хранения одного символа чаще всего используется восьмиразрядная ячейка - один байт, иногда два байта (иероглифы, например). В байт можно записать 256 различных чисел, значит, это позволит закодировать 256 различных символов. Соответствие символов и их кодов задаётся в специальной таблице. Коды записываются в шестнадцатеричной системе, так как для записи числа из восьми разрядов нужно всего две шестнадцатеричных цифры.

Кодирование изображений

Цифровые персональные компьютеры хорошо работают с числами, но не умеют обрабатывать непрерывные величины. Но человеческий глаз можно обмануть: изображение, составленное из большого числа отдельных мелких деталей, воспринимается как непрерывное. Если разбить картинку вертикальными и горизонтальными линиями на маленькие мозаичные квадратики, получим так называемый растр - двумерный массив квадратиков. Сами квадратики - элементы растра или пиксели (picture"s element) - элементы картинки. Цвет каждого пикселя кодируется числом.

Кодирование и декодирование. Для обмена информацией с другими людьми человек использует естественные языки. Наряду с естественными языками были разработаны формальные языки для профессионального применения их в какой-либо сфере. Представление информации с помощью какого-либо языка часто называют кодированием. Код - набор символов (условных обозначений) для представления информации. Код - система условных знаков (символов) для передачи, обработки и хранения информации(со общения). Кодирование - процесс представления информации (сообщения) в виде кода. Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и1. Декодирование- процесс обратного преобразования кода к форме исходной символьной системы, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке. В более широком смысле декодирование - это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение - это декодирование.



Случайные статьи

Вверх