Содержание
Введение 3
1. Форматы электронных документов: общий обзор 6
1.1. Текстовые форматы 6
1.2. Графические форматы 7
1.3. Форматы баз данных 7
1.4. Форматы электронных таблиц 8
1.5. Видео - и аудиоформаты 8
1.6. Языки разметки (форматы разметки) 8
2. Форматы представления электронных документов свободного программного обеспечения 9
2.1. Феномен свободного программного обеспечения 9
2.2. Открытые стандарты 11
2.3. Форматы документов 12
2.4. Один из проектов по миграции 13
2.5. Стандарты ISO/IEC 26300:2006 (ODF) и ISO/IEC DIS 29500 (OOXML) 14
2.6. OpenOffice.org 15
Заключение 16
Список используемой литературы 20
Приложение. Основные форматы электронных документов 22
Введение
В данной работе рассматривается тема "Форматы представления электронных документов".
Слово "формат" имеет много значений. В области компьютерных технологий под термином "формат" понимается структура информационного объекта. Например, форматом файла называют способ организации элементов информации (битов, байтов) в файле, а формат электронного документа определяет способ расположения и представления данных в электронном документе.
Существует множество различных форматов электронных документов. В целом их можно разделить на "однопрограммные", т. е., контролируемые и поддерживаемые только одним программным разработчиком, и "многопрограммные", которые поддерживаются несколькими разработчиками и могут обрабатываться различными программами.
Цель работы - рассмотреть форматы представления электронных документов.
Объект исследования - форматы представления электронных документов.
Задачи исследования вытекают из поставленной цели:
- дать понятие и общий обзор форматов электронных документов;
- рассмотреть форматы представления электронных документов свободного программного обеспечения.
Формат PDF, созданный фирмой Adobe Systems Inc., весьма популярен при обмене документами и широко используется для документов сети Интернет, потому что он позволяет сохранить оригинальный внешний вид документов и затрудняет внесение изменений в документ. По оценке компании Adobe уже пол миллиарда людей загрузили ее бесплатную программу просмотра PDF-файлов, многие предприятия выбрали данный формат в качестве стандарта для передачи и хранения документов, а немало независимых разработчиков предлагают продукты, поддерживающие PDF, причем некоторые бесплатно.
Модифицированная версия формата, названная PDF-Archive (PDF-A), рассматривается за рубежом в качестве одного из двух основных форматов, которые могут в будущем использоваться для архивного хранения электронных документов. Вторым форматом является XML.
Можно утверждать, что наибольшее распространение в сфере управления в настоящее время получили документы, создаваемые при помощи текстовых процессоров, особенно программы Microsoft Word. Значительное количество управленческих документов создается и в формате электронных таблиц (чаше всего при помощи табличного процессора Microsoft Excel), и в формате презентационных слайдов (подготовленных при помощи системы подготовки презентаций Microsoft PowerPoint). Немало электронных документов порождают такие относительно недавно появившиеся технологии, как электронная почта, видеоконференции, веб-сайты. В перспективе крупными "производителями" электронных документов могут стать многие другие технологии, например геоинформационные системы, операторские центры.
Каждый из форматов электронных документов имеет свои достоинства и недостатки при использовании в документационном обеспечении управления. Например, текстовые форматы (Word Perfect, Microsoft Word, RTF и др.) удобны для проведения контекстного поиска по документам в базе данных, а графические форматы (PDF, TIFF и др.) позволяют получить при сканировании изображение документа со всеми его внешними особенностями, хранить документы в том же виде, что и на бумаге, со всеми подписями и визами.
Формат MS Word весьма удобен при редактировании документа и групповой работе с ним, однако файл MS Word хранит много скрытой информации (прежде всего о сделанных в файле изменениях) и, следовательно, весьма небезопасен с точки зрения утечки служебной информации. В ряде случаев, таких как коммерческое предложение или проект контракта, скрытая информация позволяет установить, каковы были исходные предположения и кто оказал на текст наибольшее влияние.
При групповой подготовке документа анализ правки дает возможность узнать не только фамилии людей, ее сделавших, но и кто какой именно вклад внес в итоговый вариант.
Основной вопрос, возникающий в связи с форматами электронных документов, - это вопрос конвертации и (или) миграции электронных документов. При конвертации изменяется формат электронного документа, а при миграции производится перемещение электронного документа с одной программной платформы или носителя на другой без изменения формата. Однако и при миграции может понадобиться конвертация электронного документа. Например, при перемещении электронного документа из операционной системы Macintoch в операционную систему Microsoft Windows необходима конвертация электронного документа в новый формат (например, RTF или Word 2000).
При этом возможно 3 основных типа потерь, которые необходимо учитывать при хранении электронных документов:
1) потеря данных. При потере данных в определенной степени теряется и содержание документа. Электронный документ становится неполноценным и недостоверным;
2) потеря внешнего вида, структуры электронного документа. Например, при конвертации текстовых документов в формат RTF можно утратить некоторые особенности внешнего вида документов;
3) потеря связей между данными (в электронных таблицах, базах данных) также делает документ неполноценным.
Необходимо учитывать, что копия документа может быть юридически признана таковой только в случае, если она создана проверенным способом и является точной, полноценной и надежной для длительного использования.
Второй вопрос, связанный с форматами и управлением электронными документами, - это вопрос сжатия файлов (компрессии). Преимуществами сжатия файлов являются экономия занимаемого места при хранении, более быстрая и простая передача файлов. Недостатки сжатия файлов заключаются в том, что оно может привести к потере данных. Кроме того, оно вызывает необходимость использования дополнительного программного обеспечения - программ сжатия файлов (WinZip, ZipMagic и др.), которым также присуши проблемы устаревания, многоверсионности, зависимости от платформы.
Возможности использования PDF-Archive формата в электронных архивах ограничены: в частности, формат PDF-A не подходит для архивного хранения аудиовизуальных документов.
Рассмотрим подробнее форматы представления электронных документов.
1. Форматы электронных документов: общий обзор
Перечислим основные форматы электронных документов.
1.1. Текстовые форматы
Текстовые форматы чаше всего создаются при помощи текстовых процессоров. Наиболее распространенными текстовыми форматами являются:
1) однопрограммные форматы Microsoft Word, WordPerfect, которые имеют расширение той программы, в которой создаются;
2) формат RTF, который поддерживается различными программными