sonyps4.ru

Выглядит файл пдф. Типы PDF-документов

Межкорпоративный документооборот (внешний ЭДО)

Чем отличается формат PDF от PDF/A, и какой формат лучше использовать для сохранения отсканированных образов документов?

Ришат Мухаметшин 16 мая 2013 г. 16:10

PDF (“portable document format”) - это универсальный формат электронных документов, которому, кстати, скоро исполнится 20 лет. Он создан по инициативе компании Adobe, и исходное его предназначение - электронное представление печатных материалов. Отсюда следует задача данного формата, связанная с хранением информации о цветовой схеме и расположении элементов, обеспечить идентичный вывод на разных мониторах и принтерах.

За время своего существования формат PDF значительно прибавил в возможностях. В первой же редакции формата появилась возможность вставлять в текст документа гиперссылки, шифровать документ с паролем и тем самым защищать его от модификации. В версии PDF 1.4 появилась возможность поверх изображения наносить текстовый слой, в том числе невидимый, давая пользователю возможность, видя “картинку”, тем не менее, копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар “ключ-значение”, каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом целиком. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.

PDF/A - это подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат является стандартом ISO и предназначен для долгосрочного хранения электронных документов. Обеспечение длительного срока хранения достигается посредством внедрения в содержимое электронного документа в формате PDF/A всей информации, необходимой для его отображения. Такой информацией, в частности, являются шрифты - те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A не меньше, а вероятно даже больше по размеру, чем документ с аналогичным содержимым, сохранённый в формате PDF.

Считается, что документ, хранимый в формате PDF/A, ввиду полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент, можно будет открыть в любой операционной системе через какое угодно длительное время с помощью приложения, поддерживающего соответствующий формат. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка со стороны разработчиков ПО в долгосрочной перспективе оправдана, а использование целесообразно по сравнению с другими доступными форматами хранения, которые могут измениться в любой момент времени (вспомним недавнюю историю с отказом от поддержки документов Word старого образца до версии 2003 в Google Drive - старт умерщвлению формата Word 97–2003 дан).

При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано. Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. Необходима верификация на соответствие требованиям формата для каждого конкретного документа, и если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).

Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов, тогда как PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.

Теперь необходимо определиться с тем, что такое отсканированный образ документов. В подавляющем большинстве случаев это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр - изображение, текст на котором непонятен компьютеру, а понятен только человеку. В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т.д.).

Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда держится выше нулевой отметки. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.

На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что одинаково пригодны оба формата, поскольку для каждого конкретного документа не будут использованы возможности формата такие, которые не поддерживаются стандартом PDF/A. Последний допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации. А необходимостью внедрения шрифтов в каждый документ можно пренебречь: поскольку речь идёт об образах, и текста нет, соответственно, нет и шрифтов, и добавочный вес в этом отношении будет мал.

(4,10 - оценили 10 чел.)

IT-сообщество постоянно пытается стандартизировать и унифицировать каждую составляющую цифрового мира. Именно поэтому так много существует различных стандартов и спецификаций.

Так же дело обстоит и с текстовым форматом. Иногда при открытии документа на ином устройстве, чем на котором был создан файл, документ может выглядеть совершенно по-иному. Чтобы этого избежать, был разработан единый формат, понятный каждому устройству, – .

Именно поэтому вся техническая документация (руководства пользователя и инструкции) представлена в формате pdf. Если вы являетесь пользователем сервиса «Гос Услуги», то, наверное, обратили внимание, что все бланки заявлений в электронной форме также представлены в формате pdf.

Примеров можно приводить много: кстати, свою книгу «, которую вы, наверное, уже скачали, я также выложил в сеть в формате pdf.

PDF – portable document format – был разработан компанией Adobe. С течением времени формат стал очень популярным.

С помощью каких программ можно его открыть и создать, я еще расскажу ниже. Но акцентирую ваше внимание на интересном факте: в документы pdf уже можно встраивать не только текст и графику, но и мультимедийные файлы: музыку и видео.

Неоспоримые преимущества формата
  • Совместимость . На каждом новом компьютере, как правило, уже предустановленна программа для просмотра файлов pdf. Следует отметить, что любой просмотрщик отображает файл pdf именно с теми шрифтами, с которыми он был создан. Даже если данные шрифты не установлены на ПК. Таким образом, пользователь может просматривать и распечатывать документ pdf на любом ПК именно в том виде, в котором документ был создан.
  • Универсальность . Сегодня разработано большое количество бесплатных программ, позволяющих открывать документ pdf на ПК с операционной системой Windows, MacOS, Linux, а также на различных мобильных платформах.
  • Компактность . Как правило, файлы pdf имеют небольшой размер, и поэтому они очень удобны для отправки их по почте в качестве вложений или как вариант хранения документов на жестком диске.
  • Безопасность . Разработчики формата предусмотрели достаточно средств для защиты документа. Так, файл в формате pdf можно защитить паролем, и никто, кроме владельца пароля не сможет даже открыть документ. Можно, например, разрешить просмотр документа, но запретить его редактирование, копирование контента (содержимого) и даже распечатку.
Варианты создания pdf файлов?

1. Использование программ для создания pdf. Специальное программное обеспечение наделено большим набором функций, однако, как правило, большинство из этих программ платные.

Кроме широко распространенного «тяжелого» пакета Adobe Acrobat, есть хорошие бесплатные аналоги. Большинство из них представляют собой виртуальные принтеры, которые выводят файл на печать не на принтер, а в создаваемый pdf файл.

2. Путем сохранения документа в pdf формате. Такой функцией обладают наиболее известные офисные пакеты: OpenOffice и MS Office 2007. Просто при сохранении файла необходимо выбрать пункт «Сохранить как…” –> “PDF или XPS».

Если у вас установлена более ранняя версия MS Office, то можно с сайта Microsoft бесплатно скачать надстройку «Сохранение в формате XPS или PDF».

3. Путем использования интернет сервиса. Я вам порекомендую два сайта: и WebPDF . Единственный совет: не используйте интернет сервисы для преобразования файлов с конфиденциальной или личной информацией.

Что представляют собой формы PDF?

Документы pdf обладают еще одним весьма полезным свойством: в них можно создавать формы, анкеты, опросники. Т.е. вы можете создать конкретные текстовые поля, подлежащие изменению.

Таким образом, пользователю достаточно открыть документ в любом просмотрщике, заполнить необходимые поля и отправить файл адресату. Например, таким образом созданы бланки заявлений на сайте ГосУслуги.

Насколько хорошо защищены pdf документы?

Как известно, 100% защитой не обладает ни один алгоритм, конструкция pdf не исключение. Защищенный паролем файл можно открыть с помощью программы «PDF Recover». После чего файлом можно пользоваться без ограничений.

Основные программы для работы с pdf

1. Для создания и редактирования pdf файлов

2. Для просмотра pdf файлов

3. Pdf-утилиты

Свойства PDF-документа и действия, которые можно с ним выполнять, зависят от программы, в которой он был создан. Поэтому в некоторых PDF-документах всегда поддерживается копирование и поиск по тексту, а иногда это возможно только в программе ABBYY FineReader.

Можно выделить следующие типы PDF-документов:

PDF (только изображение)

PDF-документ такого типа получается при сканировании бумажных документов без распознавания текста. Каждая страница такого документа является изображением и не содержит текстового слоя. В документах PDF (только изображение) невозможны поиск, копирование и редактирование текста вне зависимости от программы для просмотра PDF-документов.

PDF-документы с возможностью поиска

Такие документы обычно содержат видимое изображение страницы и невидимый текстовый слой под ним. Документ такого типа чаще всего является отсканированной копией бумажного документа, к которому применили распознавание, и распознанный текст был записан под страницы.

Программа FineReader при открытии документов такого типа определяет, содержит ли данный PDF текстовый слой, и может его использовать при работе с PDF-документом. Подробнее см. "Режимы распознавания PDF ". Наличие текстового слоя обеспечивает возможность поиска и копирования текста вне зависимости от программы для просмотра PDF-документов. Редактирование текста в PDF такого типа доступно в FineReader, но может не поддерживаться в других редакторах.

С помощью FineReader документы такого типа можно получить:

  1. При добавлении текстового слоя к PDF (только изображение).
  2. При конвертации PDF или любых файлов изображений. Для этого выберите > Текст под изображением страницы . Подробнее см. настройки формата PDF .

PDF-документы, созданные в других приложениях

Документ такого типа получается при создании PDF из редактируемых форматов (например, из Microsoft Word или других офисных приложений) и является одним из видов PDF-документа с возможностью поиска. Он содержит текстовый слой и иллюстрации. В таком документе возможны поиск и копирование текста вне зависимости от программы для просмотра PDF-документов, а текст и картинки доступны для редактирования. Для выполнения этих действий у пользователя должны быть соответствующие права в данном документе.

PDF-документ такого типа можно получить:

  1. При сохранении исходного документа в формате PDF непосредственно в программе, в которой он был создан.
  2. При конвертации PDF-документа другого типа или файла другого формата в программе FineReader при выборе в настройках сохранения Настройки PDF с возможностью поиска >Только текст и картинки . Подробнее см. настройки формата PDF .

В результате форматирование документа может отличаться от исходного, но при редактировании такого документа можно получить более качественные результаты.

Сведения о документе

Во вкладке Сведения о документе , пользователь может заполнить следующие поля: название, тема, автор, приложение, производитель, а также добавить некоторые ключевые слова, соответствующие содержанию документа.

Безопасность

Ограничить доступ к PDF документу можно с помощью пароля/сертификата и ограничений на определенные функции, например на печать и редактирование. Однако нельзя запретить сохранение копий PDF. При этом копии будут иметь те же ограничения, что и оригинальный PDF файл.

Для установки пароля и внесения изменений в пункты Разрешения нажмите кнопку Изменить . На экране появится дополнительное окно, в котором вы сможете задать пароли для документа.

Для шифрования PDF документов возможно использование паролей двух типов:

  • Пароль для открытия документа . Данный пароль требуется ввести, чтобы открыть защищенный файл.
  • Пароль владельца . Если в документе запрещен доступ к функциональности ограниченного доступа (раздел Разрешения ), задается пароль для изменения прав доступа - Пароль владельца. Пароль для открытия документа вводить не требуется.

Если файл PDF защищен двумя типами паролей, то для его открытия можно ввести любой из заданных паролей. При этом для изменения доступа к Разрешениям пользователь обязательно должен ввести Пароль владельца . Для обеспечения более высокого уровня защиты желательно задавать пароли двух типов.

  • Разрешить печать документа . Печать возможна с разрешением не выше 150 dpi.
  • Печать с высоким разрешением . Возможна печать с любым разрешением.
  • Копирование содержимого для расширенного доступа . Дает возможность пользователям выделять и копировать содержимое PDF.
  • Извлечение содержимого документа . Содержимое документа шифруется, но сохраняется доступ поисковых систем к данным документа.
  • Заполнять существующие формы или подписывать . Пользователи могут заполнять поля форм и ставить свою электронную цифровую подпись. Это не дает им возможность добавлять комментарии и создавать новые поля форм.
  • Комментирование . Заполнение полей форм и внесение цифровой подписи.
    Пользователи могут оставлять свои комментарии, ставить цифровые подписи и заполнять поля в формах. Пользователь при этом лишен права перемещать объекты на странице или создавать новые поля форм.
  • Управление страницами и закладками . Позволяет осуществлять вставку, удаление и поворот страниц, создание закладок и миниатюр.
  • Изменение документа . Позволяет изменять контекст (текст, изображения…) документа.

Начальный вид

Во вкладке Начальный вид пользователь может настроить вид рабочего пространства документа, который он будет иметь при последующем открытии в любом просмотрщике PDF.

В данной вкладке можно задать начальный вид страниц и панели навигации, уровень масштабирования, параметры окна и параметры пользовательского интерфейса. Для просмотра PDF презентаций, можно установить начальный вид просмотра «Открыть в полно экранном режиме».

При повторном открытии настройки данных параметров будут игнорироваться если в главном меню Инструменты > Параметры вкладка Основные выбрана опция .

Размещение и масштаб.

  • Панель навигации. Выбор вкладки, которая будет отображаться на навигационной панели.
  • Вид страницы. Выбор необходимого режима просмотра документа: одна страница, одна страница непрерывно, две страницы, две страницы непрерывно, две страницы с титульной, две страницы непрерывно с титульной.

Текущая версия Master PDF Editor поддерживает только непрерывный режим просмотра страниц.

  • Масштаб . Установка масштаб документа.
  • Открыть страницу. Выбор номера страницы, с которой будет начинаться просмотр документа. Данный параметр будет игнорироваться, если во вкладке Действия окна Свойства документов настроено выполнение какого-либо действия, совершаемого при открытии документа.

Параметры окна.

  • Показывать название документа вместо имени файла. Показывает имя файла или название документа в заголовке окна. Название документа указывается во вкладке Сведения о документе.
  • Открыть в полноэкранном режиме. Установка максимального размера окна документа и отображение документа без строки меню, панели инструментов и элементов управления.

Для выхода из полноэкранного режима просмотра документа используется клавиша F11. Редактирование в данном режиме возможно только при использовании горячих клавиш.

  • Центрировать окно. Свойство не поддерживается. Добавлено для совместимости с некоторыми другими программами.
  • Параметры пользовательского инструмента. Настройка отображения элементов Рабочего пространства.
  • Скрыть меню. Скрыть/отобразить меню.
  • Скрыть панели инструментов. Скрыть/отобразить панель инструментов.
  • Скрыть элементы управления. Master PDF Editor не поддерживает работу данного параметра. Он добавлен для совместимости с некоторыми другими программами.

Шрифты

Во вкладке Шрифты указан перечень шрифтов, используемых в документе.

Действия

В данной вкладке пользователь может установить действие, которое будет совершаться при открытии данного PDF документа в любом просмотрщике: открыть страницу, открыть файл, открыть Web ссылку, сбросить формы, показать/скрыть формы, отправить формы, выполнить JavaScript.

Если установить действие, совершаемое при открытии документа, то выполнение настроек пункта Открыть страницу раздела Размещение и масштаб (вкладка Начальный вид ) будет игнорироваться.

Подробнее о предопределенных действиях в документах PDF смотрите в разделе Свойства PDF форм > .

Действие, установленное в данной вкладке окна Свойства документа будет выполнятся, если в разделе История вкладки Параметры> Основные не установлены флажки в пунктах: Восстановить последнюю сессию при старте и Восстановить последние параметры просмотра при повторном открытии

Доброго времени суток, дорогие читатели! Сегодня поговорим о такой штуке, которую многие видели, некоторые пользовались, а кому-то это кажется заморским колдунством и он обходит сие стороной, т.е про PDF .

Итак, прежде, чем рассказать что это, я расскажу для чего оно нужно. Предположим, вы открыли ваш любимый MS Word 2003/7/10/2048 , написали длинную простыню текста, оформили все это красивенько и довольные пошли показывать коллегам. И такой вот коллега берет ваш документ, открывает своим OpenOffice/LibreOffice/somethingotherOffice и ужасается от того безобразия, которое творится с документом.

Оформление поплыло, скриншоты отцентрированы криво, навигация не работает, отступ абзаца не по ГОСТу, шрифты фигпоймикакие, смотрит он на вас так вопросительно и недоумевает. А вместе с ним и вы недоумеваете, ведь у вас-то все ОК, и шрифты, специально скаченные, и отступы, выверенные с миллиметровой точностью, и скриншоты, отцентрированные с точностью до эпсилон в минус десятой. Показываете вы свое творение другому коллеге.

А у коллеги и офиса-то нету, Wordpad "ом прикажете открывать? То еще развлечение.

Так в чем же тут проблема?

Думаете в криворукости автора документа? Отнюдь, автор может и криворук, но дело совсем в другом. На самом деле, даже разные версии MS Word могут несколько по-разному смотреть на документы, не говоря уже о каких-то других программах для работы с электронной документацией. Так что же делать, чтобы другие люди могли увидеть Ваш документ именно в таком виде, в котором Вы его задумывали?

Здесь есть несколько способов:

  • Вы можете его распечатать, но это не самое удобное решение, особенно если люди находятся на другом конце синего шарика;
  • Вы можете его отправить по факсу, вот только этого факса на том конце может не быть;
  • Вы можете его сохранить в специальном формате. Тут-то и приходит на помощь PDF .

Вот о последнем, собственно, мы и поговорим.

Что такое PDF и с чем его едят

PDF (от англ. Portable Document Format ) - это специальный формат электронных документов, который не зависит от выбранной ОС, программы просмотра электронных документов или еще чего-нибудь. Он единый для любого устройства. Все, что нужно для открытия документов в этом формате - программа просмотра. Их существует великое множество, как бесплатных, так и платных.

Самая распространенная программка - это, несомненно, Adobe Reader (можно скачать , только не забудьте убрать галочки напротив McAfee и True Key ), которая написана авторами этой технологии.

Однако в AR часто находят уязвимости (а так же справедливо приписывают навязчивость, тормознутость и прочие ужасы жизни), так что кому это не нравится, смотрите в сторону аналогов (Foxit Reader, Nuance и тп).

Если кому интересно, так выглядит документ, открытый в Adobe Reader DC:

У PDF есть свои ограничения, как то:

  • Невозможность редактирования текста (кроме специализированных программ);
  • Необходимость вшивать нестандартные шрифты (для любителей делать не по ГОСТу);
  • Необходимость использования достаточно больших растровых изображений для внятного отображения при печати.

Среди преимуществ же:

  • Простота использования;
  • Возможность защитить файл от большинства действий нерадивых пользователей (пометка маркерами, поиск по словам, редактирование текста);
  • Независимость от программы просмотра. В любой программе просмотра он будет выглядеть одинаково.

Теперь поговорим о том, как его, собственно создать.

Как работать с PDF

В MS Word 2010, 13, 16 выбираете "Сохранить как " и указываете тип файла: "PDF ". Можно также снять галочку "Открыть файл после публикации ", чтобы не открывать каждый раз созданную вами PDF -ку.

Устанавливаете его, после чего запускаете Word , нажимаете на большую кнопку сверху-слева: "Сохранить как " -> "PDF или XPS " и сохраняете как PDF .

Если же вам нужен PDF файл из другой программы, при этом у нее нет возможности сохранять файлы в PDF , то достаточно скачать бесплатный виртуальный PDF принтер, например, .

Далее запускаете установщик, ждете, пока принтер установится, после этого открываете нужную вам программу, выбираете опцию "Печать ", выбираете виртуальный принтер и снова жмете на кнопку "Печать ".

Теперь выбираете интересующие вас настройки (я рекомендую отметить галочку "Embed fonts " для встраивания шрифта в ваш PDF ) и жмете на кнопку "OK ".

Есть еще и платные аналоги, но вы не подумайте, что они делают ровно тоже, но за деньги, нет. Они отличаются тем, что могут вставлять ссылки в PDF файлы, создавать закладки, оглавления, использовать водные знаки, зашифровывать PDF документ и еще много чего, что вам вряд ли в жизни пригодится:)

Кстати говоря, позволяют удобно и просто, без всяких плагинов, создавать PDF -фы на лету.

Послесловие

Вот в общем-то и все, что требуется для работы с данным форматом. Все возможности я описывать не стал, в этом нет особого смысла, ибо в большинстве случаев требуется просто сохранить файл или документ в PDF и потом открыть его каким-нибудь просмотрщиком. Так что пользуйтесь, очень удобный формат:)

Как и всегда, если есть какие-то вопросы, мысли, дополнения и всё такое прочее, то добро пожаловать в комментарии к этой записи.

PS : За существование статьи отдельное спасибо другу проекта и члену нашей команды под ником “barn4k“



Загрузка...