sonyps4.ru

Какие программы предназначены для обработки текстовой. Системы обработки текстовой информации

При подготовке текстовых документов на компьютере используются три основные группы операций:

Операции ввода позволяют перенести исходный текст из его внешней формы в электронный вид, то есть в файл, хранящийся на компьютере. Ввод может осуществляться не только набором с помощью клавиатуры, но и путем сканирования бумажного оригинала и последующего перевода документа из графического формата в текстовый (распознавание).

Операции редактирования (правки) позволяют изменить уже существующий электронный документ путем добавления или удаления его фрагментов, перестановки частей документа, слияния нескольких файлов, разбиения единого документа на несколько более мелких и т.д.

Ввод и редактирование при работе над текстом часто выполняются параллельно. При вводе и редактировании формируется содержание текстового документа.

Оформление документа задают операциями форматирования. Команды форматирования позволяют точно определить, как будет выглядеть текст на экране монитора или на бумаге после печати на принтере.

Программы, предназначенные для обработки текстовой информации, называют текстовыми редакторами .

Все многообразие современных текстовых редакторов условно можно разбить на три основные группы:

1. К первой относятся простейшие текстовые редакторы, обладающие минимумом возможностей и способные работать с документами в обычном текстовом формате.txt, который, как известно, при всей своей простоте и всеобщей поддержке совершенно не позволяет более или менее прилично форматировать текст. К этой группе редакторов можно отнести как входящие в комплект поставки ОС семейства Windows редакторы WordPad и совсем малофункциональный NotePad (Блокнот) , и множество аналогичных продуктов других производителей (Atlantis, EditPad, Aditor Pro, Gedit и т.д.).

2. Промежуточный класс текстовых редакторов включает в себя достаточно широкие возможности по части оформления документов. Они работают со всеми стандартными текстовыми файлами(TXT, RTF, DOC). К таким программам можно отнести Microsoft Works , Лексикон .

3. К третьей группе относятся мощные текстовые процессоры, такие, как Microsoft Word или StarOffice Writer . Они выполняют практически все операции с текстом. Большинство пользователей использует именно эти редакторы в повседневной работе.

Основными функциями текстовых редакторов и процессоров являются:

Ввод и редактирование символов текста;

Возможность использования различных шрифтов символов;

Копирование и перенос части текста с одного места на другое или из одного документа в другой;

Контекстный поиск и замена частей текста;

Задание произвольных параметров абзацев и шрифтов;

Автоматический перенос слов на новую строку;

Автоматическую нумерацию страниц;

Обработка и нумерация сносок;

Создание таблиц и построение диаграмм;

Средства обработки текстовой информации

Несмотря на широкие возможности использования компьютеров для обработки самой разной информации, самыми популярными по-прежнему остаются программы, предназначенные для работы с текстом. При подготовке текстовых документов на компьютере используются три основные группы операций:

Операции ввода позволяют перенести исходный текст из его внешней формы в электронный вид, то есть в файл, хранящийся на компьютере. Ввод может осуществляться не только набором с помощью клавиатуры, но и путем сканирования бумажного оригинала и последующего перевода документа из графического формата в текстовый (распознавание).

Операции редактирования (правки) позволяют изменить уже существующий электронный документ путем добавления или удаления его фрагментов, перестановки частей документа, слияния нескольких файлов, разбиения единого документа на несколько более мелких и т.д.

Ввод и редактирование при работе над текстом часто выполняются параллельно. При вводе и редактировании формируется содержание текстового документа.

Оформление документа задают операциями форматирования. Команды форматирования позволяют точно определить, как будет выглядеть текст на экране монитора или на бумаге после печати на принтере.

Программы, предназначенные для обработки текстовой информации, называют текстовыми редакторами .

Все многообразие современных текстовых редакторов условно можно разбить на три основные группы:

1. К первой относятся простейшие текстовые редакторы, обладающие минимумом возможностей и способные работать с документами в обычном текстовом формате.txt, который, как известно, при всей своей простоте и всеобщей поддержке совершенно не позволяет более или менее прилично форматировать текст. К этой группе редакторов можно отнести как входящие в комплект поставки ОС семейства Windows редакторы WordPad и совсем малофункциональный NotePad (Блокнот) , и множество аналогичных продуктов других производителей (Atlantis, EditPad, Aditor Pro, Gedit и т.д.).

2. Промежуточный класс текстовых редакторов включает в себя достаточно широкие возможности по части оформления документов. Они работают со всеми стандартными текстовыми файлами(TXT, RTF, DOC). К таким программам можно отнести Microsoft Works , Лексикон .

3. К третьей группе относятся мощные текстовые процессоры, такие, как Microsoft Word или StarOffice Writer . Они выполняют практически все операции с текстом. Большинство пользователей использует именно эти редакторы в повседневной работе.

Основными функциями текстовых редакторов и процессоров являются:

Ввод и редактирование символов текста;

Возможность использования различных шрифтов символов;

Копирование и перенос части текста с одного места на другое или из одного документа в другой;

Контекстный поиск и замена частей текста;

Задание произвольных параметров абзацев и шрифтов;

Автоматический перенос слов на новую строку;

Автоматическую нумерацию страниц;

Обработка и нумерация сносок;

Создание таблиц и построение диаграмм;

Проверка правописания слов и подбор синонимов;

Построение оглавлений и предметных указателей;

Распечатка подготовленного текста на принтере и т.п.

Также практически все текстовые процессоры обладают следующими функциями:

Поддержка различных форматов документов;

Многооконность, т.е. возможность работы с несколькими документами одновременно;

Вставка и редактирование формул;

Автоматическое сохранение редактируемого документа;

Работа с многоколоночным текстом;

Особенности обработки текстовой информации заключаются в том, что при вводе и редактировании формируется содержание текстового документа. Оформление документа задают операциями форматирования . Команды форматирования позволяют оформить документ в том виде, в котором он будет выглядеть на экране монитора или на бумаге после печати на принтере. Наименьшим форматируемым элементом документа является символ, затем – абзац, страница и раздел.

Создание и оформление документов основано на использовании так называемых шаблонов документов истилей оформления .

Стиль – это совокупность всех параметров оформления, определяющих вид символа, абзаца, страницы или раздела. Как правило, стили хранятся в самом документе. Вместе с тем, их удобно хранить в компактном виде в отдельном файле, называемом шаблоном.

Шаблон содержит стили и текстовые заготовки, используемые в документах определенного типа.

Операции, используемые при подготовке текстовых документов

Основной набор типовых операций, осуществляемых с помощью современных программных средств обработки текстовых документов, включает операции, производимые над документом в целом, над абзацами документа и над его фрагментами.

К операциям, производимым над документом, относятся:

    создание нового документа (присвоение документу уникального имени и ввод текста документа с помощью клавиатуры);

    сохранение документа (копирование документа из оперативной памяти во внешнюю);

    распечатка документа (создание бумажной копии документа).

Отметим, что операция удаления документа в программных средствах обработки текстовых документов отсутствует, в силу того, что редактор работает с копией документа, находящейся в оперативной памяти, а сам документ может находиться либо во внешней оперативной памяти, так и на другом компьютере.

Вся работа в среде редактора осуществляется с копией этого документа, загруженной в оперативную память с внешнего носителя, поэтому все изменения в ней необходимо периодически сохранять.

Операции, производимые над абзацем изменяют его параметры как структурного элемента текста. Параметры абзаца задаются с помощью опций:

    выравнивания строк абзаца (влево, вправо, по центру, по ширине);

    задания величины отступа в красной строке абзаца;

    задания ширины и положения абзаца на странице;

    задания межстрочного расстояния внутри абзаца и др.

Операции, производимые с фрагментом текста включают его выделение, перемещение, копирование или удаление. Фрагментами текста могут быть отдельный символ, слово, группа слов, абзац и т.д. Поэтому возможно удаление этих объектов в отличие от удаления документа в целом. Выделенный фрагмент текста можно напечатать, произвести контекстный поиск и замену символов в нем, применить шрифтовое выделение и ряд других операций.

Контекстный поиск и замена . Предварительно разметив текст, требующий многократного обращения к определенным местам документа можно использовать быстрый поиск нужных мест документа по аналогии с закладками в обычной книге (например, при подготовке статьи путем многократного редактирования документа). Можно также задать некоторый образец (символ, слово, группу слов или цепочку символов) и подать команду поиска. Поиск по образцу удобен, например, при замене термина в документе (например, имеется документ, в тексте которого встречается год - 2000, с помощью контекстного поиска и замены можно быстро изменить его на 2007 год).

Режим автоматического переноса слов используют для улучшения внешнего вида текста. При выключенном режиме автоматического переноса слово, не поместившееся на строке, полностью переносится на следующую строку, но в этом случае края текста остаются неровным. При включенном режиме автоматического переноса реализуется мягкий вариант переноса: слово автоматически переносится в соответствии с правилами переноса слов русского или другого языка.

Проверка правописания слов и синтаксиса выполняется специальными программами, которые могут быть автономными, например Орфо, или встроенными в текстовый процессор. Эти программы значительно различаются по своим возможностям. Наиболее мощные из них проверяют не только правописание, но и склонение, спряжение, пунктуацию и даже стиль. Все указанные ошибки выявляются на основе сравнения, разработанного текста с хранящимися в памяти основными правилами. Заметим, что используемый в рамках текстового процессора набор таких правил существенно ограничен. Словарь синонимов поможет избежать повторений и сделает элегантным ваш стиль изложения.

Установка общих параметров страницы предусматривает размер полей, размер и ориентацию бумаги, нумерацию страниц, колонтитулы. Существует также команда запрета разрыва страниц, которая используется, когда вы хотите, чтобы определенная часть документа (например, таблица) находилась на одной странице, если таблица не умещается на странице, то она переносится целиком на следующую страницу. Для введениянумерации страниц в создаваемом вами документе текстовый процессор предложит специальное меню, в котором вы сможете указать все интересующие вас условия нумерации: месторасположение на листе номера страницы, отказ от нумерации первой страницы, использование колонтитулов и другие. Номера страниц проставляются в колонтитуле.Колонтитулом называется заголовочное данное, помещаемое в начале или конце каждой страницы документа. Колонтитулы обычно содержат номера страниц, название глав и параграфов, название и адрес фирмы и т.п. Колонтитулы могут различаться для четных и нечетных страниц, а также для первой страницы и последующих.

Некоторые текстовые процессоры позволяют использовать макросы .Макросом называют файл, в котором хранится программа часто повторяющейся последовательности действий, заданная пользователем.Макрос имеет уникальное имя. С помощьюмакросов можно автоматизировать многие типовые технологические этапы при работе с документами, например,макрос , выполняющий последовательность команд по созданию стиля для каждого абзаца документа. После вызовамакроса записанная в нем последовательность действий или команд будет в точности воспроизведена автоматически.

Операции сохранения записывают отредактированный документ или его фрагмент, находящийся в оперативной памяти, на внешний носитель для постоянного хранения. Тип сохраненного документа обычно присваивается текстовым процессором автоматически. Например, в текстовом процессоре Word документу присваивается расширение. doc . Возможны режимы “Сохранить и продолжить редактирование ”, “Сохранить и выйти ”. “Выйти без сохранения ”.

Текстовые процессоры с помощью резервного копирования обеспечивают защиту созданных документов от возможной утраты. Для этого специальной командой сохранения обеспечивается режим, когда одновременно хранятся два файла одного и того же документа - текущий и резервный. После внесения изменений в документ и его сохранения предыдущая его версия автоматически сохраняется как резервный файл с именем копия+имя документа и расширением. wbk , а отредактированная версия рассматривается как текущий файл. В редактореWord можно установить автоматическое создание резервной копии при каждом сохранении документа. Резервная копия представляет собой предыдущую версию документа, что позволяет сохранить как текущие сведения, так и сведения, сохраненные ранее. Сохранение резервной копии помогает сохранить данные, если случайно были сохранены изменения, которые вы не хотели сохранять, или если был удален исходный файл.

Важным фактором защиты создаваемых документов является функция автосохранения , которая может выполняться как обычная операция сохранения или как специальная операция сохранения текущего состояния текстового процессора в специальном файле. В последнем случае при аварийном прекращении работы это состояние может быть восстановлено, включая содержимое всех окон, положение курсоров в окнах и т.п. Это дает возможность восстановить документ в случае, если выполнение программы будет прервано по причине сбоя или при внезапном отключении электричества. Если включено автосохранение, внесенные в документ изменения сохраняются во временный файл с указанной частотой. Использование автосохранения не избавляет от необходимости сохранять открытый документ обычным способом. При сохранении файл восстановления заменяет собой исходный документ (если не было задано новое имя файла). следует заметить, что включенный режим автосохранения замедляет работу с документом, особенно, если он достаточно большой.

Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы – конверторы. В текстовых процессорах такие конверторы входят в состав системы. Перечислим некоторые форматы текстовых файлов:

только текст (.txt ) – наиболее универсальный формат. Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца.

текст в формате(.rtf ) – универсальный формат, который сохраняет все форматирование. Текст в данном формате может быть прочитан и интерпретирован многими приложениями (например, предыдущими версиямиWord )

документ Word (.doc ) – оригинальный формат используемой версииWord. Полностью сохраняет форматирование, использую 16-битную кодировку символов, что требует использование шрифтовUnicode .

текстовый документ Works дляWindows (.wps ) - оригинальный формат интегрированной системыWorks . Преобразование в формат документаWord возможно при наличии конвертора, при этом форматированиеWorks сохраняется не полностью.

HTML документ (.htm , .html ) – формат храненияWeb -страниц. Содержит управляющие коды (теги) языка разметки гипертекста.

Преобразование формата текстового документа можно производить в процессе его сохранения или открытия. Данное преобразование производится с помощью конверторов, входящих в состав текстовых редакторов, позволяющих импортировать и экспортировать документы из одного приложения в другое.

Например, благодаря наличию в текстовом процессоре Word компонентGraph ,Equation иWordArt возможно вставлять в документ различные диаграммы, математические формулы и текстовые эффекты. Эти компоненты не всегда доступны, что зависит от вида установкиWord (обычная или выборочная установка). Так компонентаEquation , как правило, при обычной установке недоступна.

Текстовые процессоры позволяют создать оглавление документа , применяя соответствующие стили к каждому заголовку, который будет в него включен. Для облегчения ориентации в документе можно также создатьпредметный указатель , в котором приводится список тем, обсуждаемых в данном документе, вместе с номерами страниц, содержащих соответствующую информацию. Возможно добавлениепримечаний , закладок, а такжеперекрестных ссылок .

При работе с большими документами проще располагать отдельные разделы в различных файлах, а затем компоновать весь документ в режиме структуры документа . Такой подход облегчает подготовку отдельных частей документа и позволяет производить общие операции со всем большим документом (формировать общее оглавление, проводить общую нумерацию страниц и т.д.).

Для обработки текстовой информации на компьютере используются приложения общего назначения - текстовые редакторы.

Текстовые редакторы - это программы для создания, редактирования, форматирования, сохранения и печати документов. Современный документ может содержать, кроме текста, и другие- объекты (таблицы, диаграммы, рисунки и т. д.).

Простые текстовые редакторы (например, Блокнот) позволяют редактировать текст и осуществлять простейшее форматирование шрифта.

Более совершенные текстовые редакторы, имеющие целый спектр возможностей по созданию документов (например, поиск и замена символов, средства проверки орфографии, вставка таблиц и др.), называют иногда текстовыми процессорами. Примером такой программы является Word из офисного пакета MicrosoftOffice, или Writer из пакета StarOffice.

Мощные программы обработки текста - настольные издательские системы - предназначены для подготовки документов к публикации. Пример подобной системы - Adobe PageMaker.

Для подготовки к публикации в Интернете web-страниц используют специализированные приложения (например, Microsoft FrontPage или Macromedia Dreamweaver).

Редактирование и форматирование

Редактирование - преобразование, обеспечивающее добавление, удаление, перемещение или исправление содержания документа.

Редактирование документа обычно производится путем добавления, удаления или перемещения символов или фрагментов текста.
Объектно-ориентированный подход дает возможность реализовать механизм встраивания и внедрения объектов (OLE - Object Linking Embedding). Этот механизм позволяет копировать и вставлять объекты из одного приложения в другое. Например, работая с документом в текстовом редакторе Word, в него можно встроить изображения, анимацию, звук и даже видеофрагменты и таким образом из обычного текстового документа получить мультимедиа-документ.

Форматирование - преобразование, изменяющее форму представления документа.

Любой документ состоит из страниц, поэтому в начале работы над документом необходимо задать значения параметров страницы: формат, ориентацию, поля и др. Стандартным является формат страницы А4 (21х29,7 см). Существуют две возможные ориентации страницы – книжная и альбомная. Для обычных текстов чаще используется книжная ориентация, а для таблиц с большим количеством столбцов – альбомная.

Форматирование абзацев.

Абзац с литературной точки зрения – это часть текста, представляющая собой законченный по смыслу фрагмент произведения, окончание которого служит естественной паузой для перехода к новой мысли.

В компьютерных документах абзацем считается любой текст, заканчивающийся управляющим символом конца абзаца. Ввод конца абзаца обеспечивается нажатием клавиши ВВОД (ENTER).



Форматирование абзацев позволяет подготовить правильно и красиво оформленный документ.

В процессе форматирования абзаца задаются параметры его выравнивания (выравнивание отражает расположение текста относительно границ полей страницы), отступы (абзац целиком может иметь отступы слева и справа) и интервалы (расстояние между строк абзаца), отступ красной строки и др.

Форматирование шрифта (символов).

Символы – это буквы, цифры, пробелы, знаки пунктуации, специальные символы. Символы можно форматировать (изменять их внешний вид). Среди основных свойств символов можно выделить следующие: шрифт, размер, начертание и цвет.

Шрифт – это полный набор символов определенного начертания. Каждый шрифт имеет своё название, например Times New Roman, Arial, Comic Sans MS. Единицей измерения шрифта является пункт (1 пт = 0,367 мм). Размеры шрифтов можно изменять в больших пределах. Кроме нормального (обычного) начертания символов обычно применяют полужирное, курсивное, полужирное курсивное.

По способу представления в компьютере различаются шрифты растровые и векторные. Для представления растровых шрифтов служат методы растровой графики, символы шрифта - это группы пикселей. Растровые шрифты допускают масштабирование только с определенными коэффициентами.
В векторных шрифтах символы описываются математическими формулами и возможно произвольное их масштабирование. Среди векторных шрифтов наибольшее распространение получили шрифты типа TrueType.

Можно также установить дополнительные параметры форматирования символов: подчеркивание символов различными типами линий, изменение вида символов (верхний и нижний индекс, зачеркнутый), изменение расстояний между символами.

Если планируется цветная печать документа, то можно задать различные цвета для различных групп символов.

Проверка орфографии и синтаксиса

Для проверки орфографии и синтаксиса используются специальные программные модули, которые обычно включаются в состав текстовых процессоров и издательских систем. Такие системы содержат словари и грамматические правила для нескольких языков, что позволяет исправлять ошибки в многоязычных документах.

Формат файла

Формат файла определяет способ хранения текста в файле. Простейший формат текстового файла (ТХТ) содержит только символы (числовые коды символов), другие же форматы (DOC, RTF) содержат дополнительные управляющие числовые коды, которые обеспечивают форматирование текста.

Технологии обработки текстов являются одними из наиболее распространенных технологий обработки информации. Текст – любая последовательность символов, к которым относятся буквы, пробел, знаки препинания, цифры, знаки арифметических операций и т.п. Текст можно создать карандашом, пером, авторучкой, на пишущей машинке, наконец, на компьютере.

К аппаратным средствам компьютера для ввода текстового документа относится клавиатура, световой карандаш со специальным планшетом, сканер.

К программным средствам, предназначенным для работы с текстами, относятся:

· электронные блокноты;

· текстовые редакторы;

· текстовые процессоры;

· редакционно-издательские системы;

· программы-переводчики;

· лингвистические корректоры;

· системы, осуществляющие интеллектуальный поиск и интеллектуальную обработку текстов, размещенных в сетях.

Текстовый редактор программное средство, предназначенное для создания (ввода, набора), редактирования и оформления текстов. Примеры: «Лексикон», «Слово и дело», «Edit», «Ched», «Note Pad», «Write».

Текстовый процессор отличается от текстового редактора более широкими функциональными возможностями:

· настраиваемое пользователем меню;

· использование контекстного меню;

· сопровождение текста таблицами и проведение в них простейших расчетов;

· вставка графических объектов (рисунков, диаграмм, заголовков и пр.) или создание рисунков с помощью встроенных инструментов;

· вставка формул, графиков, диаграмм;

· оформление текста списками, буквицами;

· использование инструмента автокоррекции текста и его автореферирования;

· создание и использование макросов;

· фоновая проверка орфографии, синтаксиса и др.

Примеры: Word (Microsoft Office), Word Pro (Lotus Smart Suite), Word perfect (Perfect Office), Accent, Word Pad.

Редакционно-издательские системы должны обеспечить все функции текстового процессора, а также:

· воспринимать тексты, созданные в различных текстовых редакторах;

· воспринимать отсканированные или нарисованные в графических редакторах иллюстрации, созданные на ПК разных платформ, и корректировать их цвета;

· иметь большой набор шрифтов и возможность их графического преобразования;

· иметь возможность для различного «обтекания» рисунка текстом;

· обеспечивать автоматическое оптимальное размещение текста на странице, автоматическую нумерацию страниц;

· обеспечивать адаптацию к различным печатающим устройствам и т.п.

Программы-переводчики или компьютерные словари содержат переводы на разные языки сотен тысяч слов и словосочетаний. Их возможности, предоставляемые пользователю, заключаются в следующем:

· выбор языка и направления перевода;

· предоставление не только общеупотребительных, но и специализированных слов;

· обеспечение быстрого поиска словарных статей;

· предоставление мультимедийных услуг – прослушивание слов в исполнении дикторов.

Рассматривая технологию создания текста, необходимо знать определение таких понятий как шрифт, графема, сериф, кегль, а также пагинация, выключка, кернинг, интерлиньяж.

Графема – единица письменного знака, выступающая в различных вариантах в зависимости от стиля письма, места в предложении и т.д.

Шрифт – выполненные в едином стиле графемы букв, используемых для письма.

Сериф – завиток (росчерк, засечка), образующий окончание линии, которой изображена буква или знак (литера).

Кегль – размер шрифта, определяемый литерой.

Выключка – выравнивание длины печатных строк по заданному размеру путем увеличения промежутков между словами.

Пагинация (от английского page – страница) – разбивка на страницы.

Кернинг – уменьшение расстояния между буквами для более удобного и комфортного восприятия текста глазом.

Интерлиньяж – регулировка промежутка между строками.

Формат файла определяет способ хранения текста в файле. Простейший формат текстового файла содержит только символы (числовые коды символов), другие же форматы содержат дополнительные управляющие числовые коды, которые обеспечивают форматирование текста.

Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы – программы-конверторы.

Рассмотрим некоторые наиболее распространенные форматы текстовых файлов.

Только текст (Text Only) (TXT). Наиболее универсальный формат. Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца. Применяют этот формат для хранения документов, которые должны быть прочитаны в приложениях, работающих в различных операционных системах.

Текст в формате RTF (Rich Text Format) (RTF). Универсальный формат, который сохраняет все форматирование. Преобразует управляющие коды в команды, которые могут быть прочитаны и интерпретированы многими приложениями, в результате информационный объем файла существенно возрастает.

Документ Word (DOC). Оригинальный формат используемой в настоящее время версии Word. Полностью сохраняет форматирование. Использует 16-битную кодировку символов, что требует использование шрифтов Unicode.

Документ Word 2.0, Word 6.0/95 (DOC). Оригинальные форматы предыдущих версий редактора Word. При преобразовании из формата Word 97/2000/2003 форматирование сохраняется не полностью.

Works 4.0 для Windows (WPS). Оригинальный формат интегрированной системы Works 4.0. При преобразовании из формата Word форматирование сохраняется не полностью.

HTML-документ (HTM, HTML). Формат хранения Web-страниц. Содержит управляющие коды (тэги) языка разметки гипертекста.

Выбор требуемого формата текстового документа или его преобразование производится в процессе сохранения файла.



Загрузка...