Различие между понятиями «информация» и «данные. Понятия информации, даваемые различными науками
5.1. Отличия знаний от данных
Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, обрабатываемых ЭВМ.
Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:
Исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);
Представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;
Базы данных на машинных носителях информации.
Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.
Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем. Первый - поместить знания в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом являются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.
Второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.
Следует заметить, что для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ. Знания в ИИС существуют в следующих формах:
Исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);
Описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, фреймы и т. п.);
Представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;
Базы знаний на машинных носителях информации.
Что же такое знания? Приведем несколько определений.
Из толкового словаря С. И. Ожегова: 1) «Знание - постижение действительности сознанием, наука»; 2) «Знание - это совокупность сведений, познаний в какой-либо области».
Определение термина «знания» включает в себя большей частью философские элементы. Например, знание - это проверенный практикой результат познания действительности, верное ее отображение в сознании человека.
Знание есть результат, полученный познанием окружающего мира и его объектов. В простейших ситуациях знания рассматривают как констатацию фактов и их описание.
Исследователями в области ИИ даются более конкретные определения знаний.
«Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области» .
«Знания - это хорошо структурированные данные или данные о данных, или метаданные» .
«Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода» .
В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.
Знания - это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 5.1.).
Рис. 5.1. Процесс логического вывода в ИС
Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:
Если <условие> то <действие>.
Это определение есть частный случай предыдущего определения.
Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.
Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются знания, а не о классификациях. По своей природе знания можно разделить на декларативные и процедурные.
Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.
Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.
Для описания знаний на абстрактном уровне разработаны специальные языки - языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование традиционных компьютеров фон-неймановской архитектуры, являются языками процедурного типа. Разработка языков декларативного типа, удобных для представления знаний, является актуальной проблемой сегодняшнего дня.
По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.
По типу представления знания делятся на факты и правила, Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «ЕСЛИ А, ТО В».
Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода.
Форма представления знаний оказывает существенное влияние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать невозможно. Поэтому в интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний. Следует заметить, что одновременно выполнить эти требования довольно сложно, особенно в больших системах, где неизбежным становится структурирование и модульное представление знаний.
Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.
К классическим моделям представления знаний относятся логическая, продукционная, фреймовая и модель семантической сети.
Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной модели при разработке ИИС за исключением самых простых случаев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моделей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и неполноты знаний.
Данные - это совокупность сведений, которые зафиксированы на каком-либо носителе - бумаге, диске, пленке. Эти сведения должны быть в форме, пригодной для хранения, передачи и обработки. Дальнейшее преобразование данных позволяет получить информацию. Таким образом, информацией можно назвать результат анализа и преобразования данных. В базе хранятся различные данные, а система управления может выдавать по определенному запросу требуемую информацию. К примеру, можно узнать из школьной базы данных, кто из учеников живет на определенной улице или кто в течение года не получил плохой отметки и др. Данные превращаются в информацию тогда, когда ими заинтересуются. Можно утверждать, что информация - это используемые данные.
Слово «информация» произошло от латинского informatio, «сведения, изложение, разъяснение». Также информацией называют сведения об объектах, явлениях окружающей среды, их свойствах, которые уменьшают степень неопределенности, неполноты знаний. В результате обмена сведениями формируется более полное представление о предмете, повышается уровень осведомленности.
Информация не существует изолированно, сама по себе. Всегда есть источник, который ее производит и , ее воспринимающий. В роли источника или приемника выступает любой объект - человек, компьютер, животное, растение. Информация всегда предназначается конкретному объекту.
Человек получает информацию из самых разных источников - при чтении, прослушивании радио, просмотре телепередач, когда он дотрагивается до предмета, пробует на вкус еду. Одну и ту же информацию разные люди могут воспринимать по-разному.
В зависимости от сферы использования существует научная, техническая, экономическая и другие виды информации. Это сильнейшее средство воздействия на и на общество в целом. Согласно известному выражению, кто владеет наибольшей информацией по какому-либо вопросу, тот владеет миром, то есть, находится в выигрышном положении в сравнении с другими. В повседневной жизни от информации зависит развитие общества, здоровье и жизнь людей.
На протяжении тысячелетий человечество накопило огромные знаний, которые все продолжают увеличиваться. Объем информации в наши дни удваивается каждые два года. В любой ситуации, даже самой обыденной, эффективна лишь актуальная, полная, достоверная и понятная информация. Только актуальные, то есть, вовремя полученные сведения могут принести пользу людям. Прогноз погоды или предупреждение об урагане важно узнать накануне, а не в этот же день.
Прежде чем продолжить рассмотрение проблематики управления знаниями важно определиться с ключевыми понятиями этой области: «данные», «информация», «знания».
В литературе, посвященной управлению знаниями, представлены различные подходы к их трактовке. Не претендуя на полномасштабный анализ, попробуем обозначить некоторые важные моменты.
Под данными понимаются неупорядоченные наблюдения, числа, слова, звуки, изображения. Это – набор дискретных, объективных факторов о событиях. При этом в организационном контексте данные трактуются как структурированные записи об актах деятельности. Организации обычно хранят данные в информационных системах, в которые они поступают из различных подразделений и служб.
Когда данные организованы, упорядочены, сгруппированы категоризированы, они становятся информацией . Она трактуется как совокупность данных, упорядоченная с определенной целью, придающей им смысл.
Сообщение - это текст, цифровые данные, изображения, звук, графика, таблицы и др
Сведения – практически синоним понятия “Сообщения”. Они чаще всего носят бытовой характер.
Знание же трактуется как информация, готовая к продуктивному применению, действенная, снабженная смыслом. Оно представляет собой совокупность оформленного опыта, ценностей, контекстуальной информации, экспертного понимания, составляющих основу для оценки и интеграции нового опыта и информации. Оно формируется и применяется в умах людей, а в организациях зачастую оказывается закрепленным не только в документах и в хранилищах, но также в организационных процедурах, процессах, способах выполнения работы и нормах.
В таблице на основе обзора литературных источников приводятся различные определения знания.
В большинстве рассмотренных определений подчеркивается, что знания – понятие более широкое, глубокое и богатое по сравнению с информацией. Они представляют собой подвижное соединение разных элементов – опыта, ценностей, информации и экспертного понимания - и постоянно меняются; они интуитивны; характерны для людей и являются неотъемлемой частью человеческой сущности с ее непредсказуемостью.