sonyps4.ru

В чем разница между знаниями и данными. Данные и знания

Отличия знаний от данных

Информация, данные, знания

Информация существует в трех видах: в виде данных (Data ), собственно информации (Information ) и знаний (Knowledge ).

При компьютерной обработке информации исходные данные понимаются как данные , и должны быть представлены в форме, которую можно хранить, обрабатывать, передавать.

Данные – зафиксированные наблюдения, которые в данный момент времени не оказывают воздействия на принятие решения.

Данные обычно представлены в форме, которая позволяет использовать их для компьютерной обработки и передачи, то есть, закодированы, могут храниться.

Примеры данных: словарь – упорядоченный набор текстовых данных, энциклопедия – упорядоченный набор данных, произвольный текст (статья, конспект).

Из данных можно извлечь информацию.

Информация – это обработанные данные, которые представлены в виде, пригодном для принятия получателем решения.

Примеры информации: извлеченное из словаря толкование слова, извлеченное из энциклопедии значение термина.

Информацией является содержание, значение данных, или факты, которые используются для принятия решения.

Знания – факты, сообщения об окружающей среде, процедуры и правила манипулирования фактами, а также информация о том, когда и как следует применять эти процедуры и правила.

В целом, знания – это проверенный практикой результат познания действительности, вид информации, которая отображает знания человека, специалиста в предметной области.

Знания различаются: есть декларативные (факты) и процедурные (правила). Декларативные, это знания об определенных явлениях, событиях, свойствах объектов («Я знаю, что…»). Процедурные, это знания о действиях, которые нужно предпринять для достижения какой-либо цели («Я знаю, как…»).

Отличия знаний от данных

1. Интерпретация . Хранимые данные могут быть интерпретированы только человеком или программой. Данные не несут информации. Знания содержат как данные, так и их описание (правила интерпретации).

2. Наличие связей классификации . Данные не имеют эффективного описания связей между различными типами данных. Знания структурированы, так как можно установить соответствие между единицами знаний.

3. Наличие ситуационных связей . Связи описывают множество текущих ситуаций объекта. Данные трудно поддаются анализу. Из структуры и состава знаний по ситуации возможно построение процедур анализа знаний.

Подходы к определению количества информации
(способы измерения информации)

В теории информации доказано, что информация допускает количественную оценку, то есть может быть измерена объективно.

Очевидно, что для этого нужно сделать допущения: в определенных условиях можно пренебречь качественными особенностями информации. Тогда количество информации может быть измерено числом, следовательно, можно сравнить количество информации, содержащейся в различных сообщениях.

Для людей, что хотят постоянно совершенствоваться, чему-то обучаться и постоянно изучать что-то новое, мы специально сделали эту категорию. В ней исключительно образовательный, полезный контент, который, безусловно, придется Вам по вкусу. Большое количество видео, пожалуй, могут посоревноваться даже с образованием, которое нам дают в школе, в колледже или университете. Самым большим достоинством обучающих видео является то, что они стараются давать самую свежую, самую актуальную информацию. Мир вокруг нас в эру технологий постоянно меняется, и печатные обучающие издания просто не успевают выдавать свежую информацию.


Среди роликов также можно найти и обучающие видео для детей дошкольного возраста. Там Вашего ребенка обучат буквам, цифрам, счету, чтению и т.д. Согласитесь, очень даже неплохая альтернатива мультикам. Для учеников начальных классов также можно найти обучения английскому языку, помощь в изучении школьных предметов. Для более старших учеников созданы обучающие ролики, которые помогут подготовиться к контрольным, к экзаменам либо же просто углубить свои познания в каком-то определенном предмете. Приобретенные знания могут качественным образом сказаться на их умственном потенциале, а также Вас порадовать отличными оценками.


Для молодых людей, что уже окончили школу, учатся или не учатся в университете, есть множество увлекательных образовательных видео. Они им могут помочь в углублении знаний по профессии, на которую учатся. Или же получить профессию, например программиста, веб-дизайнера, SEO-оптимизатора и прочее. Таким профессия пока в университетах не учат, поэтому специалистом в этой продвинутой и актуальной сфере можно стать только занимаясь самообразованием, в чем мы и стараемся помочь, собирая самые полезные ролики.


Для взрослых людей эта тема тоже актуальна, так как очень часто бывает, что проработав по профессии годы, приходит понимание, что это не твое и хочется освоить что-то более подходящее для себя и одновременно прибыльное. Также среди данной категории людей часто становятся ролики по типу самосовершенствования, экономии времени и денег, оптимизации своей жизни, в которых они находят способы жить гораздо качественнее и счастливее. Еще для взрослых людей очень хорошо подойдет тема создания и развития собственного бизнеса.


Также среди образовательных роликов есть видео с общей направленностью, которые подойдут для практически любого возраста, в них можно узнать о том, как зарождалась жизнь, какие теории эволюции существуют, факты из истории и т.д. Они отлично расширяют кругозор человека, делают его гораздо более эрудированным и приятным интеллектуальным собеседником. Такие познавательные видео, действительно, полезно смотреть всем без исключения, так как знание – это сила. Желаем Вам приятного и полезного просмотра!


В наше время просто необходимо быть, что называется «на волне». Имеется в виду не только новости, но и развитие собственного ума. Если Вы хотите развиваться, познавать мир, быть востребованным в обществе и интересным, то этот раздел именно для Вас.

При изучении интеллектуальных систем традиционно возникает вопрос - что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным.

Данные - это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

1. данные как результат измерений и наблюдений;

2. данные на материальных носителях информации (таблицы, протоколы, справочники);

3. модели (структуры) данных в виде диаграмм, графиков, функций;

4. данные в компьютере на языке описания данных;

5. базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

При обработке на ЭВМ знания трансформируются аналогично данным.

1. знания в памяти человека как результат мышления;

2. материальные носители знаний (учебники, методические пособия);

3. поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;

4. знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы - см. далее);

5. база знаний на машинных носителях информации.

Часто используется такое определение знаний:

Знания - это хорошо структурированные данные, или данные о данных, или метаданные.

В базе данных идёт поиск по ключевому слову, условно говоря – это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 – 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей – это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение – что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая – по способам подачи материала (насосы, окунание детали, распыление раствора), третья – по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний – это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.



Теперь немного о минусах этой системы. Базы данных – это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус – базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний – это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс – при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов – до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.

Применение баз знаний

Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз - помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.

Системы основанные на знаниях реализуются на базе следующих интеллектуальных алгоритмов:

  • экспертные системы;
  • нейронные сети;
  • нечёткая логика;
  • генетические алгоритмы.

База знаний учебного назначения представляет собой информационную систему, содержащую, во-первых, систематизированные сведения из определенной предметной области, во-вторых, модель конкретной предметной области (определенный объем учебной информации по этой дисциплине), а также данные о формируемых умениях обучаемого и способах использования этих умений.

Учебная информация в базах знаний может быть представлена в виде текста, графиков, иллюстраций, анимационных роликов, видеофрагментов. Данные о формируемых умениях обучаемого обрабатываются в системе управления базами знаний с помощью

специальных языков, что позволяет контролировать процесс обучения и управлять им. По своим возможностям базы знаний представляют собой упрощенный вариант экспертной обучающей системы или ее часть.

Заключение

Зарубежная научная стажировка в ИТМО на кафедре «Прикладного программирования и технологических инноваций» мне очень понравился. Я узнала много интересного в области интелектуальой системы и базы знаний. Выполнял реферат на тему: Переход от базы данных до базы знаний(рис.-7). Общалась с людьми, работающими в области программирования уже много лет и приобрела опыт, который поможет мне в дальнейшем изучении своей диссертационной работе. Научная зарубежная стажировка позволила мне увидеть пропуски в моих знаниях, которые следует восполнить. В ходе прохождения стажировки был ознакомлен с нормативными документами по организации учебного процесса. Ознакомилась с каталогами диссертационных исследований магистрантов, кандидатов, изучила выпускные квалификационные работы, авторефераты, диссертации на соискание ученной степени кандидатов наук по теме магистерской работы.

В ходе практики были приобретены новые знания об особенностях процессов производства на машиностроительном предприятии ОАО НКМЗ. Была разработана блок-схема для моделирования программы, реализация которой осуществляется для определения оптимального количества транспортных тележек с учетом анализа экономической целесообразности разных вариантов закрепления тележек за станками.

Задача описанной блок-схемой модели состоит в необходимости подобрать такое количество тележек, которые перевозили бы готовые узлы на склад с учетом оптимального плана загрузки.

Полученные результаты представляют большой интерес и практическую полезность в перспективе применения их в будущем.

Участвовала в экскурсии по городу. Ознакомился с достопримечательностями города, памятниками, историей города. Также посещал главный музей города «Эрмитаж».

В целом хочется сделать вывод, что зарубежная стажировка была пройдена успешно. итогом продуктивно проделанной работы стал целый блок материалов из фондов хранилищ российских библиотек(рис.-3), собраннй по теме магистерской диссертации. Данный материал активно используется в написании научной работе, конечном итогом который явится магистерская диссертация.По завершению стажировки нам вручили сертификаты об успешном прохождении зарубежной практики в ИТМО. (рис.-4,5)

Список литературы

1. http://innovatika.boom.ru/UZ.htm

На сайте выложена первая глава книги В. П. Баранчеева «Управление знаниями». В. П. Баранчеев – доктор экономических наук, профессор Государственного университета управления (Институт инноватики и логистики, кафедра инновационного менеджмента). В книге рассматриваются современные концепции управления знаниями, неформализованное и формализованное знание, а также базы знаний.

2. http://www.knowbase.ru/

Сайт, посвященный базам данных. На странице вводятся понятия знаний, информации, управление знаниями, познание и т.д. Также описаны некоторые возможности баз знаний, а также рассказывается об их практическом применении и проблемах, связанных с их использованием. Каждому понятию отведена отдельная веб-страница.

3. http://lingvoworks.org.ua/index.php?option=com_content&view=article&id=57:2009-12-09-11-34-05&catid=2:misc&Itemid=3

В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.

4. http://aimatrix.nm.ru/aimatrix/SemanticNetworks.htm

Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.

5. http://bibl.tikva.ru/base/B1253/B1253Part12-59.php

Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.

6. http://lsdis.cs.uga.edu/projects/glycomics/report/Report2006.html

Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.

7. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.41.1007

Приложение

рис.1- Университет ИТМО

рис.2- Первый день в университете. Ознакомление

рис.3- В очень богатой библиотеке

рис.4- Вручение сертификатов о успешном прохождении зарубежной стажировки. Наш руководитель Супрун Антон Сергеевич.

рис.5- Сертификат

рис.6-Эксурсия по городу. Эрмитаж. Зимний дворец.

рис.7- Готовим презентации для защиты

рис.8-Экскурсия. Ночной город. Развод мостов.

То есть на некотором уровне знания ≡ данные

    Важно: знания задаются какэкстенсионально (эксплицитно, явно), то есть через набор конкретных фактов, соответствующих данному понятию, так иинтенсионально (неявно), то есть через свойства, соответствующие данному понятию.

Данные всегда задаются экстенсионально (явно).

    Внутренняя интерпретируемость знаний, в отличие данных.

Хранение в памяти вместе с элементами данных избыточность системы имён (например, хранить все лексические толкования (словарь)), то есть знания обладают множеством интерпретаций.

    Рекурсивная структурированность знаний (декомпозиция).

    Связанность (взаимосвязь) единиц знаний.

Наличие возможности установления различных отношений, отражающих семиотику и прагматику связей отдельных явлений и фактов, а также отношений отражающих смысл системы в целом, то есть можно задавать крупные единицы знаний как отдельные случаи (CBR).

Случай – как совокупность продукций – семантика.

Прагматика – отношение говорящего к предмету.

    Наличие у знаний семантического пространства с метрикой.

    Активность знаний, в отличие отданных.

То есть возможность ставить цели, достигать цели и т. д.

Активные объекты знаний – агенты.

Агенты обладают ментальными свойствами (то есть тем, что свойственно человеку).

    Функциональная целостность знаний.

    возможность выбора желаемых результатов средств анализа, достаточности полученного результата.

Таким образом, если выполняется совокупность вышеперечисленных свойств, то это знаний.

Сравнение соз(эс) и классических программных систем

    Сравнение технологий разработки.

      Обычная программа

      Система основанная на знаниях (СОЗ)

    Структура

    Сравнение параметров

Тип системы

Характеристики

Тип обработки

Методы решения задач

Задание шагов решение

Искомое решение

Управление и данные

Модификации

Достоверность информации

Символьная

Эвристический поиск

Удовлетворительное *

Перемешаны

Достоверная + недостоверная

Числовая

Алгоритмический поиск

Оптимальное

Разделены

Достоверная

* удовлетворительное – не хуже, чем человек-эксперт.

Недостоверная информация - ???НЕ-ФАКТОРЫ

Схема решения задач

Основные типы задач, при решении которых, использование соз даёт существенный результат.

Название

Все знают, что такое базы данных и как ими пользоваться. Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое образование постепенно начинает терять свою былую значимость. Особенно это касается научной периодики. Главная проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём главное отличие баз данных и баз знаний? В базе данных идёт поиск по ключевому слову, условно говоря - это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 - 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей - это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение - что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая - по способам подачи материала (насосы, окунание детали, распыление раствора), третья - по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний - это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Теперь немного о минусах этой системы. Базы данных - это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус - базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний - это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс - при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов - до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Небольшой итог. Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.



Загрузка...