doc/LD/knowledge.md
2025-10-02 00:35:18 +03:00

10 KiB
Raw Permalink Blame History

1 knowledge representation

Представление знаний (knowledge representation, см. wiki) возможно через формализмы представления знаний. Мы про точное и однозначное представление знаний, а не про «богатый русский язык» или набор табличек (от excel до реляционных баз). Наиболее популярным таким формализмом является стек Linked Data, включая RDF / OWL - языки представления знаний, в основе которых семантический триплет.

Ссылки:

2 knowledge

Есть много статей типа: Что такое информация? ; Что такое информация? ; Информация, как много в этом слове… ; пирамид типа DIKW data, information, knowledge, wisdom или DAIKI (Insight), но ясности так и нет. Есть свод знаний по управлению данными DAMA-DMBOK (Data Administration Management Association - Data Management Body of Knowledge), но вот свода знаний по управлению знаниями - нет (а надо бы).

Данные - Информация - Знания

Данные - это просто набор информационных объектов, списки, Data silos - "болота" данных (просто как несвязанный набор, а не как тип DWH) и более «ласкательный» термин Data Lake.
Объекты Data (как отдельные, так и в составе набора \ контейнера Data silos) могут иметь идентификаторы и даже какое-то описание.
Далее «Связанная информация» или просто Информация. «Связные данные» плохо, т.к. будет путаница с Linked Data. Причем связь тут точечная (плоская), как huperLink в wiki. Через кликабельную ссылку мы «скачем» от одного связанного объекта к другому, но без семантической (смысловой) нагрузки. Примеры: web, MediaWiki.
Знание это «связанные данные», но не через плоский huperLink, а через типизированный, т.е. предикат. Примеры: semantic web, semantic MediaWiki.
Классификация объектов и предикатов (отношений между объектами), возможные типы связей между объектами, сведенные в табличку, образуют МетаМодель, онтологию, концептуальную модель.
Концептуальная модель - система концептов и отношений предметной области. Онтология это подробная спецификация структуры определенной проблемной области
Например, до Тогаф 10 понятие МетаМодель так и назвалось "МетаМодель", а спустя два десятка лет вдруг переименовалась в "Концептуальную модель".
Онтология / МетаМодель включают как составную часть толковый словарь и таксономию (иерархический классификатор), а как производную машину рассуждений (semantic reasoner \ rules engine). Семантический триплет - есть атом знания в контексте семантических технологий. Триплет состоит из трех компонентов: субъекта, предиката и объекта, что позволяет формулировать простые утверждения о взаимосвязях между различными сущностями. Например, триплет "Кот (субъект) - есть (предикат) - животное (объект)" представляет собой базовое знание о том, что кот является животным. Согласно спецификации RDF (Resource Description Framework), основная структура данных в RDF представлена в виде триплетов, которые формируют графы знаний (просто граф содержит не типизированные связи, как в WikiPedia). Каждый триплет представляет собой отдельное утверждение, и множество таких триплетов может быть объединено для создания более сложных знаний и отношений.

В Semantic web явно указывается (через формальную семантику), что "Париж" — "столица" — "Франция", а в WikiPedia будет словами написано «столица» и дана плоская ссылка (гиперссылка) на «Франция». Т.е. читатель WikiPedia сам в уме типизирует связь для получения смыла (семантической связности через предикат), а в «системах управления знаниями» (Semantic web \ Semantic Wiki) это базовый элемент (встроенный формализм). Т.е. в системах управления знаниями «знания написаны» на языке знаний (триплет минимальный конструктивный элемент знания).
Таким образом получаем иерархию: данные ("болото данных") информация (линейно связанные данные) знания (предикатно связанные данные).
Проверка от AI: https://github.com/bpmbpm/doc/blob/main/LD/knowledge_ai.md
Мета-Мета-Онтология содержит общие понятия и отношения, не зависящие от предметной области: «объект», «свойство», «значение», т.е. формат семантического триплета (объект в первой позиции триплета = субъект). Полагаю, что любой DSL (вкл. OWL\RDF) формализации именно знаний должен быть основан на триплетах (иначе концепт: триплет = "атом знания" не подтвердится).

Можно, как и в DIKW «идти дальше» (мудрость), например, «пробрасывать мост» между различными категориями знаний / знаниями разных онтологий.
Например, опыт может формировать категории подтвержденные «знания». Или проводить сопоставления схожих знаний, заключенных в оболочках разных онтологий, например, схожие объекты разных религий, т.е. религиозных онтологий. Одни и те же триплеты (запись смысла, утверждения на языке семантики) разных смысловых миров (онтологий) скорее всего будут иметь разный смысл. "Мяч :коснулся Руки" в онтологиях (набор понятий \ классов объектов и правил) "Футбол" и "Волейбол" имеют разный игровой смысл.
"Знания" - это не научные знания, а это всего лишь наборы триплетов в связке с онтологией (толковым словарем, описанием предикатов и т.п.), которые могут содержать ошибочную или заведомо ложную информацию.
Знания формируют как саму онтологию ("мир идей"), так и факты в реальном мире (в "мире вещей"). Классификация стульев формализует абстракции (детализация идеи "стул"), в то время как знания об экземпляре "стул" формализуют знания о конкретном стуле (физический мир).

3 Схожее