doc/LD/knowledge.md
2025-10-02 00:35:18 +03:00

37 lines
10 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

### 1 knowledge representation
Представление знаний (knowledge representation, см. [wiki](https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B5%D0%B4%D1%81%D1%82%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B9)) возможно через формализмы представления знаний. Мы про точное и однозначное представление знаний, а не про «богатый русский язык» или набор табличек (от excel до реляционных баз).
Наиболее популярным таким формализмом является стек Linked Data, включая RDF / OWL - языки представления знаний, в основе которых семантический триплет.
Ссылки:
- [SemanticBPM](https://habr.com/ru/articles/795883/) Раздел Ссылки: [1] Философия информации (не путать с теорией информации): Знания и (vs) информация. Знания об информации (Информация об информации, Знания о знаниях).
- https://en.wikipedia.org/wiki/Knowledge_representation_and_reasoning
### 2 knowledge
Есть много статей типа: [Что такое информация?](https://habr.com/ru/articles/456276/) ; [Что такое информация?](https://habr.com/ru/companies/habr/articles/861576/) ; [Информация, как много в этом слове…](https://habr.com/ru/articles/713376/) ;
пирамид типа DIKW [data, information, knowledge, wisdom](https://ru.wikipedia.org/wiki/DIKW) или [DAIKI (Insight)](https://aimod2.com/docs/03-data-semantics/daiki-the-semantic-chain/), но ясности так и нет.
Есть свод знаний по управлению данными DAMA-DMBOK (Data Administration Management Association - Data Management Body of Knowledge), но вот свода знаний по управлению знаниями - нет (а надо бы).
#### Данные - Информация - Знания
Данные - это просто набор информационных объектов, списки, Data silos - "болота" данных (просто как несвязанный набор, а не как тип DWH) и более «ласкательный» термин Data Lake.
Объекты Data (как отдельные, так и в составе набора \ контейнера Data silos) могут иметь идентификаторы и даже какое-то описание.
Далее «Связанная информация» или просто Информация. «Связные данные» плохо, т.к. будет путаница с Linked Data. Причем связь тут точечная (плоская), как huperLink в wiki. Через кликабельную ссылку мы «скачем» от одного связанного объекта к другому, но без семантической (смысловой) нагрузки. Примеры: web, MediaWiki.
Знание это «связанные данные», но не через плоский huperLink, а через типизированный, т.е. предикат. Примеры: semantic web, semantic MediaWiki.
Классификация объектов и предикатов (отношений между объектами), возможные типы связей между объектами, сведенные в табличку, образуют МетаМодель, онтологию, концептуальную модель.
[Концептуальная модель - система концептов и отношений предметной области. Онтология это подробная спецификация структуры определенной проблемной области](https://mei06.narod.ru/sem6/pz/shpora/lec7.htm)
Например, до Тогаф 10 понятие МетаМодель так и назвалось "МетаМодель", а спустя два десятка лет вдруг переименовалась в "Концептуальную модель".
Онтология / МетаМодель включают как составную часть толковый словарь и таксономию (иерархический классификатор), а как производную машину рассуждений (semantic reasoner \ rules engine).
Семантический триплет - есть атом знания в контексте семантических технологий. Триплет состоит из трех компонентов: субъекта, предиката и объекта, что позволяет формулировать простые утверждения о взаимосвязях между различными сущностями. Например, триплет "Кот (субъект) - есть (предикат) - животное (объект)" представляет собой базовое знание о том, что кот является животным.
Согласно спецификации RDF (Resource Description Framework), основная структура данных в RDF представлена в виде триплетов, которые формируют графы знаний (просто граф содержит не типизированные связи, как в WikiPedia). Каждый триплет представляет собой отдельное утверждение, и множество таких триплетов может быть объединено для создания более сложных знаний и отношений.
В Semantic web явно указывается (через формальную семантику), что "Париж" — "столица" — "Франция", а в WikiPedia будет словами написано «столица» и дана плоская ссылка (гиперссылка) на «Франция». Т.е. читатель WikiPedia сам в уме типизирует связь для получения смыла (семантической связности через предикат), а в «системах управления знаниями» (Semantic web \ Semantic Wiki) это базовый элемент (встроенный формализм). Т.е. в системах управления знаниями «знания написаны» на языке знаний (триплет минимальный конструктивный элемент знания).
Таким образом получаем иерархию: данные ("болото данных") информация (линейно связанные данные) знания (предикатно связанные данные).
Проверка от AI: https://github.com/bpmbpm/doc/blob/main/LD/knowledge_ai.md
Мета-Мета-Онтология содержит общие понятия и отношения, не зависящие от предметной области: «объект», «свойство», «значение», т.е. формат семантического триплета (объект в первой позиции триплета = субъект). Полагаю, что любой DSL (вкл. OWL\RDF) формализации именно знаний должен быть основан на триплетах (иначе концепт: триплет = "атом знания" не подтвердится).
Можно, как и в DIKW «идти дальше» (мудрость), например, «пробрасывать мост» между различными категориями знаний / знаниями разных онтологий.
Например, опыт может формировать категории подтвержденные «знания». Или проводить сопоставления схожих знаний, заключенных в оболочках разных онтологий, например, схожие объекты разных религий, т.е. религиозных онтологий. Одни и те же триплеты (запись смысла, утверждения на языке семантики) разных смысловых миров (онтологий) скорее всего будут иметь разный смысл. "Мяч :коснулся Руки" в онтологиях (набор понятий \ классов объектов и правил) "Футбол" и "Волейбол" имеют разный игровой смысл.
"Знания" - это не научные знания, а это всего лишь наборы триплетов в связке с онтологией (толковым словарем, описанием предикатов и т.п.), которые могут содержать ошибочную или заведомо ложную информацию.
Знания формируют как саму онтологию ("мир идей"), так и факты в реальном мире (в "мире вещей"). Классификация стульев формализует абстракции (детализация идеи "стул"), в то время как знания об экземпляре "стул" формализуют знания о конкретном стуле (физический мир).
### 3 Схожее
- Семантический Треугольник Фреге [chevalry](https://chevalry.livejournal.com/315176.html) ; http://db4.sbras.ru/elbib/data/show_page.phtml?20+1439 ; https://postnauka.org/wtf/154781
- [EA/grail.md](https://github.com/bpmbpm/doc/blob/main/EA/grail.md#%D0%BE%D0%BD%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F---%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D0%BA%D0%B0---%D1%81%D0%B8%D0%BD%D1%82%D0%B0%D0%BA%D1%81%D0%B8%D1%81-%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F-%D0%BD%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D1%8F)