mirror of
https://github.com/bpmbpm/doc.git
synced 2026-04-28 11:30:42 +00:00
37 lines
10 KiB
Markdown
37 lines
10 KiB
Markdown
### 1 knowledge representation
|
||
Представление знаний (knowledge representation, см. [wiki](https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B5%D0%B4%D1%81%D1%82%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B9)) возможно через формализмы представления знаний. Мы про точное и однозначное представление знаний, а не про «богатый русский язык» или набор табличек (от excel до реляционных баз).
|
||
Наиболее популярным таким формализмом является стек Linked Data, включая RDF / OWL - языки представления знаний, в основе которых семантический триплет.
|
||
|
||
Ссылки:
|
||
- [SemanticBPM](https://habr.com/ru/articles/795883/) Раздел Ссылки: [1] Философия информации (не путать с теорией информации): Знания и (vs) информация. Знания об информации (Информация об информации, Знания о знаниях).
|
||
- https://en.wikipedia.org/wiki/Knowledge_representation_and_reasoning
|
||
|
||
### 2 knowledge
|
||
Есть много статей типа: [Что такое информация?](https://habr.com/ru/articles/456276/) ; [Что такое информация?](https://habr.com/ru/companies/habr/articles/861576/) ; [Информация, как много в этом слове…](https://habr.com/ru/articles/713376/) ;
|
||
пирамид типа DIKW [data, information, knowledge, wisdom](https://ru.wikipedia.org/wiki/DIKW) или [DAIKI (Insight)](https://aimod2.com/docs/03-data-semantics/daiki-the-semantic-chain/), но ясности так и нет.
|
||
Есть свод знаний по управлению данными DAMA-DMBOK (Data Administration Management Association - Data Management Body of Knowledge), но вот свода знаний по управлению знаниями - нет (а надо бы).
|
||
|
||
#### Данные - Информация - Знания
|
||
Данные - это просто набор информационных объектов, списки, Data silos - "болота" данных (просто как несвязанный набор, а не как тип DWH) и более «ласкательный» термин Data Lake.
|
||
Объекты Data (как отдельные, так и в составе набора \ контейнера Data silos) могут иметь идентификаторы и даже какое-то описание.
|
||
Далее «Связанная информация» или просто Информация. «Связные данные» – плохо, т.к. будет путаница с Linked Data. Причем связь тут точечная (плоская), как huperLink в wiki. Через кликабельную ссылку мы «скачем» от одного связанного объекта к другому, но без семантической (смысловой) нагрузки. Примеры: web, MediaWiki.
|
||
Знание – это «связанные данные», но не через плоский huperLink, а через типизированный, т.е. предикат. Примеры: semantic web, semantic MediaWiki.
|
||
Классификация объектов и предикатов (отношений между объектами), возможные типы связей между объектами, сведенные в табличку, образуют МетаМодель, онтологию, концептуальную модель.
|
||
[Концептуальная модель - система концептов и отношений предметной области. Онтология – это подробная спецификация структуры определенной проблемной области](https://mei06.narod.ru/sem6/pz/shpora/lec7.htm)
|
||
Например, до Тогаф 10 понятие МетаМодель так и назвалось "МетаМодель", а спустя два десятка лет вдруг переименовалась в "Концептуальную модель".
|
||
Онтология / МетаМодель включают как составную часть толковый словарь и таксономию (иерархический классификатор), а как производную – машину рассуждений (semantic reasoner \ rules engine).
|
||
Семантический триплет - есть атом знания в контексте семантических технологий. Триплет состоит из трех компонентов: субъекта, предиката и объекта, что позволяет формулировать простые утверждения о взаимосвязях между различными сущностями. Например, триплет "Кот (субъект) - есть (предикат) - животное (объект)" представляет собой базовое знание о том, что кот является животным.
|
||
Согласно спецификации RDF (Resource Description Framework), основная структура данных в RDF представлена в виде триплетов, которые формируют графы знаний (просто граф – содержит не типизированные связи, как в WikiPedia). Каждый триплет представляет собой отдельное утверждение, и множество таких триплетов может быть объединено для создания более сложных знаний и отношений.
|
||
|
||
В Semantic web явно указывается (через формальную семантику), что "Париж" — "столица" — "Франция", а в WikiPedia будет словами написано «столица» и дана плоская ссылка (гиперссылка) на «Франция». Т.е. читатель WikiPedia сам в уме типизирует связь для получения смыла (семантической связности через предикат), а в «системах управления знаниями» (Semantic web \ Semantic Wiki) это базовый элемент (встроенный формализм). Т.е. в системах управления знаниями «знания написаны» на языке знаний (триплет – минимальный конструктивный элемент знания).
|
||
Таким образом получаем иерархию: данные ("болото данных") – информация (линейно связанные данные) – знания (предикатно связанные данные).
|
||
Проверка от AI: https://github.com/bpmbpm/doc/blob/main/LD/knowledge_ai.md
|
||
Мета-Мета-Онтология содержит общие понятия и отношения, не зависящие от предметной области: «объект», «свойство», «значение», т.е. формат семантического триплета (объект в первой позиции триплета = субъект). Полагаю, что любой DSL (вкл. OWL\RDF) формализации именно знаний должен быть основан на триплетах (иначе концепт: триплет = "атом знания" не подтвердится).
|
||
|
||
Можно, как и в DIKW «идти дальше» (мудрость), например, «пробрасывать мост» между различными категориями знаний / знаниями разных онтологий.
|
||
Например, опыт может формировать категории подтвержденные «знания». Или проводить сопоставления схожих знаний, заключенных в оболочках разных онтологий, например, схожие объекты разных религий, т.е. религиозных онтологий. Одни и те же триплеты (запись смысла, утверждения на языке семантики) разных смысловых миров (онтологий) скорее всего будут иметь разный смысл. "Мяч :коснулся Руки" в онтологиях (набор понятий \ классов объектов и правил) "Футбол" и "Волейбол" имеют разный игровой смысл.
|
||
"Знания" - это не научные знания, а это всего лишь наборы триплетов в связке с онтологией (толковым словарем, описанием предикатов и т.п.), которые могут содержать ошибочную или заведомо ложную информацию.
|
||
Знания формируют как саму онтологию ("мир идей"), так и факты в реальном мире (в "мире вещей"). Классификация стульев формализует абстракции (детализация идеи "стул"), в то время как знания об экземпляре "стул" формализуют знания о конкретном стуле (физический мир).
|
||
### 3 Схожее
|
||
- Семантический Треугольник Фреге [chevalry](https://chevalry.livejournal.com/315176.html) ; http://db4.sbras.ru/elbib/data/show_page.phtml?20+1439 ; https://postnauka.org/wtf/154781
|
||
- [EA/grail.md](https://github.com/bpmbpm/doc/blob/main/EA/grail.md#%D0%BE%D0%BD%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F---%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D0%BA%D0%B0---%D1%81%D0%B8%D0%BD%D1%82%D0%B0%D0%BA%D1%81%D0%B8%D1%81-%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F-%D0%BD%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D1%8F)
|