rssh ([info]rssh) wrote,
@ 2008-05-08 13:44:00
Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Entry tags:developers.org.ua, онтологии, работа, ссылки

В поисках семантической модели
Или "снова о онтологиях".

Все кто интересовался разработкой ПО знают что в идеале должна быть сначала ращработана концептуальная модель предметной области, но на практике никто ее в чистом виде не видел. Иногда еще люди гордо ведут глоссарий (что безусловно вещь хорошая и необходимая).

Но - вот только сейчас развитие технологии привело к тому, что:
1. Модели предметной области (без програм) наконец-то практически возможно определить и сделать.
2. Они могут оказаться полезными для разработки и документирования ПО

То есть в идеале картинка полной разщработки выглядит так: у нас есть модель предметной области на каком-то языке моделирования, это модель отображается в код и схему БД с помощью какого-то (автоматического или ручного) процесса маппинга.

Модель предметной области можно давать суппорту/клиентам и новым членам команды для вхождения в тему. (Собственно этим она может быть полезна и если она сократит срок "вьезда в тему" для нового человека, то ее полезность и экономическую оправданность можно посчитать. Еще формальную модель можно проверять на ошибки и проч. - но эта отдельная тема и в общем случае c экономикой не все ясно.

Итак - что составляет концептуальную модель: "сущности и отношения между ними в некоторой связной картине мира ". Вот этот элемент "связной картины мира" и отсуствовал до недавнего времени. Я смотрю - буквально пару лет назад ситуация изменилась -- использование онтологий превысило какой-то критический объем и можно уже воспользоваться некоторыми результатами.
Сущности и отнощшения между ними обычно записываются в виде триплетов "сущность - отношение - сущность" (или иногда четверок);
Типы сущностей и отношений тоже могут быть описанны с помощью "метаописаний" относительно небольшого начального словаря
Для таких триплетов есть ствнлартный язык RDF (http://www.w3.org/2001/sw/) а для собственно онтологий - OWL (http://www.w3.org/TR/owl-features/); видно принятие стандартных языков стимулировало развитие общих моделей, которые можно использовать

Ссылки
http://www.schemaweb.info/ Список существующиз общесдоступных онтологий

SUMO http://www.ontologyportal.org/ -- я сейчас начну ее использовать для частичного моделирования предметной области в текущем проекте. Там определено приблизительно 20000 понятий и 70000 аксиом. Есть маппинг в WordNet

WordNet http://wordnet.princeton.edu/ -- лексическая база английского языка. Собственно семантический отношений там нет, но must be known about
МукиТуе http://verbs.colorado.edu/~mpalmer/projects/verbnet.html#thetaroles -- тут уже есть немного семантики. До формальной модели правда далеко, но запросы осмысленные делать можно

Gellish http://sourceforge.net/projects/gellish/ - повелся на него прочитав [info]ailev. Много интересного но все убивается в неудобный формат распостранения и отсуствие средств навигации. Т. е. для того что бы что-то сделать надо сначала хотя-бы загрузить словарь в БД или преобразовать в RDF а потом уже искать нужные сущности. Так как рядом есть RDF онтологии, где есть средства навигации и запросов, то работу по приведению Gellish определений в стандлартный вид оплачивать не имеет смысла.

Скорее интересное чем полезное: DBPedia (http://dbpedia.org/About) -- В википедии есть категории - вот вся информация из википедии о том что к чему относится в структированном виде хранится тут





(Post a new comment)


[info]raby
2008-05-08 07:44 pm UTC (link)
WordNet вроде бы построена с упором на семантику, а не на лексику. Если мне не изменяет память, она оперирует не столько словами, сколько synset'ами (synonym set) AKA sens'ами. Т.е. единица смысла задается как набор синонимов. Причем одно и то же слово может входить в разные синсенты АКА смыслы. Плюс между синсетами там введены отношения типа холонимы, гипонимы, гипернимы и т.д., показывающие семантические отношения.

А OWL кажется, да, очень удачная штука.

(Reply to this) (Thread)


[info]rssh
2008-05-08 08:06 pm UTC (link)
Да - это я неудачно выразился. Т.е. там нет семантических отношений - в смысле там нет тех семантических отношений [фактов о мире], которых мы ждем от онтологии (человек может работать в организации) (Земля являеться частью Солнечной системы). Вот именно этих семантических отнолшений там нет. Под семантикой там понимается группы сининимы/антонимы и отношение is-a (что как бы тоже онтология но слабее того что мы делаем, когда формализуем предметную область)
.. Уф, аж упарился. [ Надо будет пойти за хлебом и не забыть его купить ;) ]

(Reply to this) (Parent)(Thread)


[info]raby
2008-05-08 08:41 pm UTC (link)
Ну вообще то есть... запускаме wnb смотрим earth, смотрим holonyms:

Sense 1
Earth, earth, world, globe ..... MEMBER OF: solar system -- (the sun with the celestial bodies that revolve around it in its gravitational field)



Для man:

Sense 2
military man .... MEMBER OF: military unit, military force, military group, force -- (a unit that is part of some military service; "he sent Caesar a force of six thousand men")


С "может работать" действительно проблемы, так как с отношениями действия WordNet не очень... Но вроде с этим справляется VerbNet, хотя сам не проверял....

(Reply to this) (Parent)(Thread)


[info]rssh
2008-05-08 09:59 pm UTC (link)
О - А я о нем не знал. Спасибо !

(Reply to this) (Parent)


Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…