آبجی
21st February 2010, 04:23 PM
زبانهای طبیعی، همگی دارای ابهام هستند. کلمات هر زبانی میتواند چندین معنی و مفهوم داشته باشد. به عنوان مثال، اگر شما لغت game را در یک فرهنگلغت جستجو کنید، معانی مختلفی برای آن وجود دارد، از “بازی” گرفته تا “گوشت شکار”، که اصلا هیچ شباهتی به یکدیگر ندارند. معانی این کلمات، بسته به کاربرد آن در جمله و یک متن، تا حدودی مشخص میشود. این ابهام، در کاربردهایی مانند سیستمهای ترجمه ماشینی به عنوان یک مشکل شناخته میشود. البته همین ابهام کاربردهای زیبایی هم دارد. مثلا این امکان را فراهم میکند تا افرادی مانند حافظ، متنهای شاعرانه و کنایهآمیز بنویسند و خواننده را در یک محدوده برای برداشت معانی دلخواه خود آزاد بگذارند. ولی گذشته از این کاربردهای زیبا، همانگونه که گفته شد، در توسعه سیستمهای کامپیوتری که به منظور پردازش زبان طبیعی بکار میروند، مشکل ایجاد میکند و به عنوان مثال، باعث میشود تا نتوان ترجمه متون از یک زبان به زبان دیگر را کاملا به صورت اتوماتیک انجام داد. از اوایل دهه ۹۰ میلادی، محققان عرصه کامپیوتر، بر آن شدند تا روشی را برای بیان صریح مفاهیم موجود در دنیای واقعی، پیدا کنند. Ontology یا هستانشناسی یک چنین کاری برای ما انجام میدهد. یک Ontology گرافی است که گرههای آن مفاهیم موجود در دنیای واقعی را مشخص میکند و یالهای آن، ارتباطات موجود بین این مفاهیم را.
WordNet لغتنامهای است که از یک Ontology برای دستهبندی مفاهیم موجود در دنیای واقعی استفاده کرده است و کلمات انگلیسی را اعم از اسم، فعل، صفت و قید را به این مفاهیم نسبت داده است. به عنوان مثال، اگر کلمه iran را در این لغتنامه جستجو کنید، نتیجه زیر بدست میآید:
۱ sense of iran
Sense 1
Iran, Islamic Republic of Iran, Persia — (a theocratic Islamic republic in the Middle East in western Asia; Iran was the core of the ancient empire that was known as Persia until 1935; rich in oil)
INSTANCE OF => Asian country, Asian nation
=>country, state, land
=>administrative district, administrative division, territorial division
=>district, territory, territorial dominion, dominion
=>region
=>location
=>object, physical object
=>physical entity
=>entity
این نتیجه، نشان میدهد که برای کلمه iran تنها یک مفهوم وجود دارد که کشور ایران میباشد و توضیحات آنرا در ابتدا آورده است. سپس مشخص میکند که کلمه iran یک نمونه از مفهوم کشورهای آسیای میباشد(Asian Country) و بهمین ترتیب کشورهای آسیایی یک جور کشور هستند و بهمین ترتیب ادامه میدهد تا به مفهوم Entity میرسد که تمام مفاهیم موجود در دنیا از این مفهوم شروع میشوند. به عبارت دیگر، برای تشخیص مفاهیم موجود در دنیای واقعی، مفاهیم از کل به جزء شکسته شدهاند تا به یک نمونه خاص مانند iran میرسیم. روابط مهمی که بین مفاهیم وجود دارد عبارتند از : kind of، part of، member of، instance of.
Kind of یک رابطه عام به خاص را مشخص میکند. مانند رابطه بین مفهوم Asian Country و country. یعنی یک کشور آسیایی یک کشور است. Part of رابطه کل به جزء را بیان میکند. مانند رابطه بین iran و Asia. Member of رابطه عضویت را مشخص میکند. مانند رابطه بین iran و OPEC. یعنی ایران عضوی از اوپک است. و بلاخره رابطه instance of یعنی یک نمونه واقعی از یک مفهوم را میخواهیم مشخص میکنیم. مانند رابطه بین iran و Asian Country. یعنی کشور ایران یک نمونه واقعی از مفهوم کشور آسیایی است.
این لغتنامه توسط دانشگاه Princeton (http://www.princeton.edu/) توسعه داده شده است و آدرس اینترنتی مربوط به آن نیز wordnet.princeton.edu (http://wordnet.princeton.edu/) میباشد. هماکنون نسخه ۲/۱ این لغتنامه از طریق آدرس اینترنتی آن به صورت رایگان قابل دریافت میباشد.
WordNet لغتنامهای است که از یک Ontology برای دستهبندی مفاهیم موجود در دنیای واقعی استفاده کرده است و کلمات انگلیسی را اعم از اسم، فعل، صفت و قید را به این مفاهیم نسبت داده است. به عنوان مثال، اگر کلمه iran را در این لغتنامه جستجو کنید، نتیجه زیر بدست میآید:
۱ sense of iran
Sense 1
Iran, Islamic Republic of Iran, Persia — (a theocratic Islamic republic in the Middle East in western Asia; Iran was the core of the ancient empire that was known as Persia until 1935; rich in oil)
INSTANCE OF => Asian country, Asian nation
=>country, state, land
=>administrative district, administrative division, territorial division
=>district, territory, territorial dominion, dominion
=>region
=>location
=>object, physical object
=>physical entity
=>entity
این نتیجه، نشان میدهد که برای کلمه iran تنها یک مفهوم وجود دارد که کشور ایران میباشد و توضیحات آنرا در ابتدا آورده است. سپس مشخص میکند که کلمه iran یک نمونه از مفهوم کشورهای آسیای میباشد(Asian Country) و بهمین ترتیب کشورهای آسیایی یک جور کشور هستند و بهمین ترتیب ادامه میدهد تا به مفهوم Entity میرسد که تمام مفاهیم موجود در دنیا از این مفهوم شروع میشوند. به عبارت دیگر، برای تشخیص مفاهیم موجود در دنیای واقعی، مفاهیم از کل به جزء شکسته شدهاند تا به یک نمونه خاص مانند iran میرسیم. روابط مهمی که بین مفاهیم وجود دارد عبارتند از : kind of، part of، member of، instance of.
Kind of یک رابطه عام به خاص را مشخص میکند. مانند رابطه بین مفهوم Asian Country و country. یعنی یک کشور آسیایی یک کشور است. Part of رابطه کل به جزء را بیان میکند. مانند رابطه بین iran و Asia. Member of رابطه عضویت را مشخص میکند. مانند رابطه بین iran و OPEC. یعنی ایران عضوی از اوپک است. و بلاخره رابطه instance of یعنی یک نمونه واقعی از یک مفهوم را میخواهیم مشخص میکنیم. مانند رابطه بین iran و Asian Country. یعنی کشور ایران یک نمونه واقعی از مفهوم کشور آسیایی است.
این لغتنامه توسط دانشگاه Princeton (http://www.princeton.edu/) توسعه داده شده است و آدرس اینترنتی مربوط به آن نیز wordnet.princeton.edu (http://wordnet.princeton.edu/) میباشد. هماکنون نسخه ۲/۱ این لغتنامه از طریق آدرس اینترنتی آن به صورت رایگان قابل دریافت میباشد.