PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : آموزشی آموزش جستجوی فارسی در اینترنت



آبجی
24th January 2010, 12:13 AM
خط فارسی در اینترنت دارای مشکلات مختلفی است که در جستجو و بازیابی اطلاعات، مسائل و مشکلات فراوانی را فراروی کاربران اینترنت قرار می دهد. به خصوص با رشد سریع انتشارات الکترونیکی بر روی وب در شکل های مختلف پایگاه های اطلاعاتی، وبلاگ و… هیچ قاعده مشخص و ثابتی برای رسم الخط فارسی وجود ندارد و این مسأله باعث شده تا جستجوگران مطالب فارسی با مشکلات فراوانی روبرو شوند.
اینترنت به عنوان یک محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانه ها عمده ترین مزیت اینترنت محسوب می شود.
این توانایی که هر کس ناشر آثار خود باشد عواقب ناخواسته ای را نیز در پی خواهد داشت و آشکارترین معضل، آن است که انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم می آورد. افزایش سریع منابع اینترنتی نیازمند یک سازمان دهی مفید و مؤثر است. هرچند در حال حاضر راهنمای هایی برای منابع اینترنتی تهیه شده است که براساس فایل های ساخته شده توسط موتورهای جستجو و با استفاده از قابلیت های مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود کردن یک جستجو به بخش خاصی از رکورد (مانند عنوان، آدرس) کوتاه سازی کلمات، جستجوی نزدیک یابی واژه ها، ایجاد محدودیت زمانی و منطقه ای و زبانی و …. به جستجوی اطلاعات کمک می کند اما باید تأکید کرد که در امر بازیابی اطلاعات از اینترنت بدون نمایه سازی نظام یافته نمی توان انتظار بازیابی مفید و مؤثر را داشت.
هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و کاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان می دهند و از آن جایی که زبان غالب در اینترنت انگلیسی است، جستجو به زبان های غیرانگلیسی از جمله فارسی، مسایل و مشکلات مختلفی را جدای از مشکلات عمومی اینترنت دارد.
حجم اطلاعات به زبان فارسی در روی اینترنت در اشکال مختلف آن به سرعت رشد کرده است. در حال حاضر توسعه وبلاگ های فارسی، سایت های علمی، تبلیغاتی و دانشگاهی به زبان فارسی باعث شده است که جایگاه زبان فارسی تا حد زبان اول ارتباطات اینترنتی نزد ایرانیان و فارسی زبانان در سراسر جهان ارتقاء یابد.

آبجی
24th January 2010, 12:15 AM
بدون شک دومین موج نیز با شروع به کار سایت پرشین بلاگ که امکان راه اندازی وبلاگ برای کاربران فارسی زبان را با سهولت بیش تری فراهم شدآغاز شده است.
اما پیامد قابل توجه دیگری که رشد وبلاگ نویسی در ایران داشته است پیدایش سایت های اینترنتی فارسی زبانی است که صاحبان وبلاگ ها ایجاد کرده اند و این خود موج جدیدی از گسترش کاربرد اینترنت در جامعه ایران به حساب می آید. اکنون روی آوردن برخی از روزنامه نگاران، پژوهش گران، دانشجویان به وب فارسی و استفاده از منابع خبری، علمی و …. موجب تقویت نقش رسانه ای وب فارسی شده است.

پدیده دیگری که باعث گسترش زبان و خط فارسی در اینترنت شده است، ایجاد کتابخانه های دیجیتالی فارسی در شبکه جهانی است. با این که از شکل گیری کتابخانه های فارسی در شبکه جهانی مدت زیادی نمی گذرد، اما با این حال به سرعت در حال رشد و گسترش است.
شماری از این کتابخانه ها در پایگاه های اینترنتی شکل گرفته اند و بسیاری وبلاگ هایی هستند که برای این کار راه اندازی شده اند. از ویژگی های این کتابخانه ها این است که هیچ یک جنبه تجاری ندارند. آنچه در بسیاری از کتابخانه های مجازی فارسی در دسترس است فقط شامل کتاب نیست، بلکه نوشته هایی اعم از داستان، مقاله، تک نگاشت و …. نیز در میان مجموعه ها دیده می شود. هم چنین آثاری که احتمالاً هیچ گاه چاپ کاغذی ندارند و البته وجود کتاب هایی که مدت هاست نایاب هستند و مجال انتشار دوباره نیافته اند و یا آثاری که امروز به دلایلی بازچاپ آن ها مقدور نیست، از جاذبه های کتابخانه های مجازی اند.

کاربران به دلایل مختلفی از قبیل دسترسی آسان و ارزان به حجم عظیم اطلاعات، عدم نیاز اطلاعات یافته شده از اینترنت به تایپ مجدد، دسترسی سریع و اطلاعات جدید، صرفه جویی در وقت و عدم تسلط اکثر کاربران به زبان انگلیسی که زبان غالب بر اینترنت است به دنبال اطلاعات فارسی از اینترنت هستند. گسترش زبان و انبوهی از نوشتارها ایجاب می کند که خط ضابطه داشته باشد و از سوی دیگر پیشرفت فناوری و پیدایش اینترنت خواستار ضابطه و قانونمندی است.
اطلاع رسانی که جنبه بین الملی پیدا کرده است بدون دستور خطی سامان یافته و نظام مند میسر نیست و دست کم بر دشواری ها می آفریند. در حال حاضر وبلاگ های فارسی مقام دوم یا سوم را در جهان دارا می باشد. به نظر دکتر آشوری، اگر زبان فارسی به همین صورت بی دقت در اینترنت به کار رود در سطح زبانی برای تفنن باقی خواهد ماند و کم تر حرفی جدی به این زبان زده خواهد شد. آینده زبان فارسی در اینترنت بستگی به این دارد که نویسندگان فارسی تا چه حد کار خود را جدی بگیرند و این زبان را بازسازی کنند که از لحاظ قدرت بیان و دقت مفاهیم و استواری ساختار دستوری به زبان انگلیسی نزدیک شود.

آبجی
24th January 2010, 12:16 AM
جستجوی اطلاعات در اینترنت به دو روش می تواند صورت گیرد:

1- استفاده از جملات زبان محاوره ای
2- بکارگیری کلمات کلیدی.

جستجو با استفاده از جملات زبان محاوره ای
در روش استفاده از جملات زبان محاوره ای که اغلب به کاربران تازه کار پیشنهاد می شود. یکی از عیب های بزرگ این روش تعداد نتایج جستجوی زیادی است که بازگردانده می شود. به همین دلیل این روش توسط کاربران حرفه ای و حتی توسط همه، کم تر استفاده می شود.

جستجو به روش به کارگیری کلمات کلیدی
یکی از کاراترین و مقتدرترین روش های جستجوی اطلاعات در دنیای وب استفاده از واژه هایی است که اصطلاحاً کلمات کلیدی نامیده می شوند. اغلب کاربران حرفه ای و جستجوگران ورزیده دنیای اینترنت می توانند با طرح بهترین کلمات کلیدی و بکار بستن قوانین ترکیب آن ها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند. در این روش توصیه های زیر برای انتخاب کلمات کلیدی و نیز جستجوی دقیق و مفید پیشنهاد می شود که در ادامه به آنها می پردازیم.

آبجی
24th January 2010, 12:17 AM
۱) حتی المقدور سعی شود کلمات کلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب شود.

۲) حتی المقدور از آوردن کلمات عمومی که عناوین بسیاری را در زیر مجموعه خود شامل می شوند، جداً خودداری کنید.

۳) همیشه اسم شخص یا نام شی یا هر چیز دیگری را که مد نظر دارید به طور کامل وارد کنید.

۴) دقت کنید که اگر موتور جستجو میان حروف بزرگ و کوچک تفاوتی می گذارد، این مسأله را در طرح کلمات کلیدی خود مدنظر داشته باشید. (در جستجوی زبان فارسی این تفاوت وجود دارد)

۵) در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد می تواند از یک اشتباه تایپی باشد.

۶) اگر املای صحیح و کامل کلمه ای را نمی دانید از کارکتر جانشین که اغلب * و یا ? است استفاده کنید.

۷) اگر یک کلمه کلیدی را برای طرح دقیق و تمام و کمال یک مورد جستجو کفایت نمی کند، از تکنیک های جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (and، or، not) استفاده کنید. جستجوی عبارتی یکی از مهم ترین و قدرتمندترین امکانات جستجو در اغلب موتورهای جستجو می باشد و می توان یک عبارت یا جمله مشخص را به همان ترتیبی که کلمات وارد شده اند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه " بگذارید.

۸) استفاده از عملگر and :
به مفهوم و برای محدود کردن دامنه جستجو از طریق ترکیب کلید واژه های مختلف به کار می رود و برای ترکیب کلیدهای جستجو زمانی که برای شما مهم است که دو یا چند کلمه کلیدی حتماً وجود داشته باشد و علامت آن در پایگاه های مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) به وسیله کلیک کردن روی دکمه های رادیویی است.

۹) استفاده از عملگر or :
اپراتور or به مفهوم یا و برخلاف عملگر and باعث گسترش دامنه جستجو و بازیابی اطلاعات بیش تر شده برای ترکیب کلید واژه های جستجو زمانی که انتظار دارید فقط یک، دو یا چند کلمه کلیدی حضور داشته باشند و علامت آن استفاده از عبارت or، چگونگی اجرای ساده و معمولی آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با کلیک بر روی دکمه های رادیویی می باشد. یکی از کاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط یا با املاهای متفاوت است.

۱۰) استفاده از عملگر not :
اپراتور not به مفهوم نه و یا به جز که در این صورت همه جواب های بازگشتی که حاوی عبارت یا کلمه کلیدی هستند حذف خواهند گردید و برای اجرای آن فقط کافیست که not را قبل از عبارت یا کلمه کلیدی مورد نظرتان با یک فاصله بیاورید.

آبجی
24th January 2010, 12:17 AM
۱۱) استفاده از کوتاه سازی کلید واژه ها:
این تکنیک به ما امکان می دهد که با وارد کردن بخشی از یک کلید واژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی کنیم. اکثر موتورهای جستجو این تکنیک را با استفاده از علامت ستاره (*) ارائه می دهند. یکی از مشکلات استفاده از این تکنیک این است که باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی می شود.

۱۲) استفاده از عملگر نزدیک یابی:
در بسیاری از موارد استفاده از عملگر and باعث بازیابی اطلاعاتی می شود که برای ما مفید نیست. به این دلیل که این عملگر کلید واژه ها را در هر کجای متن که باشند بازیابی می کند. در این موارد استفاده از تکنیک نزدیک یابی می تواند از ریزش کاذب اطلاعات و یا بازیابی اطلاعات غیرمرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تکنیک را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا می توان با استفاده از عملگر near از این تکنیک استفاده نمود.

۱۳) جستجوی ترکیبی با استفاده از پرانتز:
این تکنیک یکی از مهم ترین تکنیک های جستجو می باشد که به وسیله آن می توان تا حدود زیادی از بازیابی موارد غیرمرتبط در محیط وب جلوگیری کرد. در این روش می توان از همه عملگرهای جستجو که در بالا گفته شده یک جا استفاده کرد و آن ها را با هم دیگر ترکیب نمود.

۱۴) جستجوی کلیدواژه در عنوان صفحات وب:
این تکنیک با این پیش فرض که عنوان یک صفحه وب تا حدود زیادی نمایان گر محتوای اطلاعات موجود در آن است به جستجوی واژه های کلیدی در عنوان سایت ها می پردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینه های دیگر این امکان را فراهم می آورند.

۱۵) جستجوی حوزه سایت ها:
با توجه به این که به صورت قراردادی هر کشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایت ها به ما این امکان را می دهد که فرایند جستجو را به حوزه خاصی نظیر سایت های وب ایران (ir) و یا سایت های وب سازمان های غیر انتفاعی (org) محدود کنیم. دستورات استفاده از این تکنیک در موتورهای جستجو مختلف می باشد. در نظر داشته باشید که به دلیل محدودیت فعلی در تعداد نامهای سایتها این موضوع عملا کارایی خود را از دست داده است

۱۶) محدود کردن جستجو به زبان های مختلف باعث می شود نتایج جستجو به زبان های دیگر آورده نشود و انتخاب مطلب مورد نظر آسان تر است.

۱۷) محدود کردن جستجو به تاریخ انتشار منابع در وب:
تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و این گونه محدودیت باعث می شود بنا به نیاز کاربر جدیدترین و یا قدیمی ترین منبع بازیابی بشود.

۱۸) جستجوی رسانه های مختلف؛ موسیقی، عکس، ویدئو:
زمانی که فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی که به عکس یک شخصیت نیاز داریم، جستجو در میان عکس ها باعث می شود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.

۱۹) جستجوی صفحات با فرمت های مختلف:
Pdf، word، mp۳، mpeg. زمانی که فرمت خاصی مورد نظر است می توان از این تکنیک استفاده کرد .
به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت pdf باشد، این تکنیک می تواند مفید باشد.

۲۰) آگاهی از پیش فرض های جستجو در موتور جستجو:
با توجه به این که هر موتور جستجو برای ترکیب واژه ها یک پیش فرض دارد و اگر از هیچ گونه عملگری استفاده نشود، کلید واژه ها را به صورت پیش فرض با یکی از عملگرهای جبر بولی ترکیب می کند؛ آگاهی از این پیش فرض موتورهای جستجوی مختلف مهارت ما را در جستجو بالا می برد.

۲۱) وب نامریی:
وب نامرئی به دو دلیل کمی و کیفی اهمیت دارد کمی از این نظر که موتورهای جستجو فقط قادر هستند حدود ۱۶ درصد از اطلاعات موجود در اینترنت را بازیابی کنند و اندازه وب نامرئی تقریباً ۵۰۰ برابر وب مرئی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولاً ارزشمند و مفید هستند و در بسیاری از موارد پاسخ گوی نیاز کاربران می باشند. آشنایی با ابزارهایی که برای شناسایی منابع وب نامرئی به وجود آمده اند و کاربران را به سایت های مناسب راهنمایی می کنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند می شود. مثل سایت invisibleweb که فهرستی از منابع نامرئی را و سایت completeplaset که فهرستی از تقریباً ۴۰۰۰۰ پایگاه اطلاعاتی وب نامرئی را ارائه می دهد.

استفاده از تمامی مطالب سایت تنها با ذکر منبع آن به نام سایت علمی نخبگان جوان و ذکر آدرس سایت مجاز است

استفاده از نام و برند نخبگان جوان به هر نحو توسط سایر سایت ها ممنوع بوده و پیگرد قانونی دارد