المساعد الشخصي الرقمي


مشاهدة النسخة كاملة : أأأمين المصادر تعرف على ...


صفيه أنديجاني
25-04-2011, 04:09 PM
http://photos.azyya.com/store/up2/081209113212psL4.gif

عزيزي / عزيزتي
امين/ة مصادر التعلم
مما لاشك فيه أن ما تقوم به من عمل داخل المدرسة أو في اي مركز من مصادر التعلم
يعد دوراً رئيساً وهاماً في إحياء هذا المركز ونجاحه
ومن أسباب النجاح المعرفة في مجال العمل وتطويرها وصقلها
وإليك أنقل وأهدي هذه المقالة من سلسة مقالات ومواضيع سوف أدرجها في هذه المشاركة
لنشر الوعي الثقافي لأمناء مراكز مصادر التعلم والمكتبات المدرسية
ونطلب منكم المشاركة الفاعلة والمثمرة وإليكم أول الغيث

نــظــم الــتــوثـيـــق

: وهي مقالة للدكتور :بشار عباس
تعود بدايات التوثيق إلى عصور ما قبل التاريخ ، أي أن بدايات التوثيق سبقت التدوين الكتابي ، ذلك أن التوثيق بمفهومه الواسع ، أي حفظ الأحداث التاريخية و المعلومات العلمية و نقلها إلى الأشخاص الذين يمكنهم الاستفادة منها ، ينطبق أيضاً على التناقل الشفاهـي للمعلومات و المعـارف و المهارات ، و لا بد أن نتذكر أن الشعر الجاهلي أسهم في توثيق تاريخ العرب قبل الإسـلام ، وأن ملاحـم هوميروس الشاعر الإغريقي الأعمـى " وثقت " فترة تاريخية كانت غائرة في عمق الذاكرة الإغريقية ، و أن التناقل الشفاهي لملحمتي الأوذيـسة و الإلياذة كان من أول أشكال التوثيق الشفاهي و ذلك قبل تدوينهما بقرون عديدة . و عندما ننظر إلى التوثيق في تاريخ العالم القديم نستطيع أن نلمح أهم محطاته :
* وصلت الحضارتان السومرية و المصرية إلى مستوى عالٍ من
الكتابة التصويرية ، التي اسـتوعبت تدوين الشـعر و الطـب
و المعتقدات الدينية و العلوم .
* اكتشف المصريون نحو 2500 قبل الميلاد ورق البردي ، و بذلك
أصبح من الممكن تبادل الوثائق ، و نقل المعلومات المدونـة من
مكان إلى آخر.
* اكتشف السومريون نحو 1700 قبل الميلاد وسـيطاً آخر و هو
الكتابة على ألواح فخارية ( الرقـم ) و سـجلوا عليها بالكتابة
المسمارية تاريخهم وعلومهم و مبادلاتهم التجارية ، وذلك بعد أن
طوروا كتابتهم التصويرية القديمة إلى كتابة مسمارية .
* ظهرت أولى المكتبات المنظمة و المصنفة في العالم في مصر
و بلاد ما بين النهرين في الألف الثانية قبل الميلاد .
* في القرن الثامن قبل الميلاد ظهرت في سـورية أول أبجدية فتحت
الطريق أمام الانتشار الواسع للكتابة في العالم القديم ، و أثرت على
الأبجدية اليونانية و التي انطلقت منها فيما بعد الأبجدية اللاتينية .
* في الفترة ( 1450- 1456 ) م أخرجت مطبعة يوحنا غوتنبرغ
أول كتاب مطبوع يتكون من 42 سطراً من الإنجيل ، مما منح
البشرية إمكانية النشر الواسع للنصوص المكتوبة .
* في القرن التاسع عشر ظهر نظام تصنيف ديوي Melvil Dewey،
و هو أشهر و أهم نظم تصنيف المكتبات حتى اليوم .
2- تعـريــف عـلـم الـتـوثيــق :
تختلف تعريفات علم التوثيق باختلاف النقطة التي نرغب بالتركيز عليها ، و لعل أهم و أفضل هذه التعريفات هو :
" التوثيق هو علم السيطرة على المعلومات " .
ذلك أن هذا التعريف ينطبق على نظم التوثيق التقليدية . كما يستوعب الاتجاهات الحديثة لهذا العلم ، فالمعلومات يمكن أن تتضمن جميع أشكال حاويات المعلومات بدءاً من الوثيقة و الكتاب و انتهاء بالصورة و التسجيلات الصوتية و الفيديوية و النصوص الإلكترونية ، كما أن مفهوم السيطرة يتضمن العمليات الفنية التقليدية كالتجميع و الاختزان و الفهرسة و التصنيف و التكشيف ، كما يتضمن الاتجاهات الحديثة كمحركات البحث و المكانز الآلية و الفهرسة الآلية .
3- نـظـم الـتـوثـيـق الـتـقـلـيـديـة :
في القرن التاسع عشر بدأت ملامح ظاهرة انفجار المعلومات بالإعلان عن نفسها ، مما دفع بالموثقين إلى استكشاف أساليب جديدة تساعدهم في مواجهة هذه الظاهرة ، و قد كان التحذير الذي ورد على لسان جوزيف هنري ، و هو أحد أهم العاملين في مجـال المكتبات في الولايات المتحـدة و بريطانيا ، إذ أسهم في إنشاء 380 مكتبة في هذين البلدين ، وقد عبر عن قلقه تجاه مستقبل التوثيق عام 1851 قائلاً :
" لقد أثبتت التقديرات أن مقدار ما ينشر سنوياً من مصادر المعلومات ، يبلغ نحو عشرين ألفاً من المجلدات ، بما فيها النشرات ، و تعد كلها إضافة إلى رصيد المعرفة البشرية ، و مالم ترتب هذه الكميات الضخمة بطريقة ملائمة فسوف يضل الباحثون سبيلهم بين أكداس الإنتاج الفكري ، كما أن تل المعلومات سوف يتداعى تحت وطأة وزنه " .
و يمكن أن نقول أن علم التوثيق الحديث انطلق في القرن التاسع عشر، حيث شهد هذا القرن ولادة نظام ديوي للتصنيف ، و شهد انطلاق معظم الأساليب المستخدمة فيما بعد في مجال التوثيق و وضع أسسها العلمية كالفهرسـة و التكشيف و التحليل الموضوعي و التصنيف و الاستخـلاص ، و نوجز فيما يلي أهم الأدوات المستخدمة في نظم التوثيق التقليدية :
* الكشافات : هي إحدى الأدوات الأساسية المستخدمة في استرجاع
المعلومات ، و تعنـى الكشافات بتنظيم المقالات و الدراسـات
و البحوث داخل الدوريات أو الصحف أو الكتب ، و يكون تنظيم
الكشافات إما موضوعياً أو ألفبائياً أو زمنياً أو رقمياً .
* المستخلصات : هي ملخصات دقيقة تبنى بصورة علمية وفقاً لقواعد
الاستخلاص التي تتوخى تضمين الملخص كل العناصر الموجودة
في المادة الأصلية ، وتصاغ بأسلوب مشـابه للوثيقة الأصلية مع
وصف ببليوغرافي يسهل استرجاع الوثيقة الأصلية .
و تتنوع المستخلصات وفقاً للهدف من إنشائها فهنالك المستخلصات
الوصفية و المستخلصات الإعـلامية و المستخلصات الموجـزة
(التلغرافية ) .
* الأدلـة : تفيد في الوصول إلى المعلومات الجارية و المتجددة
و تعرف بأنواعها و أماكن وجودها ، و هنالك أنواع عديدة من
الأدلة نوجز أهمها فيما يلي :
- أدلة الأفراد : تعرف بالخبراء المتخصصين في مجال معين .
- أدلـة الهيئات و الجمعيات و المنظمات الدوليـة : تعرف بهـذه الجهات و أعمالها و أقسامها و مهامها و أنظمتها و خدماتها .
- أدلة الدوريات : تعرف بالدوريات و تخصصها و أماكن صدورها .
- أدلة المؤتمرات و حلقات البحث : تعرف بالندوات و غاياتها و أنواعها و أعمالها و توصياتها و البحوث الصادرة عنها .
- أدلة المواد السمعية و البصرية: تعرف بالأشـرطة الصوتية و الفيديوية و الأفلام و الصور و الشرائح الثابتة و الأقراص الليزرية .
* نظم التصنيف : هي إحدى الأدوات الأساسية المستخدمة في تنظيم
المكتبات و دور الأرشـيف ، و يغلب على نظم تصنيف المكتبات
و نظم تصنيف مراكز المعلومات الصحفيـة الطابع الموضوعي ،
و الانتقال من رأس الموضـوع العام إلى رؤوس الموضوعات
الفرعية ، في حين تعتمد دور الأرشـيف على تصنيف الوثائق
الورادة إليها وفقاً للجهة التي أصدرتها .
* نظم الفهرسة : و هي إحدى الأدوات الأساسية المستخدمة في تنظيم
مـواد المكتبات و دورالأرشـيف ، و تدل هذه النظم على طريقـة
وصـف أوعية المعلومات وفقاً لقواعد علمية موضوعة سلفاً بحيث
تغطي وصف وعاء المعلومات من جميع الجوانب الممكنة .
* المكانز : هي النظم التي تتضمن كلمات البحث الرئيسة ( الكلمات
المفتاحيـة ) و التي تستخـدم في تخزيـن المعلومات و من ثم
استرجاعها و غني عن البيان أن المكانز هي لغة مقيدة ، أي أن
الواصفات المستخـدمة في الإدخـال يجب أن تكون هـي ذاتها
المستخدمة في الاسترجاع .

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:20 PM
تكملة الموضوع:
4- نـظـم الـتـوثـيــق الحـديثـة :
لعل أول من أشار إلى ضرورة فتح آفاق جديدة أمام نظم استرجاع المعلومات ، بشكل يتجاوز نظم التوثيق التقليدية هو فانيفار بوش الذي كتب مقالاً عام 1945 قال فيه :
" يرجع عجزنا عن الوصول إلى الوثيقة . إلى حد بعيد إلى الافتعال و عدم الدقة في نظم التكشيف ، فحينما توضع بيانات من أي نوع في مكان الاختزان فإنها ترتب هجائياً أو رقمياً ، و يتم الوصول إلى المعلومات ( إذا تحقق ) بتتبعها من فرع إلى آخر"
ثم : " العقل البشـري لا يعمل بهذه الطريقة ، و إنما يعمل بتداعي المعاني أو ترابط الأفكـار ، فهو عندما يحصل على إحـدى المواد ينتقـل في التو و اللحظة إلى الأخرى التي اقترحها تداعي المعاني"
و بذلك يكون " فانيفار بوش " أول من دعا إلى تجاوز نظم التوثيق التقليدية ، و إن الأفكار التي طرحها عام 1945 ، كان لا بد أن تنتظر قبل تحقيقهـا ما يقارب نصـف قرن من الزمـن ، مع تطويـر تقنيات البحـث و الاسترجاع و اعتماد محركات البحث و المكانز الآلية و الشبكات العصبونية ، و مع ظهور النص الفائق ( الممنهل ) Hypertext .
و اليوم تعتمد المكتبات الكبرى في العالم على نظم استرجاع متطورة ، و قد قامت مكتبة الكونجرس و المكتبة البريطانية بتحويل ملايين الكتب من شكلها الورقي إلى الشكل الرقمي ، حيث أصبح بالإمكان اليوم إجراء بحث متطور ليس فقط في عناوين الكتب و موضوعاتها و كلماتها المفتاحيـة ، بل و من خلال البحث عن أية كلمة وردت في الكتاب .
و نوجز فيما يلي أهم الأدوات المستخدمة في نظم التوثيق الإلكترونية الحديثة :
* محرك البحث : و هو برنامج ذكي يبحث عن الكلمات و مرادفاتها
في نصوص الكتب أو الوثائق المخزنـة رقمياً ، أو إذا لم تكـن
النصوص مخزنة بشكلها الكامل فإنه يستطيع البحث في نصوص
الملخصات ، كما تتميز بعض هذه المحركات بذكائها و بإمكانيـة
التعلم ،أي أنها يمكن أن تطور أساليب بحثها ذاتياً من خلال تقويم
نتائج البحث و مدى مطابقتها و تلبيتها لحاجات المستفيد في كـل
مرة.
* المكنز الآلي : و هو نظام ذكي يعتمد على استخراج الواصفات من
النصوص المخزنة و إقامة علاقات ترابـط فيما بينها من العام إلى
الخاص و علاقات ترادف ، و يقوم بتطوير و تعديل هذه العلاقات
بشكل آلي ، من خلال تقويم نتائج البحث و مدى مطابقتها و تلبيتها
لحاجات المستفيد .
* النصوص الفائقة ( الممنهلة ) : تقوم النصوص الفائقة ( الممنهلة )
Hypertext بالإحالة فوراً من نص يعالج موضـوع محـدد إلى
نصوص أخرى متعلقة بكلمة وردت في النص ، مما يشكل أساساً
متطوراً للمعلومات المتكاملة ، و يتطابق إلى حد بعيد مع التصور
الذي طرحه فانيفار بوش عام 1945 ، حيث أكد على الانتقال من
فكرة إلى أخرى وفقاً لتداعي المعاني ، و لكن هذا الانتقـال هنا لا
يعتمد على تداعي المعاني لدى القارىء و إنما لدى المؤلـف الذي
يتوقع أين يكمن تداعي المعاني في النص فيحيل في هذه المواقـع
أو الكلمات إلى نصوص أخرى مترابطة مع النص الأصلي .
5- نـظــم الأرشــفـة الـضـوئـيـة :
مع تعاظم حجم الوثائق الحكومية المخزنة في دور الأرشيف ، أصبح من العسير الوصـول إلى هذه الوثائق دون استخـدام الوسائل الإلكترونية ، و من الطبيعي أن الخطوة الأولى في هذا المجال هي إنشاء قواعد معطيات لتوصيف هذه الوثائق و تسهيل الوصول إليها ، أما الخطوة الثانية فهي ربط هذه القاعدة مع مكنز للواصفات التي تحدد بدقة الموضوعات المتعلقة بهذه الوثائق ، إلا أن الشكل الأحدث لحفظ الوثائق الورقية يتمثل دون شك في إنشاء نظام الأرشفة الضوئية ، الذي يضمن عدم المساس بالوثيقة الأصلية ، فهو يحيل المستفيد إلى صورة الوثيقة المخزنة في الحاسوب بسهولة وسرعة.
إلا أن النظم الأحدث للأرشفة الضوئية تربط صورة الوثيقة بنظام التعرف على الأحرف ضوئياً OCR ، وبالتالي يستطيع المستفيد أن يشاهد صورة الوثيقة بشكلها الأصلي مع الأختام والتواقيع ، وفي الوقت نفسه يستطيع أن يستفيد من البحث في النص الكامل للوثيقة بعد قراءتها آلياً باستخدام نظام OCR .
6 ـ نـظـام الأرشــيـف الـرقـمــي :
شهد العقد الأخير من القرن العشرين تطورات كبيرة في مجال تطبيقات تكنولوجيا المعلومات والاتصالات في مجال الإدارة ، وبذلك أمكن تقنياً معالجة المعلومات المطلوبة و نقلها في جميع أقسام المؤسسات الرسمية المتباعدة جغرافياً ، تماماً كما لو أن موظفي المؤسسة يعملون في مبنى واحد، وهكذا ظهر اهتمام الأرشيفيين بحفظ واسترجاع هذه الوثائق الرسمية الإلكترونية التي تجري ضمن بيئة إلكترونية بحتة ، وفي جزء هام من هذه الحالات دون استخدام الورق .
إلا أن نجاح نظام الأرشيف الرقمي يتطلب عدة شروط نوجز أهمها فيما يلي :
* لا بد أن تتوافر في النظام المنشود حماية قوية تتحكم بأي تعديل
يطرأ على الوثيقة الأصلية ، وذلك من خلال إجراءات تحـدد
صلاحيات إنشاء الوثيقة بدقـة ، وتحتفظ بنسـخ عن الوثيقـة
الأصلية مع معلومات عن تاريخ إنشائها والجهة التي أنشأتها ،
كما تحتفظ بنسخ عن أية تعديلات أو إضافات تطرأ عليها مع
تاريخ التعديل والجهة التي قامت به .
* لا بد من حفظ جميع المعلومات المتعلقة بالسياق ، مثل علاقـة
الوثيقة بالوثائق الأخرى و الجهة التي أنشأت الوثيقة و الفعالية
التي أنشئت فيها الوثيقة .
* لا بد من حفظ جميع المعلومات المتعلقة ببنية الوثيقة كالتنسيق
وتسجيل استخدام المصطلحات والشكل والوسـط والحقـول
والجداول والهوامش والفصول والأجزاء والصور والأشكال
المتضمنة في الوثيقة .
* لابد من حفظ المعطيات الوصفية Meta Data حول الوثيقـة
وهي المعطيات التي تبين كـيفية تسـجيل الوثيقـة ونوعهـا
وموضوعها كما توضح خلفية الوثيقة والأجزاء والسلاسل كما
تتضمن معلومات عن محتوى الوثيقة .
* لا بد من الحفاظ على الوثيقة نفسها بصورة ملائمة للاستخـدام
عبر التطور التكنولوجي المتسارع ، وهذا يتطلب نسخ الوثيقـة
من النظام القديم إلى النظام الأحدث مع التأكيد على الحفاظ على
معلومات السياق والبنيـة والمعطيات الوصفية دون تغيير ، بما
في ذلك شكل الوثيقة وتنسيقها الداخلي .
7 ـ الـنـظــم الـمـتـكـامـلـة الـمـنـدمـجـة :
تتجه نظم التوثيق الحديثة حالياً إلى نظم متكاملة تتيح للمستفيد الذي يستفسر عن موضوع محدد ، مثلاً : إعلان الحرب العالمية الثانية ، أن يقرأ هذا الخبر من الصحف ثم يستمع إلى التسجيل الصوتي للخبر من الإذاعة ، ثم يمكن أن يشاهد أفلاماً وثائقية تسجيلية لأحداث بداية الحرب ، كل ذلك إلى جانب الوثائق الرسمية الصادرة عن الحكومات التي دخلت الحرب في بدايتها ، ونظم التوثيق هذه دخلت طور العمل فعلياً منذ عدة سنوات ، كما لا بد من التأكيد أن هذه النظم أصبحت متاحة على شبكة المعلومات الدولية ( الانترنت ) ، وتعتمد هذه النظم محركات بحث ذكية تبحث عن الكلمة المفتاحية ومرادفاتها ، كما تقبل في الوقت نفسه أسئلة باللغة الطبيعية .

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:22 PM
الفهرسة الآلية في المكتبات ومراكز المعلومات :
البحث عن المعلومات أساس المعرفة :
مشكلة التصنيف والبحث عن المعلومات مشكلة قديمة قدم المعرفة الإنسانية نفسها ، وقد تقدمت أساليب البحث عن المعلومات مع تقدم وتطور المعرفة الإنسانية وارتقت بارتقائها . أما تعبير انفجار الإنتاج الفكري فقد ظهر لأول مرة عام 1851م حيث حذر جوزيف هنري من نتائج هذا الانفجار قائلاً :
" مالم ترتب هذه الكميات الضخمة بطريقة ملائمة ، ومالم تعد لها الوسائل اللازمة للتحقق من محتوياتها ، فسوف يضل الباحثون سبيلهم بين أكداس الإنتاج الفكري ، كما أن تل المعلومات سوف يتداعى تحت وطأة وزنه ، ذلك إن الإضافات التي ستضاف إليه، سوف تؤدي إلى اتساع القاعدة ، دون الزيادة في ارتفاع الصرح ومتانته ".
وقد مضى على هذا التحذير حوالي قرن ونصف القرن من الزمن ، دون أن تتغير أهمية مضمونه . إذ إن الإنسان في كفاحه الدؤوب نحو اكتساب خبرات ومعارف جديدة وتسجيلها ، كان بحاجة دائماً إلى أدوات تساعده في تنسيق هذه المعلومات واسترجاعها بسهولة وسرعة ، وقد تطورت هذه الأدوات مع زيادة حجم المعلومات وتطور الوسائط المخزنة فيها .
واستطاع علم المكتبات أن يوفر أدوات أساسية لتصنيف وتحليل واسترجاع المعلومات ، مما سهل مهمات عمل الباحثين في النصف الأول من هذا القرن إلا أن تسارع وتيرة تضاعف حجم المعلومات وصولاً إلى ظاهرة (انفجار المعلومات) طرح من جديد مشكلة المعلومات كإحدى أهم المشكلات التي يواجهها علم المعلومات في النصف الثاني من القرن العشرين ، ولقد ترافق ذلك كله مع ظهور شبكة إنترنت التي اختلفت الآراء فيها ، فمنهم من أطلق عليها اسم المكتبة الإلكترونية ومنهم من تجاهل دورها كمصدر أساسي من مصادر المعلومات في نهاية القرن الماضي .
ونحاول في هذا الفصل أن نسهم في الحوار الدائر حول شبكة المعلومات الدولية : أهميتها ، وسائل الفهرسة الآلية المستخدمة فيها ، العلاقة بينها وبين المكتبات ، مدى إفادتها من علم المكتبات ؟

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:47 PM
الإنترنت والمكتبات :

وبالمقابل بدأت شبكة إنترنت تثبت جودها كمصدر مهم للمعلومات ، وهي تنافس في ذلك المكتبات التي كانت حتى وقت قريب المصدر الوحيد تقريباً للمعلومات ، وإن السؤال اليوم : ما فائدة الشبكة ؟ هو كالسؤال : ما فائدة الكتب ؟ فالشبكة اليوم توفر أجوبة ملائمة لأي استفسار حول معلومات عامة أم علمية أم اقتصادية أم حول الشؤون الحكومية أم المعلومات المتعلقة بالأشخاص ، ويزداد كل يوم عدد المشتركين في إنترنت ، كما يزداد عدد الناشرين فيها ، وذلك بعد أن أصبح النشر في إنترنت سهلاً ، وأصبح بإمكان الأفراد غير المتخصصين أن يستخدموا إنترنت ليس للبحث عن المعلومات فقط وإنما أيضاً لنشر ما يرغبون أو ما يعتقدون أنه قد يفيد مشتركين آخرين في إنترنت .
ومع الاهتمام المتزايد بإنترنت ، سارعت الشركات إلى استثمار هذه الظاهرة، وأسست مواقعها التي تتضمن معلومات تفصيلية وشاملة عن أعمالها واستثماراتها ومنتجاتها ودعايات بهدف ترويج مبيعاتها ، ولا نرى نظيراً لتوجه هذه الأعداد المتزايدة نحو إنترنت سوى الهجرات الجماعية التي شهدها الغرب الأمريكي بحثاً عن مناجم الذهب ، وهو ما عرف في ذلك الوقت باسم ( حمى الذهب ) ، مما أدى إلى استمرار توسع مناجم الذهب لفترة طويلة .
ولعل هذا التوسع المستمر هو إحدى الظواهر الإيجابية التي جعلت إنترنت أكثر آليات نشر المعلومات اتساعاً ، حيث يستطيع الباحث العثور على كل ما يحتاجه في بحوثه من معلومات .
إلا أن هذا التوسع يشكل في الوقت نفسه نقطة الضعف الكبرى في شبكة إنترنت ، فهنالك كمية هائلة جداً من المعلومات تضاف يومياً إلى إنترنت . وهي معلومات متنوعة جداً ، مثل الألعاب والإعلانات التجارية والبيانات الخام العلمية والأعمال المالية ومجموعات النقاش والبريد الإلكتروني والمؤتمرات الفيديوية والمواقع التي تسمح للمستفيد بزيارة المدن والمتاحف والأسواق وفهارس المكتبات العامة وملخصات التقارير التكنولوجية وقواعد بيانات النص الممنهل HTML ، وهذا التنوع الشديد يجعل تصنيف كل هذه المواد وبالتالي العثور عليها صعباً جداً، حيث أن الاستفادة من الفهارس الآلية في عملية البحث عبر الإنترنت كثيراً ما تقودنا إلى نتائج تكثر فيها الوثائق البعيدة عن الموضوع المطلوب، وقد تفشل في جلب بعض الوثائق المهمة في مجال موضوع البحث .
نقطة ضعف إنترنت الكبرى هي أن كثيراً من معلوماتها عابرة ومؤقتة وتخزن في قواعد عديمة الشكل ومشوشة ، إذ أن إنترنت وخصوصاً مواقعها في ( رابطة الشبكة العالمية www ) لم تصمم لدعم النشر المنظم واسترجاع المعلومات كما في المكتبات . وباختصار ، الشبكة ليست مكتبة رقمية ، ولكي تستمر وتزدهر، ستحتاج للاستفادة من الخدمات التقليدية للمكتبة بهدف تنظيم استرجاع المعلومات من الشبكة . ويأمل المستفيدون من الإنترنت أن تستطيع هذه الشبكة الإفادة من مهارات المكتبيين في التصنيف والاختيار بالتنسيق مع إمكانات علماء البرمجة الحاسوب من أجل أتمتة مهام فهرسة وحفظ واسترجاع المعلومات.

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:49 PM
التعريف بمحركات البحث :

حتى هذه اللحظة تتحمل التقانات الحاسوبية العبء الأكبر من مسؤولية تنظيم المعلومات في إنترنت ، لأن الاعتماد الكلي على المفهرسين البشريين سيجعل من المستحيل مواجهة هذا الإغراق اليومي لإنترنت بكم هائل متجدد من المعلومات ، ولذلك كان لا بد من اللجوء إلى البرامج الآلية التي تقرأ صفحات مواقع الإنترنت وتصنفها وتفهرس البيانات الرقمية . وقد لجأ مستثمرو إنترنت إلى هذا الحل البسيط مستفيدين من الانخفاض السريع والمستمر لأسعار الحواسب والبرمجيات ، مما يجنبهم النفقات الباهظة للفهرسة البشرية ، ومما يساعدهم في إنجاز الفهرسة المطلوبة بسرعة مناسبة لتوسع إنترنت المستمر ، وبما لا يقارن ببطء الفهرسة البشرية .
ولكن ، هل الفهرسة الآلية هي حقاً الحل المناسب لاسترجاع المعلومات في الإنترنت ؟ هنا لا بد لنا من تفهم الطريقة التي تعمل بها محركات البحث ، وهي طريقة مختلفة تماماً عما تعتمده الفهرسة البشرية ، ونلاحظ بصورة أولية أن نتائج البحث في مواقع رابطة الشبكة العالمية (Web) تتضمن غالباً إحالات إلى مواقع لا علاقة لها بالموضوع ، بينما تهمل المواقع الأخرى التي تمتلك مواد مهمة .
تستخدم شركات خدمات المعلومات الفورية برامج ذكية تسمى محركات البحث Search Engines أو زواحف الشبكة Web Crawlers أو عناكب Spiders أو روبوتات Robots ، وتتوضع محركات البحث في المخدم العام لشركة الخدمة الفورية في رابطة الشبكة العالمية web ، ذلك أنها تقوم بفهرسة المواقع المختلفة بشكل متعاقب مما يوحي بأنها تنتقل أو تزحف من موقع إلى آخر ، حيث تقوم بتحميل صفحات الموقع ثم تتفحصها وتستخلص فهارس المعلومات ، ويمكن القول إن محرك البحث يشمل برنامجاً يتسرب إلى ملايين الصفحات المسجلة في الفهرس بغية إيجاد الصيغ المطابقة لموضوعات البحث ثم يقوم بتصنيف هذه الصيغ وفقاً لمدى ارتباطها بموضوع البحث ، غير أن محركات البحث تعمل بأساليب مختلفة جداً طبقاً لشبكات الخدمات العديدة التي تعتمدها . وهنا نميز طريقتين :

• الفهرسة البسيطة : تتضمن قراءة كلمات صفحات الموقع جميعها ، ثم معظم الكلمات الواردة في نصوص هذه الصفحات ككلمات مفتاحية لخدمة البحث .
• الفهرسة الذكية : تتضمن إجراء تحليلات معقدة بهدف تعيين واصفات أو جمل تستخدم ككلمات مفتاحية لخدمة البحث .

وبعد الانتهاء من تحديد الجمل أو الواصفات أو الكلمات المفتاحية يتم تخزينها في قواعد معطيات محركات البحث ، حيث يوضع إلى جانب كل كلمة عنوان يعينه محدد المصدر الموحد URL وبذلك يتم تحديد مكان وجود الملف .
ومن المعروف أن معظم شركات الخدمة الفورية في إنترنت تستخدم برامج بحث تسمى المستعرض Browser ، فعندما يبحث المستفيد عن الصفحات التي تتضمن كلمة أو واصفة محددة ، يتم إحالة طلب المستفيد إلى قاعدة بيانات محركات البحث ويتم استحضار عناوين صفحات المواقع جميعها التي تتطابق مع طلب المستفيد ، حيث ينتج عن ذلك قائمة من العناوين التي يمكن أن نختار أية نقطة فيها ونؤشر عليها بالفأرة من أجل تحقيق الاتصال بأحد المواقع التي تستجيب للاستفسار المطلوب .
وتستطيع محركات البحث أن تفهرس ملايين الصفحات كل يوم بما يضمن تحديث قواعد معطياتها بصورة مستمرة ، ومواجهة التوسع المستمر في تخزين المعطيات ، كما تستطيع من ناحية أخرى خدمة ملايين الاستفسارات ومواجهة التوسع المستمر في طلبات البحث .
تستخدم بعض الشبكات الخاصة وسائل إضافية مثل مفكرة أو دليل المواقع Site Directory ) ) وهو أشبه بدليل الهاتف المفهرس حيث تتصل آلة البحث بالمواقع تباعاً وتبدأ آلة البحث ( الروبوت ) من الصفحة الأولى ( القائمة الرئيسة) المتصلة بباقي الصفحات ، وهكذا تستطيع آلة البحث تتبع كل الوصلات لمسح صفحات الموقع . وهنا يجب أن نشير إلى أن آلة البحث نفسها لا تعبر الشبكة (Web) ، بل هي تطلب الصفحات من قائمة المواقع المهمة وهي أكثر المواقع شعبية ، وقوائم من الوصلات الناتجة عن مسح Usenet أو أرشيف قوائم البريد . ويسجل الروبوت المعلومات البارزة مثلاً يمكن أن يمسح الكلمات المفتاحية أو العبارات التعريفية الوصفية أو مستخلص الصفحة ، أو يمكن أن يحلل النص الكامل للصفحة لاستنتاج الكلمات المفتاحية .
وتؤدي الروبوتات أو محركات البحث عملها ضمن بيئة إنترنت أو إنترانت حيث تتميز هذه البيئة بشكلها التلقائي الذي لا يخضع لأي نوع من التخطيط المركزي ، وليس ثمة طريقة منهجية لحفظ المعلومات والوثائق ، مما يجعل الإبحار فيها صعباً ويستغرق وقتاً طويلاً ، ومما يجعلها أشبه بالمتاهة .
وهنا يجب أن نشير إلى أن محرك البحث لا يعني المعنى الشعبي الشائع عن خدمات المعلومات المتاحة مثل AltaVista - Yahoo بل سنستخدم هذا المصطلح بمعنيين :

• المعنى الأول : برنامج يستطيع المستفيد من خلاله تشكيل سؤال وتنفيذ بحث عن المعلومات .
• المعنى الثاني : وهو البرنامج الذكي الذي تحدثنا عنه سابقاً وهو الذي يستدعي صفحات المواقع بصورة متعاقبة لفهرستها مما يوحي بأنه ينتقل بينها ويزحف إليها . مما استدعى تسميته بالزاحف Crawler أو المفهرس Indexer أو الروبوت (Robot) الذي يطلق عليها اختصاراً (bot) وتتجلى مهمة هذا البرنامج في إعداد قواعد بيانات قابلة للبحث أو فهارس وكشافات . ومن المفيد أن نلاحظ الفرق بين مفهوم " البحث Searching " وهو الفعل الذي يؤديه المستفيد عندما يسجل كلمة معينة أو عبارة للحصول على قائمة بالمواقع التي تحتوى على صفحات تستجيب لمتطلبات البحث ، وبين مفهوم " الزحف Crawling " وهو فعل العودة إلى مصادر البيانات لإعادة تحليل صفحات المواقع وتحديث الفهارس.

ولعل أفضل محركات البحث هي المحركات التي تسمح للمستفيد بإجراء بحث شامل وتتميز بسهولة الاستخدام وسهولة الصيانة وإمكانية الفهرسة متعددة الجوانب . ولإنجاز هذه الأهداف لا بد من توافر المتطلبات التالية :

• قابلية احتواء اللغة الطبيعية ونماذج الاستفسار البولياني وباقي النماذج .
• ظهور نتائج البحث بشكل منمذج من أجل تطبيقات مختلفة .
• الالتزام بمعايير إقصاء – الروبوت ، الذي يسمح للمخدمات في المواقع أن ترفض نفاذ الروبوت إلى الصفحات الخاصة غير المؤهلة للعرض أمام الجمهور.
• قابلية التوليف الدقيق أو تشكيل معالجة الفهرسة بطرق مختلفة تحقق متطلبات متنوعة للمشرفين على فهرسة المواقع ، مثلاً لفهرسة معطيات موقع معين باستثناء ملفات تتمتع بصفات خاصة .
• قابلية فهرسة نماذج مختلفة مثل :
Plaintex (TXT) . HTML,Adobe Portable
Document Format (PDF), Post Script (PS) Micro Soft RTEPDF, Frame Maker .Interchange Format (MIF).
• دعم نظم تشغيل متنوعة مثل Windows NT, Unix وغيرها .

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:53 PM
اختيار محرك بحث :

يتألف البحث عادة من مجتزأين (Modules) يعمل كل منهما مع الآخر :

• المتجزأ الأول :
هو المجتزأ (Module) الخاص بالفهرسة وهو المسؤول عن قراءة المعلومات في قواعد البيانات المختلفة ، حيث يمكن أن تكون قاعدة البيانات مؤلفة بكاملها من ملفات النص الممنهل HTML ، كما يمكن أن تضم مقداراً محدوداً من ملفات أخرى (عادة ASCII أو ATF ) .
بعد الانتهاء من قراءة المعلومات سيتم وضع الكلمات المفتاحية الناتجة ضمن ملف الفهرسة الذي سيتضمن مؤشرات إلى المكان الدقيق لكل وثيقة.
ويشبه الفهرس كتاباً ضخماً يحتوي على الكلمات المفتاحية من كل صفحة من صفحات (Web) التي يجدها برنامج الفهرسة الآلية في طريقه وفي حال طرأ تعديل على الصفحة ، يتم تحديث الفهرس تلقائياً بالمعلومات الجديدة . ويمكن أن ينمو ملف الفهرس تلقائياً بالمعلومات الجديدة . ويمكن أن ينمو ملف الفهرس إلى أن يصبح حجمه هائلاً وفقاً لكميات البيانات المراد فهرستها ، ووفقاً لخوارزمية الفهرسة التي يمكن أن تساعد في ضغط حجم ملف الفهرس .

• المجتزأ الثاني:
هو محرك البحث الفعلي ، إنه المجتزأ الذي يستجوب ملف الفهرس يقوم ومقارنة الكلمات التي أدخلها المستفيد مع الكلمات المتضمنة في ملف الفهرس وإعادة النتائج .

تعمل محركات البحث جميعها بالاعتماد على هذه المبادئ إلا أنها تختلف فيما بينها في تفاصيل طريقة العمل ، فمثلاً يستخدم بعضها تركيب ( كلمة / طور) وبعضها يعيد ملخصاً عن الوثيقة المطلوبة ، وأخرى ستعود فقط بإتاحة إمكانية الوصل مع الوثيقة المطلوبة .
قبل تركيب محرك البحث ، يجب أن ينظم المستخدم جدول أولوياته فهل المطلوب هو سهولة استخدام المحرك وتركيبه وتوافر الدعم الفني أو المطلوب اختيار محرك بحث غير مكلف ، وأخيراً يجب دراسة حجم المشكلات التي قد يواجهها مستخدم محرك البحث ، وكم من الوقت يستغرق تركيبه ؟ وكم من الوقت يستغرق إعادة فهرسة الوثائق جميعها إذا تغير شيء منها؟.
وعموماً ليس ثمة محرك بحث واحد يفي بمتطلبات مؤسسة تزويد خدمات المعلومات ولذلك لا بد من دراسة خصائص محركات البحث لاختيار ما يناسب متطلبات المؤسسة .
عندما تختار مراكز المعلومات أو المكتبات محرك البحث تستطيع مقارنة الجدوى بين عدة محركات من حيث الكلفة والمواصفات الفنية . مثلاً : هل يتطلب تركيب محرك البحث المجاني وقتاً طويلاً ؟ وهل يصعب الحصول على الدعم الفني؟ .
فإذا كانت الحاجة إلى الوقت وإلى وجود مساعدات البحث Search Utility لا تأتي ضمن أولويات الموقع ، فإن اختيار محرك البحث ذي الكلفة الأقل ربما يكون هو الخطوة الصحيحة .
إلا أن هنالك مواقع تهتم بعامل الزمن وتعده من أولوياتها ، ومثل هذه المواقع ترى أن محرك البحث المجاني ربما يأخذ وقتاً أطول من المتوقع ، وكذلك قد يكون الدعم الفني صعباً ، وربما يستغرق وقتاً طويلاً في فهرسة وإعادة فهرسة المواقع ، وفي هذه الحالة قد تختار محرك بحث تجاري . لأن الكلفة المالية ستعوضها حتماً إمكانات السرعة في التركيب والبحث وخدمات الدعم الفني .

http://files2.fatakat.com/2010/11/12910670331099.gif

صفيه أنديجاني
25-04-2011, 04:56 PM
سلبيات الفهرسة الآلية :

ذكرنا سابقاً أن الفهرسة الآلية تؤدي في كثير من الأحيان إلى إعطاء نتائج غير دقيقة للبحث ، كأن تتضمن الإجابة مئات من الصفحات التي لا تهم المستفيد في حين يتم إهمال عدد مماثل من الصفحات المهمة .
إن إنترنت المؤلفة من خليط غير متجانس من المواد المختلفة والمتباينة تبايناً كبيراً تفتقر إلى المعايير التي تسهل الفهرسة آلياً ، كما أن محركات البحث - على عكس المفهرسين من البشر – تجد صعوبة في تحديد خصائص الوثيقة أو نوعها سواء أكانت شعراً أم مسرحية أم إعلاناً .
ولم تنشأ صفحات web بطريقة مناسبة تسمح للبرامج الآلية أن تستخرج بشكل موثوق ترتيب المعلومات ، مثلما يمكن للمفهرس البشري أن يجده عبر معاينة خاطفة : الكاتب ، تاريخ النشر ، طول النص ، ومحتوى الموضوع ( وهذه المعلومات معروفة باسم البيانات الوصفية matadata ) .
بعض البرامج الآلية تعود بإحصاءات حول مدى تكرار الكلمات في الصفحات التي تتفحصها ، وتضع جدولاً بالمواقع التي تكرر إحدى الكلمات مرتبة وفق الإحصاءات الناتجة . وذلك يؤدي إلى أن يحاول موقع ما أن يوجه الانتباه إليه من خلال تكرار كلمات معينة مرغوبة ومطلوبة من الجمهور دون أن يكون لها علاقة بمضمون صفحات الموقع . بينما يستطيع المفهرسون من البشر اكتشاف هذه الحيل الساذجة بسهولة .
ويستطيع المفهرسون من البشر وصف عناصر الصفحات الفردية من الأنواع جميعها ( النصوص – الصوت – الصور – الفيديو ) كما يستطيعون توضيح كيفية توافق هذه الأجزاء مع بعضها بعضاً ضمن قاعدة معطيات متجانسة.
ولذلك يتجه البحث العلمي اليوم نحو حل بعض مشكلات مناهج التصنيف الآلي ، وخاصة من خلال ضرورة إلحاق البيانات الوصفية Metadata بالملفات جميعها ، هكذا تستطيع برامج الفهرسة أن تجمع هذه المعلومات وتجدد اتجاه البحث. وأكثر المحاولات تقدماً في هذا المجال يقدمها برنامج ( دبلن للبيانات الوصفية Metadata Dublin Core ) ويتراوح تصنيف البيانات الوصفية من العنوان أو الكاتب إلى نوع الوثيقة ( نص أو فيديو ) .

http://up.fr7.com/uploads/images/fr7-9534e5ac14.gif