সার্চ ইঞ্জিন (Search Engine) কিভাবে কাজ করে জেনে নিন?

সার্চ ইঞ্জিন (Search Engine) কিভাবে কাজ করে এই নিয়েই আজকে আমরা আলোচনা করব। আমরা অনেকেই মনে করি যে গুগোল বিশ্বের সবচেয়ে বড় সার্চ ইঞ্জিন, এটি সবকিছুই জানে। এমনকি আমাদের সামনে একটা প্রবাদ আছে যে, তুমি যেটা জানো না সেটা গুগোল কে জিজ্ঞেস করো। মামা সব বলে দিবে। কিন্তু আসলেই কথাটা কতখানি সত্য। মামা কি আসলেই সব কিছু জানে। না মামা আসলে কিছুই জানে না। মামা শুধু জানে কোন জায়গায় কি পাওয়া যায়। এর বাইরে মামার কোন জ্ঞান নেই।

সার্চ ইঞ্জিন (Search Engine)

বিষয়টা আমি স্পষ্ট করে বলতে চাই। ধরন একটি লাইব্রেরীতে অনেক বই রয়েছে। বই হচ্ছে জ্ঞানের খনি বা জ্ঞানভান্ডার। এখন সেখানে একজন লাইব্রেরিয়ান থাকে। আপনি যে লাইব্রেরীতে গিয়ে তাকে জিজ্ঞেস করবেন আইনস্টাইনের অমুক বইটা কোথায় পাওয়া যাবে। সে হয়তো এক মিনিটেরও কম সময়ে আপনাকে বলে দেবে অমুক তাকে গেলে তুমি আইনস্টাইনের ওই বইটা পাবে। সেখান থেকে আপনি যে বইটা নিয়ে পড়তে পারেন। এখন ওই লাইব্রেরিয়ান কিন্তু জানেনা এই বইয়ের ভেতরে কি আছে। ঐ বইয়ের জ্ঞান কিন্তু লাইব্রেরিয়ানের নেই। সে শুধু জানে কোন বই কোথায় রাখা আছে।

সার্চ ইঞ্জিন (Search Engine) কিভাবে কাজ করে

ঠিক সার্চ ইঞ্জিন একই ভূমিকা পালন করে। সার্চ ইঞ্জিন নিজে কিছুই জানেনা। তার নিজের কোন জ্ঞান নেই। সে শুধু এতোটুকুই জানে কোন তথ্য কোথায় গেলে পাওয়া যাবে। সেইটা আপনার সামনে প্রদর্শন করে। আপনি যখন সার্চ ইঞ্জিনে কোন কিছু লিখে সার্চ করেন, সে তার জ্ঞান ভাণ্ডার যেহেতু জানে যে কোন ওয়েবসাইটে কি আছে।

সেখান থেকে আপনাকে ওই জ্ঞানের ভান্ডারের লিংকগুলো আপনার সামনে এনে দেয়। যে তুমি অমুক ওয়েবসাইটের অমুক পেইজে গেলে এই তথ্যটা জানতে পারবে। আপনি এই লিংকে ক্লিক করে সেই ওয়েবসাইট থেকে মূলত আপনার তথ্যগুলো সংগ্রহ করেন। মূলত সার্চ ইঞ্জিন এর কাছ থেকে আপনি কোন তথ্য সংগ্রহ করেন না। শুধুমাত্র ওয়েবসাইটের লিংক ছাড়া এবং এটাই হচ্ছে মূলত সার্চ ইঞ্জিনের ভূমিকা।

সার্চ ইঞ্জিন বট (Search Engine Bot)

এখন প্রশ্ন হচ্ছে এই যে আমি বলতেছি সার্চ ইঞ্জিন জানে কিভাবে। যে বিভিন্ন ওয়েবসাইটের কোথায় কি পাওয়া যায়। এইটা আসলে সার্চ ইঞ্জিন এর কাছে তথ্য কিভাবে থাকে। সার্চ ইঞ্জিন এর কাছে এই তথ্যটা জমা থাকে হচ্ছে। সার্চ ইঞ্জিন এর বেশকিছু অটোমেটিক সফটওয়্যার রয়েছে। যেগুলোকে সার্চ ইঞ্জিন এর বোট বলা বলা হয়ে থাকে। যে যাই বলেন না কেন এই বট একটি অটোমেটিক সফটওয়্যার। যেটা ২৪ ঘণ্টা পুরো ইন্টারনেট দুনিয়া ঘুরে বেড়ায়। দেখে কোন নতুন ওয়েবসাইট এসেছে।

কোন ওয়েবসাইটে কি পরির্বতন হয়েছে। কোন ওয়েবসাইটে কি তথ্য যোগ করা হয়েছে। কি তথ্য ডিলিট করা হয়েছে। এই তথ্য ইন্টারনেট দুনিয়াতে এত বড় একটা দুনিয়া। এই দুনিয়াতে কোথায় কি হচ্ছে প্রতি মুহূর্তে তার খবর ঘুরাঘুরি করে নিতে থাকে এই বট। সার্চ ইঞ্জিন এর ডাটাবেসে জমা করতে থাকে। যে ওয়েবসাইটে অমুক পরির্বতন হয়েছে।

ইন্টারনেট দুনিয়া ঘুরা ( Crawl Internet world)

ধরুন আজকে হঠাৎ করেই এসইওর আপডেট নিয়ে আসলো একটি। নতুন ফেসবুক মার্কেটিং এর টিউটোরিয়াল নিয়ে আসলো। আমরা আমাদের ওয়েবসাইটে পাবলিশ করলাম যে ফেসবুক মার্কেটিং টিউটোরিয়াল এসেছে। তখন কি করবে সার্চ ইঞ্জিন আমার ওয়েবসাইটে যাবে। গিয়ে দেখবে নতুন একটা টিউটোরিয়াল। সেই তথ্যটা সার্চ ইঞ্জিন এর কাছে জমা দিবে বট। সার্চ ইঞ্জিন কি করবে, এই তথ্যটা তার ডাটাবেজে সেভ করে রাখবে। যে আমাদের ফেসবুক মার্কেটিং এর একটি টিউটোরিয়াল বের হয়েছে।

যখনই কেউ ফেসবুক মার্কেটিং টিউটোরিয়াল লিখে সার্চ করবে, তখন সে তার এই ডাটাবেসের যেহেতু তথ্যটা জমা আছে। যা একটি বাংলা টিউটোরিয়াল আছে ফেসবুক মার্কেটিং এর উপর। সে যদি দেখে আমাদের ফেসবুক টিউটোরিয়ালটি ভাল মান সম্পন্ন। তাহলে সে আমাদের ওই ফেসবুক টিউটোরিয়ালের কথাটা যে পেইজে লেখা ছিল সেই পেইজ কে সবার সামনে এনে উপস্থাপন করবে। এই হচ্ছে সার্চ ইঞ্জিন এর কাজ।

সার্চ ইঞ্জিন এর কাজের গতি

এখন আমি আপনাকে একটি চমৎকার উদাহড়ন দেখাব। আমি আপনাকে দেখেছি যে সার্চ ইঞ্জিন কত দ্রুত এই কাজটা করতে পারে। যেমন আমি যদি ব্রাউজারে  লিখি ”বেস্ট মোবাইল ২০২২”। সেরা মোবাইল কোনটা এখানে আমি অল সিলেক্ট করা আছে। যখন আমি বেস্ট মোবাইল ২০২২ লিখে সার্চ করলাম, আমার সামনে 9.7 বিলিয়ন তথ্য দেখানো হয়েছে। তার মানে এই মোবাইল ফোন ২০২২ নিয়ে যে ওয়েবসাইট গুলো তাদের ওয়েবসাইটে কথা বলেছে।

মানে ওয়েবসাইটে বিভিন্ন তথ্য দেয়া হয়েছে এই নিয়ে, সেই তথ্য এই তথ্যটি ইনডেক্সিং গুগলের কাছে 9.6 বিলিয়ন। সেটা করেছে কত সময়ের মধ্যে মাত্র 0.49 সেকেন্ড সময়ে। গুগোল 964 কোটি রেজাল্ট আমাদের সামনে প্রদর্শন করেছে। এখন বুঝতে পারতেছেন যে এটা কতটা দ্রুত প্রসেস করে। কতটা দ্রুতগতিতে আমাদের সামনে দেখায়। এটাই হচ্ছে মূলত সার্চ ইঞ্জিন এর পাওয়ার।

সার্চ ইঞ্জিনেএই নিয়মে কাজ করে। সে ক্রলার পাঠায় সারাদিন ইন্টারনেট ঘুরে তথ্য সংগ্রহ করে। যখনই কেউ সার্চ করে সেই তথ্য অনুযায়ী যে ওয়েবসাইট গুলো রয়েছে, সে ওয়েবসাইটগুলোতে আমার সামনে প্রদর্শন করে। 

ব্যক্তিগত তথ্য সুরক্ষা

আমার মনে একটি প্রশ্ন আসতেছে, আপনার মনে হয় আসা উচিত। সেটা হচ্ছে এই যে আমি বললাম সার্চ ইঞ্জিন এর বট 24 ঘন্টায় ঘুরতে থাকে। সব ওয়েবসাইটের তথ্য নিতে থাকে। তাহলে এমন কি হয় না যে ফেসবুকের মধ্যে আপনি অনেককে অনেক ব্যক্তিগত মেসেজ দেন, ছবি দেন। সার্চ ইঞ্জিন তো তাহলে সেগুলো দেখে ফেলেছে তাই না। তাহলে সার্চ ইঞ্জিন এর কাছে সেই ডাটাগুলো চলে আসতেছে। এরকম হলে কিরকম হলো তাহলে তো মানুষের কোন প্রাইভেসি থাকেনা। আসলে এই বিষয়টা সিয়ন্ত্রণ করা যায়।

robot.txt ফাইল

আমি ওয়েবসাইট করব, আমার ওয়েবসাইট আমার ব্যক্তিগত তথ্য থাকতেই পারে। আমার সোশ্যাল মিডিয়াতে আমার ব্যক্তিগত তথ্য থাকতেই পারে। কিন্তু আমার সার্চ ইঞ্জিন আমার ব্যক্তিগত তথ্য থাকবে দেখবে এটা হতে পারে না। সার্চ ইঞ্জিন যে সেটা দেখে ফেলবে তার বট পাঠিয়ে, সেটা সেটা জেনে ফেলবে এমন তো না। এমন তো করা যায় না।

এর জন্য সার্চ ইঞ্জিন কন্ট্রোল করার জন্য এসইউ এর কিছু সিস্টেম আছে। সেটাকে বলা হয় robot.txt ফাইল। robots.txt ফাইল এর মাধ্যমে আমরা আমাদের ওয়েবসাইটের সার্চ ইঞ্জিন বট কন্ট্রোল করতে পারব। আমার ওয়েবসাইটের কোন পেইজে সার্চ ইঞ্জিন বট আসবে। কোন পেজে সার্চ ইঞ্জিন বট আসবে না, সেটা আমরা বাঁধাধরা দিয়ে দিতে পারব।

শেষ কথা

আমরা যদি কোন পেজকে আটকে রাখি যে, এই পেইজে কোন সার্চ ইঞ্জিন বট প্রবেশ করবে না। তাহলে সার্চ ইঞ্জিন বট কখনই এই সাইটে প্রবেশ করতে পারবে না। আমার তথ্য সে ইন্ডেক্স করতে পারবেনা। ইন্ডেক্স করা মানে হচ্ছে আমার ওয়েবসাইটে তথ্য আছে সেই তথ্যটা গুগল সংরক্ষণ করা। আমার ওয়েবসাইটে এই তথ্যগুলো পাওয়া যায়। সার্চ ইঞ্জিন চাইলেই সব ওয়েবসাইট ইনডেক্স করতে পারে না। যদি তার ইনডেক্সের অনুমতি না থাকে। আশা করি আপনারা সার্চ ইঞ্জিন কিভাবে কাজ করে সে সম্পর্কে সঠিক একটি ধারণা পেয়েছেন। তবে আজ এ পর্যন্তই, আগামী পর্বের আমন্ত্রণ রইল। ভালো থাকবেন, আল্লাহ হাফেজ।

Leave a Reply

Your email address will not be published.