১৯৫৫ সালে রকফেলার ফাউন্ডেশনের অর্থায়নে মার্কিন কম্পিউটার বিজ্ঞানী জন ম্যাকার্থি সর্বপ্রথম কৃত্ৰিম বুদ্ধিমত্তা বা এআই (AI) বিষয়ক গবেষণার সূচনা করেন। এআই-এর সংজ্ঞা নিয়ে বিশেষজ্ঞদের মধ্যে মতভেদ থাকলেও সাধারণভাবে এআই বলতে যন্ত্রের বুদ্ধিমত্তাকে বোঝানো হয়। ‘বুদ্ধিমত্তার’ সংজ্ঞা নির্ধারণের জটিলতায় না গিয়ে অন্তত এটুকু বলা যায় যে এআই-এর কারণে এখন যন্ত্রের পক্ষে এমন সব কাজ সম্পাদন সম্ভব যার জন্য এতদিন মানুষের যুক্তি ও চিন্তার প্রয়োজন হতো। এরকম কাজের সবচেয়ে ভালো উদাহরণ হচ্ছে ‘লেখার সক্ষমতা’ (Natural Language Generation)। লেখন পদ্ধতি উদ্ভাবনের পর থেকে মানব সভ্যতার বিগত পাঁচ হাজার বছরে ‘লেখার সক্ষমতার’ একমাত্র উৎস ছিল মানব মস্তিষ্ক। একবিংশ শতাব্দীর প্রথম ভাগে এসে আমরা সভ্যতার এমন এক স্তরে উপস্থিত হয়েছি যেখানে যন্ত্রের পক্ষে লেখার মতো সৃজনশীল মানসিক শ্রমের জায়গা নেওয়া সম্ভব হয়ে উঠছে।
মানুষের মতো লিখতে পারার সক্ষমতায় পৌঁছাতে এআই-এর লেগেছে প্রায় সত্তর বছর। সেই পঞ্চাশের দশক থেকেই প্রত্যাশা ছিল যে এআই খুব শিগগিরই বিভিন্ন জটিল সমস্যা সমাধানের পাশাপাশি মানুষের মতো বলতে-লিখতে পারবে। এজন্য ষাটের দশকে মার্কিন প্রতিরক্ষা বিভাগ এআই-এর গবেষণায় ব্যাপক বিনিয়োগ করে, যদিও সে সময় এআই এই প্রত্যাশা পূরণে ব্যর্থ হয়। আশির দশকে জাপান, যুক্তরাষ্ট্র ও ইউরোপ আরো একবার এআই খাতে বড় বিনিয়োগ করে। সেবারও প্রত্যাশিত ফলাফল পাওয়া যায়নি।
দীর্ঘ বিরতির পর অবশেষে একুশ শতকের দ্বিতীয় দশকের শেষদিকে এআই প্রত্যাশিত ফল দিতে শুরু করে। এআই-এর এই সফলতার পেছনে যেসব অনুঘটক রয়েছে তাদের মধ্যে অন্যতম হলো ‘ডিপ লার্নিং’ (Deep Learning) প্রযুক্তির বিকাশ। ‘ডিপ লার্নিং’ প্রযুক্তির কারণে এখন এআই অনেকটা মানব মস্তিষ্কের মতো তথ্য গ্রহণ করে স্বয়ংক্রিয়ভাবে সেখান থেকে শিখতে পারে। ‘ডিপ লার্নিং’ প্রযুক্তির উদাহরণ হিসেবে চ্যাট জিপিটির (Chat GPT) মতো ভাষাভিত্তিক (Large Language Model) এআই মডেলগুলোর কথা উল্লেখ করা যায়। বর্তমান সময়ের এআই ল্যাঙ্গুয়েজ মডেলগুলো মানুষের সাথে বিভিন্ন বিষয়ে আলাপচারিতার পাশাপাশি গল্প-কবিতা রচনা থেকে শুরু করে জটিল বিশ্লেষণমূলক প্রবন্ধও লিখতে পারে। সাম্প্রতিক মডেলগুলোর দক্ষতা এতটাই বেশি যে মৌলিক গবেষণা, ব্যতিক্রমী চিন্তাযুক্ত বা অতিমাত্রায় সৃজনশীল বিষয়বস্তু ছাড়া যেকোনো বিষয়ের উপর এআই আর মানুষের লেখার মধ্যে গুণগত পার্থক্য করা যায় না। এই দক্ষতার জন্য এআই মডেলগুলোকে বিপুল পরিমাণ লেখা-তথ্য, বই-গবেষণাপত্র ব্যবহার করে প্রশিক্ষণ দিতে হয়েছে।
শুধু চ্যাট জিপিটিকে প্রশিক্ষণ দেওয়ার জন্য যে পরিমাণ লিখিত তথ্য ব্যবহার করা হয়েছে তা যদি দুইশ’ পৃষ্ঠার বই আকারে প্রকাশ করা হতো তাহলে বইয়ের সংখ্যা দাঁড়াত প্রায় পনেরো কোটি।
স্বাভাবিকভাবেই, এআই প্রশিক্ষণে এই পরিমাণ লিখিত তথ্যের চাহিদা মেটানোর জন্য বই আর গবেষণাপত্রের পাশাপাশি এআই কোম্পানিগুলো নির্ভর করেছে ইন্টারনেটের উপর। গত পঁয়ত্রিশ বছরে লিখিত তথ্যের সবচেয়ে বড়ো উৎস হয়ে উঠেছে ইন্টারনেট। ফলে এআই মডেলগুলো কী ‘জানে’ ও ‘চিন্তা করে’ তা অনেকাংশে নির্ভর করে ইন্টারনেটে কী আছে তার উপর। সমস্যার শুরু এখানেই। ইন্টারনেটে বিদ্যমান লেখা ও তথ্য ভাষা ও সংস্কৃতিগত দিক থেকে অত্যন্ত অসম। অনলাইনের নব্বই শতাংশ লেখা মাত্র দশটি ভাষার মধ্যে সীমাবদ্ধ (ইংরেজি, রাশিয়ান, স্প্যানিশ, জার্মান, ফরাসি, জাপানি, তুর্কি, পর্তুগিজ, ইতালিয়ান, ফারসি), আর প্রায় পঞ্চাশ শতাংশ লেখাই ইংরেজিতে। ফলে এআই মডেলগুলোর জন্যও প্রশিক্ষণের মূল ভাষা হয়ে দাঁড়িয়েছে ইংরেজি। সাম্প্রতিক এক হিসেব অনুসারে ইন্টারনেটে বাংলা ভাষায় লেখা বিষয়ের পরিমান শূন্য দশমিক এক শতাংশেরও কম, যদিও ২০২৪ সালের হিসাবে ভাষাভাষীর বিচারে বাংলা পৃথিবীর সপ্তম বৃহত্তম ভাষা; মাতৃভাষার বিচারে পঞ্চম।
ইন্টারনেটের এই ভাষাগত বৈষম্য নতুন কিছু নয় বা কোনো দুর্ঘটনাও নয়, বরং এটি জ্ঞান উৎপাদন আর বিতরণের ক্ষেত্রে গভীর ঐতিহাসিক বৈষম্যেরই প্রতিফলন। এই বৈষম্য এআই উত্তরাধিকারসূত্রে গ্রহণ করেছে। এআই যেহেতু অদূর ভবিষ্যতে আমাদের জ্ঞান অর্জনের মাধ্যম, সিদ্ধান্ত গ্রহণে সহায়তাকারী এবং উৎপাদন কাঠামোর অংশ হয়ে উঠতে যাচ্ছে সেহেতু এই বৈষম্যের প্রভাব হবে সুদূরপ্রসারী। শুধু ভাষাগত দক্ষতা বাড়িয়ে (ইংরেজি শিখে) এই বৈষম্য কাটিয়ে ওঠা সম্ভব হবে না। সম্প্রতিক এক গবেষণায় দেখা গিয়েছে চ্যাট জিপিটির মতো বহুল ব্যবহৃত এআই পশ্চিমা সংস্কৃতি ও চিন্তাধারা দ্বারা এতো বেশি প্রভাবিত যে ইংরেজিতে দক্ষ একজন ভারতীয়র তুলনায় একজন সাধারণ আমেরিকানের জন্য এআই-এর ব্যবহার অপেক্ষাকৃত সহজ। আদালত পরিচালনায় এআই-এর সহায়তা নিতে গিয়ে দেখা গিয়েছে যে নথিপত্রে জাতিগতভাবে বাদামি বা কালো হিসেবে উল্লিখিত লোকদের ক্ষেত্রে এআই বেশি কঠোর শাস্তির সুপারিশ করেছে। চিকিৎসা ক্ষেত্রেও এআই-এর সিদ্ধান্তে জাতিগত বৈষম্যের দেখা পাওয়া যায়।
এই বৈষম্য নিরসনের সহজ পথ হতে পারে এআই-এর প্রশিক্ষণে ইংরেজিতে লেখা বই-নথির পাশাপাশি অন্য ভাষা ও সংস্কৃতির লেখাও ব্যবহার করা। এখনকার জনপ্রিয় এআই মডেলগুলোর প্রশিক্ষণে ব্যবহৃত তথ্যের নব্বই থেকে পঁচানব্বই শতাংশই ইংরেজি। তবে শুধু ইন্টারনেটে ইংরেজির আধিপত্যই এর একমাত্র কারণ নয়। গবেষণায় দেখা গিয়েছে এআইকে একাধিক ভাষা সমানভাবে শেখাতে গেলে তাতে এআই-এর সার্বিক ভাষাগত দক্ষতার অবনতি ঘটে। বর্তমানে বিশ্বের শীর্ষ এআই কোম্পনি ‘ওপেন এআই’ (Open AI) ও ‘গুগল’(Google) সাম্প্রতিক সময়ে বহু ভাষাভিত্তিক এআই সৃষ্টি করলেও মডেলগুলোর মূল ভাষা ইংরেজি। অর্থনৈতিক স্বার্থের দিক বিবেচনায় স্বাভাবিকভাবেই কোনো বড় এআই প্রযুক্তির প্রতিষ্ঠান শুধুমাত্র বাংলা ভাষায় প্রশিক্ষণের ঝুঁকি নিতে আগ্রহী হবে না। ফ্রান্স, চায়না, বা জাপানের মতো দেশগুলো ইতিমধ্যেই ইংরেজির ভরসায় না থেকে ফরাসি, চীনা ও জাপানি ভাষা কেন্দ্রিক পৃথক এআই মডেল তৈরিতে বিনিয়োগ করছে। বাংলাদেশকেও একই পথে হাঁটতে হবে।
বাংলাতে এআই মডেল তৈরির মূল বাধা শুধু অর্থনৈতিক বা প্রযুক্তিগত নয়। ডিজিটাল মিডিয়ায় যথেষ্ট পরিমাণ মানসম্পন্ন বাংলা লেখার অভাবও একটা বড় সমস্যা। ইন্টারনেটে বাংলা লেখায় তথ্য, বানান ও ব্যাকরণগত ত্রুটির মতো অসঙ্গতি অনেক বেশি। এই ধরনের ত্রুটিপূর্ণ লেখা ব্যবহার করে এআইকে প্রশিক্ষণ দেওয়া সম্ভব না। বাংলা ভাষায় মানসম্পন্ন ছাপা লেখা অনেক থাকলেও এর খুব কম পরিমাণই ডিজিটাইজড হয়েছে। জাতীয় উদ্যোগে বাংলা সাহিত্যের বই, সংবাদপত্র, গবেষণাপত্র ও দৈনন্দিন লেখালেখির সমৃদ্ধ ডিজিটাল আর্কাইভ তৈরির উদ্যোগ নেওয়া এবং প্রিন্ট ও ডিজিটাল মিডিয়ায় শুদ্ধ ও মানসম্মত বাংলা ব্যবহারে উৎসাহিত করার মাধ্যমে বাংলা ভাষায় এআই প্রশিক্ষণের অনুকূল পরিবেশ তৈরী সম্ভব।
বাংলাদেশে বাংলা ভাষা ও বানানরীতির প্রমিতকরণের প্রচেষ্টা থাকলেও এর গ্রহণযোগ্যতা বৃদ্ধি এবং আন্তর্জাতিক অঙ্গনে তার প্রচার প্রয়োজন। অক্সফোর্ড বা কেমব্রিজ ইউনিভার্সিটি প্রেসের মতো প্রকাশনাগুলোর ‘ইংরেজি টু বাংলা’ অভিধানগুলোতে পশ্চিমবঙ্গ বাংলা আকাদেমির বানানরীতি চালু আছে, যা আন্তর্জাতিক পরিসরে বাংলাদেশের বানানরীতি প্রচলনের দুর্বলতার উদাহরণ। বানান ও ভাষারীতির এই সমস্যা শুধু বাংলা ভাষার একার নয়। এআই মডেলগুলোতে মার্কিন ইংরেজির বানান ও উচ্চারণের আধিক্য অন্যান্য দেশের ইংরেজি ভাষাভাষীদের মধ্যে উদ্বেগ সৃষ্টি করেছে। শিক্ষাক্ষেত্রে, লেখায়, ভিডিওতে এআই-এর ক্রমবর্ধমান ব্যবহারের ফলে ভবিষ্যতে ব্রিটিশ শিশুরা আমেরিকান ইংরাজিতে ক্রমশ অভ্যস্ত হয়ে পড়বে বলে অনেকেই আশঙ্কা করেন।
এআই প্রযুক্তির অগ্রগতি ভবিষ্যতে ভাষা-সংস্কৃতি এমনকি জাতীয় পরিচয়ের উপর সুদূরপ্রসারী প্রভাব ফেলতে যাচ্ছে। ভাষা ও চিন্তাধারার সম্পর্ক অত্যন্ত গভীর। তাই আগামী প্রজন্ম কীভাবে পড়বে, লিখবে এমনকি চিন্তা করবে তা অনেকাংশেই নির্ভর করবে দেশজ এআই প্রযুক্তির সমৃদ্ধির উপর। রাষ্ট্রীয়ভাবে বাংলা ভাষাভিত্তিক এআই তৈরির উদ্যোগ নেওয়ার এখনই সময়। বাংলা ভাষা ও চিন্তার সার্বভৌমত্ব রক্ষায় এর বিকল্প নেই।