চরচা ডেস্ক

২০২৪ সাল। চট্টগ্রামের জেএম সেন হলে পূজামণ্ডপে ইসলামি গান পরিবেশন নিয়ে হইচই পড়ে যায়। প্রায় সঙ্গে সঙ্গেই সামাজিক যোগাযোগমাধ্যমে এ সম্পর্কিত ভিডিওকে এআই দিয়ে তৈরি বলে প্রচার শুরু হয়। গুরুত্বপূর্ণ ব্যক্তিদের কেউ কেউ এ নিয়ে পোস্টও দেন। পরে দেখা গেল ভিডিওটি এআই দিয়ে তৈরি নয়।
এমন হরহামেশাই ঘটছে। কখনো ছবি, কখনো অডিও বা ভিডিও নিয়ে এমন তর্ক চলতেই থাকে। সামাজিকমাধ্যমে ফেক, ডিপফেক এখন আকছার ঘটছে। ফলে মানুষ বিভ্রান্ত হচ্ছে। কিন্তু কৃত্রিম বুদ্ধিমত্তা বা এআইয়ের ব্যবহার তো থামানোর পথ নেই। দিন দিন আরও বেশি মানুষ নানা প্রয়োজনে এআইয়ের দিকে ঝুঁকছে। ফলে মানুষের তৈরি ও এআই দিয়ে তৈরি কনটেন্ট নিয়ে বিভ্রান্তি বাড়ছে। আর এ ক্ষেত্রে নিদান হিসেবে আছে এআই ডিটেক্টর। কিন্তু এও কি ঠিকঠাক কাজ করছে?
তাকানো যাক অস্ট্রেলিয়ার দিকে। সম্প্রতি অস্ট্রেলিয়ার প্রায় অর্ধেক মানুষ জানিয়েছে, তারা কৃত্রিম বুদ্ধিমত্তা বা এআই টুল ব্যবহার করছে। এতে এই প্রযুক্তি কখন এবং কীভাবে ব্যবহৃত হচ্ছে, তা জানা এখন আরও গুরুত্বপূর্ণ হয়ে উঠেছে।
কনসালটেন্সি ফার্ম ডিলয়েট সম্প্রতি অস্ট্রেলিয়ার সরকারকে তাদের ফি-র একটি অংশ ফেরত দিয়েছে। কারণ, তাদের প্রকাশিত একটি প্রতিবেদনে এআই-জনিত ভুল পাওয়া গিয়েছিল।
এ ছাড়া একটি আদালতের নথিতে এআইয়ের মাধ্যমে তৈরি করা ভুল তথ্য বা সাইটেশন ব্যবহারের দায়ে সম্প্রতি এক আইনজীবীর বিরুদ্ধে শাস্তিমূলক ব্যবস্থা নেওয়া হয়। পাশাপাশি, অনেক বিশ্ববিদ্যালয় তাদের শিক্ষার্থীদের এআই ব্যবহারের ধরন নিয়ে উদ্বেগ প্রকাশ করছে।
এসবের মাঝেই সঠিক, নির্ভরযোগ্য ও যাচাইকৃত কনটেন্ট শনাক্তের প্রয়োজনীয়তা থেকে বেশ কিছু এআই ডিটেকশন টুল সামনে এসেছে।
কিন্তু এই টুলগুলো আসলে কীভাবে কাজ করে? আর এআই-নির্মিত কনটেন্ট শনাক্ত করতে এগুলো কতটা কার্যকর?
এআই ডিটেক্টরগুলো কীভাবে কাজ করে?
দ্য কনভারসেশনের একটি নিবন্ধে বলা হয়, এআই শনাক্তকরণে বেশ কিছু পদ্ধতি রয়েছে এবং এগুলোর কার্যকারিতা মূলত কনটেন্টের ধরনের ওপর নির্ভর করে।
টেক্সট ডিটেক্টরগুলো সাধারণত বাক্য গঠন, লেখার শৈলী ও নির্দিষ্ট শব্দ বা বাক্যাংশের ব্যবহারের ধরনের ওপর ভিত্তি করে টেক্সট কনটেন্টে এআইয়ের ব্যবহার অনুমানের চেষ্টা করে। উদাহরণস্বরূপ, এআই রাইটিং টুলগুলো সহজলভ্য হওয়ার পর থেকে ‘delves’ এবং ‘showcasing’-এর মতো শব্দের ব্যবহার নাটকীয়ভাবে বেড়েছে।

তবে এআই এবং মানুষের লেখার ধাঁচের মধ্যে পার্থক্য দিন দিন কমছে। এর অর্থ হলো–যেসব এআই ডিটেক্টর এ রকম কোনো নির্দিষ্ট প্যাটার্ন বা ‘সিগনেচার’-এর ওপর ভিত্তি করে কাজ করে, তারা এখন অনেক ক্ষেত্রেই নির্ভরযোগ্যতা হারাচ্ছে।
ছবির ক্ষেত্রে ডিটেক্টরগুলো অনেক সময় ‘এমবেডেড মেটাডেটা’ বিশ্লেষণের মাধ্যমে কাজ করে। উদাহরণস্বরূপ, ‘কনটেন্ট ক্রেডেনশিয়ালস ইন্সপেক্ট’ টুলের মাধ্যমে ব্যবহারকারী কোনো কনটেন্ট কীভাবে এডিট করেছেন, তা দেখা সম্ভব, যদি সেটি নির্ভরযোগ্য কোনো সফটওয়্যার দিয়ে তৈরি ও সম্পাদিত হয়ে থাকে। টেক্সটের মতোই ছবিগুলোকেও এআই-জেনারেটেড কনটেন্টের (যেমন ডিপফেক) যাচাইকৃত ডেটাসেটের সাথে তুলনা করে শনাক্ত করা সম্ভব।
অবশেষে কিছু এআই ডেভেলপার তাদের এআই সিস্টেম থেকে পাওয়া আউটপুটে ওয়াটারমার্ক যুক্ত করা শুরু করেছেন। এগুলো মূলত যেকোনো কনটেন্টের ভেতরে লুকিয়ে থাকা এমন কিছু প্যাটার্ন, যা মানুষের চোখে ধরা পড়ে না। কিন্তু সংশ্লিষ্ট ডেভেলপাররা সহজেই বুঝতে পারেন। তবে বড় কোনো ডেভেলপার প্রতিষ্ঠানই এখন পর্যন্ত তাদের এই এআই ডিটেকশন টুলগুলো জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করেনি। অবশ্য এই টুলগুলোর প্রত্যেকটিরই নিজস্ব কিছু সীমাবদ্ধতা রয়েছে।
এআই ডিটেক্টরগুলো কতটা কার্যকর?
এআই ডিটেক্টরগুলোর কার্যকারিতা অনেক কিছুর ওপর নির্ভর করে। এর মধ্যে রয়েছে কনটেন্ট তৈরিতে কোন এআই টুলস ব্যবহার করা হয়েছে, কিংবা কনটেন্ট তৈরির পর সেগুলো এডিট বা কোনো পরিবর্তন করা হয়েছে কিনা।
তাছাড়া এই টুলগুলো তৈরির সময় এগুলোকে প্রশিক্ষণ দিতে যে ডেটা (Training Data) ব্যবহার করা হয়েছে, সেটার ওপরও এআই ডিটেক্টরগুলোর কার্যকারিতা নির্ভর করে।
উদাহরণস্বরূপ, এআই-জেনারেটেড বা কৃত্রিম বুদ্ধিমত্তার সাহায্যে তৈরি ছবি শনাক্তের জন্য ব্যবহৃত ডেটাসেটগুলোতে মানুষের পূর্ণাবয়ব ছবি কিংবা নির্দিষ্ট কিছু সংস্কৃতির মানুষের ছবির যথেষ্ট ঘাটতি রয়েছে। এর অর্থ হলো–অনেক ক্ষেত্রেই এআই ডিটেকশন টুলগুলো সীমাবদ্ধতার মুখে পড়ছে।
তবে একই কোম্পানির তৈরি এআই টুলের কনটেন্ট শনাক্তের ক্ষেত্রে ‘ওয়াটারমার্ক’ পদ্ধতিটি বেশ কার্যকর হতে পারে। উদাহরণস্বরূপ, আপনি যদি গুগলের ‘ইমাজেন’ (Imagen)-এর মতো কোনো এআই মডেল ব্যবহার করেন, তবে গুগলের নিজস্ব ‘সিনথ-আইডি’ (SynthID) ওয়াটারমার্ক টুলটি সেই আউটপুটগুলো শনাক্ত করতে সক্ষম বলে দাবি করা হয়।

তবে সিনথ-আইডি এখনো সর্বসাধারনের ব্যবহারের জন্য উন্মুক্ত নয়। আবার যদি কোনো কনটেন্ট চ্যাটজিপিটি দিয়ে তৈরি করা হয়, সেক্ষেত্রে এটা কাজ করবে না কারণ, চ্যাটজিপিটি গুগলের বানানো না। এআই ডেভেলপারদের মধ্যে এই পারস্পরিক সমন্বয় বা ‘ইন্টারঅপারেবিলিটি’র অভাব বর্তমানে একটি বড় চ্যালেঞ্জ হিসেবে দাঁড়িয়েছে।
এআই-জেনারেটেড আউটপুটে কোনো পরিবর্তন বা সম্পাদনা করা হলে ডিটেক্টরগুলোকে সহজেই ফাঁকি দেওয়া সম্ভব। উদাহরণস্বরূপ, কেউ যদি ভয়েস ক্লোনিং অ্যাপ ব্যবহার করে কৃত্রিম কণ্ঠস্বর তৈরির পর তাতে আলাদা শব্দ যোগ করে কিংবা ফাইলের কোয়ালিটি কমিয়ে দেয়, তবে ভয়েস এআই ডিটেক্টরগুলো বিভ্রান্ত হতে পারে। এআই দিয়ে তৈরি ছবির ক্ষেত্রেও এই একই সীমাবদ্ধতা লক্ষ্য করা যায়।
এ ক্ষেত্রে এক্সপ্লেইনেবিলিটির অভাব আরও একটি বড় সমস্যা। অনেক এআই ডিটেক্টর কোনো কনটেন্ট এআই দিয়ে তৈরি কি না, সে বিষয়ে কেবল একটি সম্ভাব্যতার হার বা ‘কনফিডেন্স এস্টিমেট’ প্রদান করে। কিন্তু কেন ওই কনটেন্টটি এআই-জেনারেটেড বলে শনাক্ত হলো, তার কোনো কারণ স্পষ্ট করে বলে না।
আমাদের এটি মনে রাখা জরুরি যে, এআই শনাক্তকরণের বিষয়টি, বিশেষ করে স্বয়ংক্রিয় শনাক্তকরণ পদ্ধতিটি এখনো প্রাথমিক পর্যায়ে রয়েছে।
ডিপফেক শনাক্তকরণের সাম্প্রতিক প্রচেষ্টাগুলোর দিকে তাকালে এর একটি ভালো উদাহরণ পাওয়া যায়। মেটার ‘ডিপফেক ডিটেকশন চ্যালেঞ্জ’-এ বিজয়ী মডেলটি প্রতি পাঁচটি ডিপফেকের মধ্যে চারটিই সঠিকভাবে শনাক্ত করতে পেরেছিল। সমস্যা হলো, মডেলটিকে যে ডেটার ওপর ভিত্তি করে প্রশিক্ষণ দেওয়া হয়েছিল, পরীক্ষার সময় সেই একই ডেটাই ব্যবহার করা হয়েছে। এটা অনেকটা পরীক্ষার আগেই প্রশ্নপত্রের উত্তর জেনে যাওয়ার মতো ঘটনা।
যখন নতুন কোনো কনটেন্টের ওপর এই মডেলটি পরীক্ষা করা হয়, তখন আবার এর সাফল্যের হার উল্লেখযোগ্যভাবে কমে যায়। নতুন ডেটাসেটের ক্ষেত্রে এটি প্রতি পাঁচটি ডিপফেকের মধ্যে মাত্র তিনটি সঠিকভাবে শনাক্ত করতে পেরেছে। অর্থাৎ, সাফল্যের হার ৮০ থেকে ৬০ শতাংশে নেমে আসে।
এই সমস্ত তথ্যপ্রমাণে বোঝা যায়, এআই ডিটেক্টরগুলো ভুল করতে পারে এবং বাস্তবে করেও থাকে। এর ফলে ‘ফলস পজিটিভ’ (অর্থাৎ কোনো কিছু মানুষের তৈরি হওয়া সত্ত্বেও তা এআই-জেনারেটেড বলে দাবি করা) এবং ‘ফলস নেগেটিভ’ (অর্থাৎ কোনো কিছু এআই দিয়ে তৈরি হওয়া সত্ত্বেও তা মানুষের তৈরি বলে দাবি করা) উভয় ধরনের বিভ্রান্তিই তৈরি হতে পারে।
ব্যবহারকারীদের জন্য এই ধরনের ভুল চরম বিপর্যয় ডেকে আনতে পারে। যেমন–কোনো শিক্ষার্থীর নিজের লেখা প্রবন্ধকে যদি ভুলবশত এআই-জেনারেটেড হিসেবে বাতিল করে দেওয়া হয়, কিংবা কেউ যদি ভুল করে কোনো এআই-লিখিত ই-মেইলকে বাস্তবের কোনো মানুষের পাঠানো বার্তা বলে বিশ্বাস করে বসেন, তা আসলেই বিপজ্জনক।
প্রযুক্তির যত উন্নয়ন ঘটছে, এটি ততই এক অস্থির প্রতিযোগিতায় রূপ নিচ্ছে। আর এই দ্রুত পরিবর্তনের সঙ্গে তাল মেলাতে বর্তমানে হিমশিম খাচ্ছে এআই ডিটেক্টরগুলো।
উত্তরণের পথ কী?
কেবল একটি টুলের ওপর নির্ভর করা সমস্যাজনক ও ঝুঁকিপূর্ণ। কোনো কনটেন্ট বা বিষয়ের নির্ভরযোগ্যতা যাচাই করার জন্য বিভিন্ন টুলের ব্যবহারই সাধারণত নিরাপদ ও শ্রেয়।
লিখিত কনটেন্টের ক্ষেত্রে তথ্য ও তথ্যের উৎস যাচাইয়ের মাধ্যমে এটি করা সম্ভব। আবার ভিজ্যুয়াল কনটেন্টের ক্ষেত্রে সন্দেহভাজন ছবিটিকে একই সময়ে বা একই স্থানে তোলা অন্যান্য ছবির সাথে তুলনা করা যেতে পারে। এ ছাড়া কোনো বিষয়কে সন্দেহজনক মনে হলে আপনি অতিরিক্ত প্রমাণ বা ব্যাখ্যাও দাবি করতে পারেন।
তবে পরিশেষে যখন শনাক্তকারী টুলগুলো ব্যর্থ হয়, কিংবা অন্য কোনো বিকল্প থাকে না, তখন ব্যক্তি ও প্রতিষ্ঠানের সাথে পারস্পরিক আস্থাই হয়ে ওঠে সবচেয়ে গুরুত্বপূর্ণ বিষয়।

২০২৪ সাল। চট্টগ্রামের জেএম সেন হলে পূজামণ্ডপে ইসলামি গান পরিবেশন নিয়ে হইচই পড়ে যায়। প্রায় সঙ্গে সঙ্গেই সামাজিক যোগাযোগমাধ্যমে এ সম্পর্কিত ভিডিওকে এআই দিয়ে তৈরি বলে প্রচার শুরু হয়। গুরুত্বপূর্ণ ব্যক্তিদের কেউ কেউ এ নিয়ে পোস্টও দেন। পরে দেখা গেল ভিডিওটি এআই দিয়ে তৈরি নয়।
এমন হরহামেশাই ঘটছে। কখনো ছবি, কখনো অডিও বা ভিডিও নিয়ে এমন তর্ক চলতেই থাকে। সামাজিকমাধ্যমে ফেক, ডিপফেক এখন আকছার ঘটছে। ফলে মানুষ বিভ্রান্ত হচ্ছে। কিন্তু কৃত্রিম বুদ্ধিমত্তা বা এআইয়ের ব্যবহার তো থামানোর পথ নেই। দিন দিন আরও বেশি মানুষ নানা প্রয়োজনে এআইয়ের দিকে ঝুঁকছে। ফলে মানুষের তৈরি ও এআই দিয়ে তৈরি কনটেন্ট নিয়ে বিভ্রান্তি বাড়ছে। আর এ ক্ষেত্রে নিদান হিসেবে আছে এআই ডিটেক্টর। কিন্তু এও কি ঠিকঠাক কাজ করছে?
তাকানো যাক অস্ট্রেলিয়ার দিকে। সম্প্রতি অস্ট্রেলিয়ার প্রায় অর্ধেক মানুষ জানিয়েছে, তারা কৃত্রিম বুদ্ধিমত্তা বা এআই টুল ব্যবহার করছে। এতে এই প্রযুক্তি কখন এবং কীভাবে ব্যবহৃত হচ্ছে, তা জানা এখন আরও গুরুত্বপূর্ণ হয়ে উঠেছে।
কনসালটেন্সি ফার্ম ডিলয়েট সম্প্রতি অস্ট্রেলিয়ার সরকারকে তাদের ফি-র একটি অংশ ফেরত দিয়েছে। কারণ, তাদের প্রকাশিত একটি প্রতিবেদনে এআই-জনিত ভুল পাওয়া গিয়েছিল।
এ ছাড়া একটি আদালতের নথিতে এআইয়ের মাধ্যমে তৈরি করা ভুল তথ্য বা সাইটেশন ব্যবহারের দায়ে সম্প্রতি এক আইনজীবীর বিরুদ্ধে শাস্তিমূলক ব্যবস্থা নেওয়া হয়। পাশাপাশি, অনেক বিশ্ববিদ্যালয় তাদের শিক্ষার্থীদের এআই ব্যবহারের ধরন নিয়ে উদ্বেগ প্রকাশ করছে।
এসবের মাঝেই সঠিক, নির্ভরযোগ্য ও যাচাইকৃত কনটেন্ট শনাক্তের প্রয়োজনীয়তা থেকে বেশ কিছু এআই ডিটেকশন টুল সামনে এসেছে।
কিন্তু এই টুলগুলো আসলে কীভাবে কাজ করে? আর এআই-নির্মিত কনটেন্ট শনাক্ত করতে এগুলো কতটা কার্যকর?
এআই ডিটেক্টরগুলো কীভাবে কাজ করে?
দ্য কনভারসেশনের একটি নিবন্ধে বলা হয়, এআই শনাক্তকরণে বেশ কিছু পদ্ধতি রয়েছে এবং এগুলোর কার্যকারিতা মূলত কনটেন্টের ধরনের ওপর নির্ভর করে।
টেক্সট ডিটেক্টরগুলো সাধারণত বাক্য গঠন, লেখার শৈলী ও নির্দিষ্ট শব্দ বা বাক্যাংশের ব্যবহারের ধরনের ওপর ভিত্তি করে টেক্সট কনটেন্টে এআইয়ের ব্যবহার অনুমানের চেষ্টা করে। উদাহরণস্বরূপ, এআই রাইটিং টুলগুলো সহজলভ্য হওয়ার পর থেকে ‘delves’ এবং ‘showcasing’-এর মতো শব্দের ব্যবহার নাটকীয়ভাবে বেড়েছে।

তবে এআই এবং মানুষের লেখার ধাঁচের মধ্যে পার্থক্য দিন দিন কমছে। এর অর্থ হলো–যেসব এআই ডিটেক্টর এ রকম কোনো নির্দিষ্ট প্যাটার্ন বা ‘সিগনেচার’-এর ওপর ভিত্তি করে কাজ করে, তারা এখন অনেক ক্ষেত্রেই নির্ভরযোগ্যতা হারাচ্ছে।
ছবির ক্ষেত্রে ডিটেক্টরগুলো অনেক সময় ‘এমবেডেড মেটাডেটা’ বিশ্লেষণের মাধ্যমে কাজ করে। উদাহরণস্বরূপ, ‘কনটেন্ট ক্রেডেনশিয়ালস ইন্সপেক্ট’ টুলের মাধ্যমে ব্যবহারকারী কোনো কনটেন্ট কীভাবে এডিট করেছেন, তা দেখা সম্ভব, যদি সেটি নির্ভরযোগ্য কোনো সফটওয়্যার দিয়ে তৈরি ও সম্পাদিত হয়ে থাকে। টেক্সটের মতোই ছবিগুলোকেও এআই-জেনারেটেড কনটেন্টের (যেমন ডিপফেক) যাচাইকৃত ডেটাসেটের সাথে তুলনা করে শনাক্ত করা সম্ভব।
অবশেষে কিছু এআই ডেভেলপার তাদের এআই সিস্টেম থেকে পাওয়া আউটপুটে ওয়াটারমার্ক যুক্ত করা শুরু করেছেন। এগুলো মূলত যেকোনো কনটেন্টের ভেতরে লুকিয়ে থাকা এমন কিছু প্যাটার্ন, যা মানুষের চোখে ধরা পড়ে না। কিন্তু সংশ্লিষ্ট ডেভেলপাররা সহজেই বুঝতে পারেন। তবে বড় কোনো ডেভেলপার প্রতিষ্ঠানই এখন পর্যন্ত তাদের এই এআই ডিটেকশন টুলগুলো জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করেনি। অবশ্য এই টুলগুলোর প্রত্যেকটিরই নিজস্ব কিছু সীমাবদ্ধতা রয়েছে।
এআই ডিটেক্টরগুলো কতটা কার্যকর?
এআই ডিটেক্টরগুলোর কার্যকারিতা অনেক কিছুর ওপর নির্ভর করে। এর মধ্যে রয়েছে কনটেন্ট তৈরিতে কোন এআই টুলস ব্যবহার করা হয়েছে, কিংবা কনটেন্ট তৈরির পর সেগুলো এডিট বা কোনো পরিবর্তন করা হয়েছে কিনা।
তাছাড়া এই টুলগুলো তৈরির সময় এগুলোকে প্রশিক্ষণ দিতে যে ডেটা (Training Data) ব্যবহার করা হয়েছে, সেটার ওপরও এআই ডিটেক্টরগুলোর কার্যকারিতা নির্ভর করে।
উদাহরণস্বরূপ, এআই-জেনারেটেড বা কৃত্রিম বুদ্ধিমত্তার সাহায্যে তৈরি ছবি শনাক্তের জন্য ব্যবহৃত ডেটাসেটগুলোতে মানুষের পূর্ণাবয়ব ছবি কিংবা নির্দিষ্ট কিছু সংস্কৃতির মানুষের ছবির যথেষ্ট ঘাটতি রয়েছে। এর অর্থ হলো–অনেক ক্ষেত্রেই এআই ডিটেকশন টুলগুলো সীমাবদ্ধতার মুখে পড়ছে।
তবে একই কোম্পানির তৈরি এআই টুলের কনটেন্ট শনাক্তের ক্ষেত্রে ‘ওয়াটারমার্ক’ পদ্ধতিটি বেশ কার্যকর হতে পারে। উদাহরণস্বরূপ, আপনি যদি গুগলের ‘ইমাজেন’ (Imagen)-এর মতো কোনো এআই মডেল ব্যবহার করেন, তবে গুগলের নিজস্ব ‘সিনথ-আইডি’ (SynthID) ওয়াটারমার্ক টুলটি সেই আউটপুটগুলো শনাক্ত করতে সক্ষম বলে দাবি করা হয়।

তবে সিনথ-আইডি এখনো সর্বসাধারনের ব্যবহারের জন্য উন্মুক্ত নয়। আবার যদি কোনো কনটেন্ট চ্যাটজিপিটি দিয়ে তৈরি করা হয়, সেক্ষেত্রে এটা কাজ করবে না কারণ, চ্যাটজিপিটি গুগলের বানানো না। এআই ডেভেলপারদের মধ্যে এই পারস্পরিক সমন্বয় বা ‘ইন্টারঅপারেবিলিটি’র অভাব বর্তমানে একটি বড় চ্যালেঞ্জ হিসেবে দাঁড়িয়েছে।
এআই-জেনারেটেড আউটপুটে কোনো পরিবর্তন বা সম্পাদনা করা হলে ডিটেক্টরগুলোকে সহজেই ফাঁকি দেওয়া সম্ভব। উদাহরণস্বরূপ, কেউ যদি ভয়েস ক্লোনিং অ্যাপ ব্যবহার করে কৃত্রিম কণ্ঠস্বর তৈরির পর তাতে আলাদা শব্দ যোগ করে কিংবা ফাইলের কোয়ালিটি কমিয়ে দেয়, তবে ভয়েস এআই ডিটেক্টরগুলো বিভ্রান্ত হতে পারে। এআই দিয়ে তৈরি ছবির ক্ষেত্রেও এই একই সীমাবদ্ধতা লক্ষ্য করা যায়।
এ ক্ষেত্রে এক্সপ্লেইনেবিলিটির অভাব আরও একটি বড় সমস্যা। অনেক এআই ডিটেক্টর কোনো কনটেন্ট এআই দিয়ে তৈরি কি না, সে বিষয়ে কেবল একটি সম্ভাব্যতার হার বা ‘কনফিডেন্স এস্টিমেট’ প্রদান করে। কিন্তু কেন ওই কনটেন্টটি এআই-জেনারেটেড বলে শনাক্ত হলো, তার কোনো কারণ স্পষ্ট করে বলে না।
আমাদের এটি মনে রাখা জরুরি যে, এআই শনাক্তকরণের বিষয়টি, বিশেষ করে স্বয়ংক্রিয় শনাক্তকরণ পদ্ধতিটি এখনো প্রাথমিক পর্যায়ে রয়েছে।
ডিপফেক শনাক্তকরণের সাম্প্রতিক প্রচেষ্টাগুলোর দিকে তাকালে এর একটি ভালো উদাহরণ পাওয়া যায়। মেটার ‘ডিপফেক ডিটেকশন চ্যালেঞ্জ’-এ বিজয়ী মডেলটি প্রতি পাঁচটি ডিপফেকের মধ্যে চারটিই সঠিকভাবে শনাক্ত করতে পেরেছিল। সমস্যা হলো, মডেলটিকে যে ডেটার ওপর ভিত্তি করে প্রশিক্ষণ দেওয়া হয়েছিল, পরীক্ষার সময় সেই একই ডেটাই ব্যবহার করা হয়েছে। এটা অনেকটা পরীক্ষার আগেই প্রশ্নপত্রের উত্তর জেনে যাওয়ার মতো ঘটনা।
যখন নতুন কোনো কনটেন্টের ওপর এই মডেলটি পরীক্ষা করা হয়, তখন আবার এর সাফল্যের হার উল্লেখযোগ্যভাবে কমে যায়। নতুন ডেটাসেটের ক্ষেত্রে এটি প্রতি পাঁচটি ডিপফেকের মধ্যে মাত্র তিনটি সঠিকভাবে শনাক্ত করতে পেরেছে। অর্থাৎ, সাফল্যের হার ৮০ থেকে ৬০ শতাংশে নেমে আসে।
এই সমস্ত তথ্যপ্রমাণে বোঝা যায়, এআই ডিটেক্টরগুলো ভুল করতে পারে এবং বাস্তবে করেও থাকে। এর ফলে ‘ফলস পজিটিভ’ (অর্থাৎ কোনো কিছু মানুষের তৈরি হওয়া সত্ত্বেও তা এআই-জেনারেটেড বলে দাবি করা) এবং ‘ফলস নেগেটিভ’ (অর্থাৎ কোনো কিছু এআই দিয়ে তৈরি হওয়া সত্ত্বেও তা মানুষের তৈরি বলে দাবি করা) উভয় ধরনের বিভ্রান্তিই তৈরি হতে পারে।
ব্যবহারকারীদের জন্য এই ধরনের ভুল চরম বিপর্যয় ডেকে আনতে পারে। যেমন–কোনো শিক্ষার্থীর নিজের লেখা প্রবন্ধকে যদি ভুলবশত এআই-জেনারেটেড হিসেবে বাতিল করে দেওয়া হয়, কিংবা কেউ যদি ভুল করে কোনো এআই-লিখিত ই-মেইলকে বাস্তবের কোনো মানুষের পাঠানো বার্তা বলে বিশ্বাস করে বসেন, তা আসলেই বিপজ্জনক।
প্রযুক্তির যত উন্নয়ন ঘটছে, এটি ততই এক অস্থির প্রতিযোগিতায় রূপ নিচ্ছে। আর এই দ্রুত পরিবর্তনের সঙ্গে তাল মেলাতে বর্তমানে হিমশিম খাচ্ছে এআই ডিটেক্টরগুলো।
উত্তরণের পথ কী?
কেবল একটি টুলের ওপর নির্ভর করা সমস্যাজনক ও ঝুঁকিপূর্ণ। কোনো কনটেন্ট বা বিষয়ের নির্ভরযোগ্যতা যাচাই করার জন্য বিভিন্ন টুলের ব্যবহারই সাধারণত নিরাপদ ও শ্রেয়।
লিখিত কনটেন্টের ক্ষেত্রে তথ্য ও তথ্যের উৎস যাচাইয়ের মাধ্যমে এটি করা সম্ভব। আবার ভিজ্যুয়াল কনটেন্টের ক্ষেত্রে সন্দেহভাজন ছবিটিকে একই সময়ে বা একই স্থানে তোলা অন্যান্য ছবির সাথে তুলনা করা যেতে পারে। এ ছাড়া কোনো বিষয়কে সন্দেহজনক মনে হলে আপনি অতিরিক্ত প্রমাণ বা ব্যাখ্যাও দাবি করতে পারেন।
তবে পরিশেষে যখন শনাক্তকারী টুলগুলো ব্যর্থ হয়, কিংবা অন্য কোনো বিকল্প থাকে না, তখন ব্যক্তি ও প্রতিষ্ঠানের সাথে পারস্পরিক আস্থাই হয়ে ওঠে সবচেয়ে গুরুত্বপূর্ণ বিষয়।

২০২৪ সাল। চট্টগ্রামের জেএম সেন হলে পূজামণ্ডপে ইসলামি গান পরিবেশন নিয়ে হইচই পড়ে যায়। প্রায় সঙ্গে সঙ্গেই সামাজিক যোগাযোগমাধ্যমে এ সম্পর্কিত ভিডিওকে এআই দিয়ে তৈরি বলে প্রচার শুরু হয়। গুরুত্বপূর্ণ ব্যক্তিদের কেউ কেউ এ নিয়ে পোস্টও দেন। পরে দেখা গেল ভিডিওটি এআই দিয়ে তৈরি নয়।

দীর্ঘ সময় ধরে বিশ্বের সবচেয়ে প্রভাবশালী মিডিয়া ব্যক্তিত্ব ছিলেন রুপার্ট মারডক। সম্প্রতি মারডক পরিবারের মধ্যে দ্বন্দ্বের সুর শোনা যাচ্ছে। ৯৪ বছর বয়সী রুপার্ট মারডক ব্যবসার স্বার্থে নিজের পরিবারকে ভেঙে দেওয়ার সিদ্ধান্ত নেন। নেভাদার একটি আদালতে এই পরিবারের একটি মামলা প্রকাশ্যে আসে। সেই মামলার রায় অন