চতুর্থ অধ্যায়
AI-এর
ভূদৃশ্য
এই মুহূর্তে ব্যবহার করা যায়
এমন প্রতিটা AI টুলের একটা ফিল্ড গাইড।
সর্বশেষ আপডেট মার্চ ২০২৬
বেশিরভাগ মানুষ যখন "AI" বলে, তারা ChatGPT বোঝায়। এটা "ইন্টারনেট" বলে শুধু Google বোঝানোর মতো। এই মুহূর্তে শত শত AI টুল আছে যেগুলো তুমি আজই ব্যবহার করতে পারো — যেগুলো একটা বাক্য থেকে ফটোরিয়ালিস্টিক ছবি তৈরি করে, পুরো গান কম্পোজ করে, বা তোমার গবেষণার বিষয়ে প্রতিটা একাডেমিক পেপার পড়ে তিন প্যারাগ্রাফে সারমর্ম লিখে দেয়। এই অধ্যায় তোমার এই ভূখণ্ডের মানচিত্র।
আটটি পরিবার
এটাকে বাদ্যযন্ত্রের মতো ভাবো। পিয়ানো আর ড্রাম কিট দুটোই "যন্ত্র," কিন্তু তুমি একজন পিয়ানোবাদককে বিট বাজাতে বলবে না। AI টুলগুলোও একই রকম — ছবি তৈরির জন্য বানানো টুল আর কোডের জন্য বানানো টুল মৌলিকভাবে আলাদা। তোমার সামনে যত টুলই আসুক, সবকটা এই আটটা পরিবারের কোনো একটায় পড়ে।
ছবি জেনারেটর
টেক্সট ঢোকে, ছবি বের হয়। Midjourney, DALL-E 3, Stable Diffusion, Flux, Ideogram।
ছবি এডিটর
আসল ছবি নিয়ে সেটাকে রূপান্তরিত করো। Photoshop AI, Magnific, Clipdrop।
ভিডিও ক্রিয়েটর
টেক্সট বা স্থিরচিত্র থেকে ভিডিও ক্লিপ তৈরি করো। Sora, Runway, Kling, Pika।
সংগীত ও অডিও
একটা প্রম্পট থেকে পুরো গান, ভয়েস ক্লোনিং, সাউন্ড ইফেক্ট। Suno, Udio, ElevenLabs।
গবেষণা এজেন্ট
AI যেটা তোমার হয়ে ইন্টারনেট পড়ে। Perplexity, Elicit, Consensus, NotebookLM।
AI ব্রাউজার
এজেন্ট যেগুলো মানুষের মতো ওয়েব ব্রাউজ করে। Arc, Operator, Claude Computer Use।
কোডিং টুল
AI যেটা কোড লেখে, এডিট করে, আর ডিবাগ করে। Claude Code, Cursor, Antigravity, Copilot।
চ্যাটবট ও সহকারী
যে সাধারণ-উদ্দেশ্যের কথোপকথন AI তুমি আগে থেকেই চেনো: ChatGPT, Claude, Gemini।
মূল শিক্ষা
যে ১০টা AI টুল ভাসা ভাসা চেনে, সে সবসময় একটা টুল গভীরভাবে জানা কাউকে ছাড়িয়ে যাবে। একজন পেশাদার ছুতোরের কোনো প্রিয় টুল নেই — তার আছে প্রতিটা কাজের জন্য প্রিয় টুল।
পুরো ক্যাটালগ ঘুরে দেখো। যেকোনো টুলে ক্লিক করো জানতে এটা কী করে।
এখন পর্যন্ত এই টুলগুলো শুধু তোমার কথায় সাড়া দেয়। যদি ওরা নিজে থেকে কাজ করতে পারতো? সেটাই হলো টুল থেকে এজেন্টে লাফ — আর এটা সবকিছু বদলে দেয়।