ডিপসিক V4 দেখাচ্ছে যে পরবর্তী AI রেস দক্ষতা নিয়ে

এডমন্টন, কানাডা – জানুয়ারি ২৮: একজন মহিলা একটি কম্পিউটার স্ক্রিনের সামনে সেলফোন ধরে আছেন যেখানে DeepSeek লোগো প্রদর্শিত হচ্ছে, ২৮ জানুয়ারি, ২০২৫, কানাডার এডমন্টনে। (ছবি: আর্টুর উইদাক/NurPhoto via Getty Images)

NurPhoto via Getty Images

DeepSeek V4, DeepSeek-এর বহুল প্রতীক্ষিত আপডেট, এমন একটি তীব্র প্রতিযোগিতামূলক মুহূর্তে এসেছে যখন Open AI-এর GPT 5.5 এবং Anthropic-এর Opus 4.7 একের পর এক লঞ্চ হয়েছে। AI মডেলের প্রতিযোগিতা স্পষ্টতই একটি নতুন মাত্রায় পৌঁছেছে। ওপেন সোর্স টুলসে অনন্য বিশ্বাসী হিসেবে, DeepSeek তার কাঁচা স্কেলের পরিবর্তে খরচ-সাশ্রয়ী দক্ষতা দিয়ে ডেভেলপারদের মুগ্ধ করছে।

প্রিভিউ রিলিজে এক মিলিয়ন টোকেন কনটেক্সট উইন্ডো সহ দুটি Mixture-of-Experts মডেল অন্তর্ভুক্ত রয়েছে: DeepSeek-V4-Pro, মোট ১.৬ ট্রিলিয়ন প্যারামিটার এবং ৪৯ বিলিয়ন সক্রিয় প্যারামিটার সহ, এবং DeepSeek-V4-Flash, মোট ২৮৪ বিলিয়ন প্যারামিটার এবং ১৩ বিলিয়ন সক্রিয় প্যারামিটার সহ।

লং-কনটেক্সট এজেন্ট, কোডিং অ্যাসিস্ট্যান্ট, গবেষণা টুল এবং এন্টারপ্রাইজ কোপাইলট সবই একই বাধার সম্মুখীন: প্রতিটি নতুন জেনারেট করা টোকেন ডকুমেন্ট, কোড, টুল কল এবং মধ্যবর্তী রিজনিং-এর ক্রমবর্ধমান ইতিহাসে ফিরে যেতে হতে পারে। DeepSeek-এর প্রযুক্তিগত রিপোর্ট দেখায় যে তার V4 মডেল ব্যবহারকারীদের আরও বেশি কম্পিউট প্রদানের পরিবর্তে আর্কিটেকচারাল কম্প্রেশনের মাধ্যমে এই সমস্যা সমাধান করে।

মূল উদ্ভাবন: রিজনিং না হারিয়ে মেমরি সংকুচিত করা

DeepSeek V4-এর সবচেয়ে গুরুত্বপূর্ণ আর্কিটেকচারাল পরিবর্তন হল একটি হাইব্রিড অ্যাটেনশন ডিজাইন যা Compressed Sparse Attention বা CSA-কে Heavily Compressed Attention বা HCA-এর সাথে একত্রিত করে। এর অর্থ হল মডেলটি প্রতিটি আগের টোকেন একই ব্যয়বহুল উপায়ে সংরক্ষণ এবং স্ক্যান করে না। CSA কী-ভ্যালু এন্ট্রির গ্রুপ সংকুচিত করে এবং তারপর সবচেয়ে প্রাসঙ্গিক সংকুচিত ব্লকগুলি নির্বাচন করে। HCA আরও আক্রমণাত্মকভাবে সংকুচিত করে, অনেক ছোট মেমরি স্ট্রিমের উপর ঘন মনোযোগ প্রদানের অনুমতি দেয়।

এটি গুরুত্বপূর্ণ কারণ অ্যাটেনশন হল লং-কনটেক্সট AI-এর প্রধান খরচ চালিকাশক্তির একটি। কনটেক্সট দৈর্ঘ্য বৃদ্ধির সাথে সাথে, প্রচলিত অ্যাটেনশন গণনা এবং মেমরি উভয় ক্ষেত্রেই ক্রমশ ব্যয়বহুল হয়ে ওঠে। DeepSeek-এর হাইব্রিড অ্যাটেনশন ডিজাইন লং কনটেক্সটকে মেমরি হায়ারার্কির একটি ইঞ্জিনিয়ারিং সমস্যা হিসেবে বিবেচনা করে। কিছু তথ্যের জন্য সূক্ষ্ম স্থানীয় মনোযোগ প্রয়োজন। কিছু সংকুচিত করা যায়। এই মোডগুলি একত্রিত করে, V4 মিলিয়ন-টোকেন কনটেক্সটকে আরও ব্যবহারিক সক্ষমতায় পরিণত করে। এই বছরের শুরুতে, DeepSeek গবেষকরা Engram প্রস্তাব করে একটি পেপার প্রকাশ করেছিলেন, একটি শর্তসাপেক্ষ মেমরি মডিউল যা স্ট্যাটিক জ্ঞান পুনরুদ্ধারকে ডায়নামিক কম্পিউটেশন থেকে কাঠামোগতভাবে আলাদা করে রিজনিং দক্ষতা উন্নত করে।

কেন এটি আরও AI উদ্ভাবনকে এগিয়ে নিতে পারে

কম ইনফারেন্স খরচ পরিবর্তন করে দেয় কে পরীক্ষা-নিরীক্ষা করতে পারে। যখন লং-কনটেক্সট রিজনিং সস্তা হয়, তখন আরও বেশি ডেভেলপার এমন এজেন্ট তৈরি করতে পারেন যারা সম্পূর্ণ রিপোজিটরি পড়তে, দীর্ঘ আইনি রেকর্ড বিশ্লেষণ করতে, একাধিক ডকুমেন্টের আর্থিক ফাইলিং তুলনা করতে, বা দীর্ঘ টুল-ব্যবহার সেশন জুড়ে কাজ করতে পারে। এটি চ্যাটবট প্রম্পটের বাইরে ডিজাইন স্পেস প্রসারিত করে।

স্টার্টআপের জন্য, DeepSeek V4 উচ্চাভিলাষী অ্যাপ্লিকেশন পরীক্ষার খরচ কমায়। এন্টারপ্রাইজের জন্য, এটি লার্জ-কনটেক্সট ওয়ার্কফ্লোকে আরও বাস্তবসম্মত করে তোলে। ওপেন-সোর্স ডেভেলপারদের জন্য, এটি একটি প্রযুক্তিগত রেসিপি প্রদান করে: MoE স্পার্সিটি, লং-কনটেক্সট কম্প্রেশন, লো-প্রিসিশন ইনফারেন্স, কাস্টম কার্নেল এবং এজেন্টিক টাস্কের জন্য পোস্ট-ট্রেনিং একত্রিত করুন।

হার্ডওয়্যারের বার্তা: AI মডেলগুলি এখন চিপসকে বলছে কী হতে হবে

DeepSeek V4 এই কারণেও উল্লেখযোগ্য যে প্রযুক্তিগত রিপোর্ট হার্ডওয়্যার ডিজাইনে স্পষ্ট পরামর্শ দেয়। দলটি যুক্তি দেয় যে ভবিষ্যতের হার্ডওয়্যার অন্ধভাবে ব্যান্ডউইথ বাড়ানোর পরিবর্তে গণনা এবং যোগাযোগের অনুপাতের জন্য অপ্টিমাইজ করা উচিত।

Reuters-ও জানিয়েছে যে DeepSeek V4-কে Huawei-এর Ascend চিপে চালানোর জন্য অভিযোজিত করা হয়েছে, এবং Huawei জানিয়েছে যে তার Ascend 950-ভিত্তিক সুপারনোড ক্লাস্টারগুলি V4 সিরিজকে সম্পূর্ণরূপে সমর্থন করে। এটি V4-কে একটি বৃহত্তর হার্ডওয়্যার গল্পের অংশ করে তোলে। AI রেস মডেল ওয়েট থেকে ফুল-স্ট্যাক কো-ডিজাইনের দিকে সরে যাচ্ছে, যেখানে মডেল, কার্নেল, মেমরি সিস্টেম, ইন্টারকানেক্ট এবং চিপস একসাথে বিকশিত হয়।

সস্তা বুদ্ধিমত্তা বাজার প্রসারিত করে

DeepSeek V4-এর সবচেয়ে গুরুত্বপূর্ণ পরিণতি হতে পারে অর্থনৈতিক। যখন লং-কনটেক্সট রিজনিং-এর খরচ কমে, AI ব্যবহারের ক্ষেত্রগুলি যা একসময় অনেক বেশি ব্যয়বহুল মনে হত সেগুলি আরও সম্ভাব্য হয়ে ওঠে। ফুল-কোডবেস এজেন্ট, দীর্ঘ-দিগন্ত গবেষণা সহকারী, ডকুমেন্ট-ভারী আইনি ওয়ার্কফ্লো, আর্থিক যথাযথ সতর্কতা টুল, বৈজ্ঞানিক সাহিত্য পর্যালোচনা সিস্টেম এবং এন্টারপ্রাইজ জ্ঞান এজেন্ট সবই সস্তা মেমরি এবং সস্তা ইনফারেন্স থেকে উপকৃত হয়।

এর মানে হল DeepSeek V4 AI রেসকে নতুনভাবে সংজ্ঞায়িত করে। যদি DeepSeek কম মেমরি এবং কম্পিউট প্রয়োজনীয়তায় শক্তিশালী ওপেন মডেল সরবরাহ করতে পারে, তাহলে ক্লোজড-সোর্স নেতারা প্রিমিয়াম মূল্য ন্যায্যতা প্রমাণ করতে আরও বেশি চাপের মুখে পড়বেন। ওপেন-সোর্স প্রতিযোগীরা V4-এর দক্ষতা কৌশলের সাথে মেলানোর চাপে পড়বেন।

Source: https://www.forbes.com/sites/geruiwang/2026/04/26/deepseek-v4-shows-that-the-next-ai-race-is-about-efficiency/

ডিপসিক V4 দেখাচ্ছে যে পরবর্তী AI রেস দক্ষতা নিয়ে

মূল উদ্ভাবন: রিজনিং না হারিয়ে মেমরি সংকুচিত করা

কেন এটি আরও AI উদ্ভাবনকে এগিয়ে নিতে পারে

হার্ডওয়্যারের বার্তা: AI মডেলগুলি এখন চিপসকে বলছে কী হতে হবে

সস্তা বুদ্ধিমত্তা বাজার প্রসারিত করে

আপনি আরও পছন্দ করতে পারেন

ডজকয়েন আবার ট্রায়াঙ্গেলের শীর্ষে: ঐতিহাসিক প্রবণতা ইঙ্গিত দিচ্ছে পরবর্তীতে কী আসবে

Scallop Exploit বাতিল হয়ে যাওয়া কন্ট্র্যাক্টের মাধ্যমে ১৫০K SUI নিষ্কাশন করেছে, ১৭ মাস ধরে লুকিয়ে ছিল গোপন দুর্বলতা

গুগলের মূল কোম্পানি অ্যালফাবেট অ্যান্থ্রপিকে ৪০ বিলিয়ন ডলার পর্যন্ত বিনিয়োগ করতে পারে

ট্রেন্ডিং নিউজ

'বিজ্ঞানের আরও ধ্বংস': ট্রাম্প মার্কিন জাতীয় বিজ্ঞান বোর্ডের প্রতিটি সদস্যকে বরখাস্ত করলেন

এপ্রিল ২০২৬-এর সেরা ক্রিপ্টো পোর্টফোলিওতে এমন একটি প্রেসেল দরকার যা Pepe Coin এবং Shiba Inu একা সরবরাহ করতে পারে না

'কী সর্বনাশ?' ট্রাম্পের তার প্রিয় প্রকল্প বিক্রির সর্বশেষ প্রচেষ্টা পর্যবেক্ষকদের হতবাক করেছে

রোমুয়ালদেজের দুর্নীতির অভিযোগের জবাব বিশ্লেষণ

Coinbase XRP-কে একই প্রাতিষ্ঠানিক টুল দেবে যা সে Bitcoin এবং Gold-কে দেয়

24/7 লাইভ নিউজ

ক্রিপ্টো-এর প্রাইস