জেনারেটিভ ডেটা ইন্টেলিজেন্স

কিভাবে পিডিএফ ওসিআর করবেন

তারিখ:

ওসিআর (অপটিক্যাল ক্যারেক্টার রিকগনিশন) যে কেউ পিডিএফ ডকুমেন্টের সাথে কাজ করে তাদের জন্য একটি গেম চেঞ্জার। PDFগুলি সম্পাদনা করা এবং অনুসন্ধান করা কঠিন হওয়ার জন্য কুখ্যাত। আপনি যখন একটি পিডিএফ ওসিআর করেন, তখন এটি নিশ্চিত করে যে পাঠ্যটি স্ক্যান করা হয়েছে এবং বের করা হয়েছে, এটিকে সম্পূর্ণরূপে অনুসন্ধানযোগ্য, সম্পাদনাযোগ্য এবং অ্যাক্সেসযোগ্য করে তোলে। 

এই নির্দেশিকায়, আমরা OCR-ing PDF-এর বিভিন্ন পদ্ধতির তুলনা করব যা আপনাকে আপনার প্রয়োজনীয়তা অনুসারে সেরাটি বেছে নিতে সাহায্য করবে। আমরা Adobe Acrobat, ওপেন সোর্স টুলস এবং AI-চালিত সমাধান নিয়ে আলোচনা করব। উপরন্তু, আমরা সাধারণ প্রশ্নের উত্তর দেব যেমন কিভাবে একটি Mac-এ পিডিএফ ওসিআর করা যায়, একটি পিডিএফ ওসিআর অনুসন্ধানযোগ্য করা যায় এবং OCR নির্ভুলতা উন্নত করার টিপস শেয়ার করা যায়।

আপনার পিডিএফ ওয়ার্কফ্লো রূপান্তর করতে বরাবর অনুসরণ করুন.

1. Adobe Acrobat Pro ব্যবহার করা

Adobe Acrobat Pro কে OCR-ing PDF এর জন্য সোনার মান হিসেবে বিবেচনা করা হয়। পিডিএফ সফ্টওয়্যারের একজন শিল্প নেতা হিসাবে, অ্যাডোব অ্যাক্রোব্যাট প্রোকে উন্নত ওসিআর ক্ষমতা সহ প্যাক করে যা সহজেই জটিল নথিগুলি পরিচালনা করে।

আপনি দুটি উপায়ে অ্যাক্রোব্যাট প্রো ব্যবহার করে একটি নথি ওসিআর করতে পারেন:

পদ্ধতি 1

  1. Adobe Acrobat Pro-তে PDF ফাইলটি খুলুন।
  2. টুলবারে "সমস্ত টুলস" এ ক্লিক করুন।
  3. একটি মেনু প্রদর্শিত হবে, সমস্ত উপলব্ধ সরঞ্জাম তালিকাভুক্ত। "পিডিএফ সম্পাদনা করুন" এ ক্লিক করুন।
  4. অ্যাক্রোব্যাট স্বয়ংক্রিয়ভাবে ওসিআর প্রয়োগ করবে এবং পাঠ্য রূপান্তর করবে।
  5. নথিটি এখন সম্পূর্ণরূপে সম্পাদনাযোগ্য এবং অনুসন্ধানযোগ্য। প্রয়োজন অনুসারে ফন্ট পরিবর্তন করুন বা টীকা যোগ করুন। আপনি অনুসন্ধান টুল ব্যবহার করে ডকুমেন্ট অনুসন্ধান করতে পারেন.

পদ্ধতি 2

  1. Adobe Acrobat Pro খুলুন। 
  2. টুলবারে "সমস্ত টুলস" এ ক্লিক করুন।
  3. একটি মেনু প্রদর্শিত হবে, সমস্ত উপলব্ধ সরঞ্জাম তালিকাভুক্ত। "স্ক্যান এবং ওসিআর" এ ক্লিক করুন।
  4. স্ক্যান এবং ওসিআর টুলে, আপনি যে পিডিএফ ফাইলটি ওসিআর করতে চান তা নির্বাচন করুন বা সরাসরি সংযুক্ত স্ক্যানার ব্যবহার করে একটি ফিজিক্যাল ডকুমেন্ট স্ক্যান করুন।
  5. ছবি পরিষ্কার করার প্রয়োজন হলে "বর্ধিত করুন" এ ক্লিক করুন। এটি OCR নির্ভুলতা উন্নত করবে। 
  6. ওসিআর প্রক্রিয়া শুরু করতে "পাঠ্য সনাক্ত করুন" এ ক্লিক করুন। একবার সম্পূর্ণ হলে, PDF অনুসন্ধানযোগ্য এবং সম্পাদনাযোগ্য হয়ে উঠবে। আপনি এখন পাঠ্য সম্পাদনা করতে পারেন।

অ্যাক্রোব্যাট প্রো ব্যবহার করার অপরিহার্য সুবিধা হল এর উন্নত ওসিআর ইঞ্জিন, যা জটিল লেআউট, বহু-কলাম নথি, কম-রেজোলিউশন স্ক্যান এবং উচ্চ নির্ভুলতার সাথে হাতে লেখা পাঠ্য পরিচালনা করতে পারে। এটি উইন্ডোজ, ম্যাক এবং অ্যান্ড্রয়েড ডিভাইসগুলিতে উপলব্ধ, এবং আপনি এই বৈশিষ্ট্যগুলি অনলাইনেও অ্যাক্সেস করতে পারেন৷ তাছাড়া, এটি আপনার Adobe মোবাইল স্ক্যান অ্যাপের সাথে সংযুক্ত, যা আপনাকে যেতে যেতে নথি স্ক্যান করতে এবং আপনার অ্যাক্রোব্যাট লাইব্রেরিতে সিঙ্ক করতে দেয়।

যাইহোক, ওসিআর ক্ষমতাগুলি অ্যাক্সেস করতে আপনাকে অবশ্যই অ্যাক্রোব্যাট প্রো গ্রাহক হতে হবে। সাবস্ক্রিপশনের মূল্য নির্ধারণ করা হয়েছে US $ 19.99/mo. উপরন্তু, এটি আপনাকে একাধিক ফাইল আপলোড করার অনুমতি দেয়, আপনাকে প্রতিটি ফাইলকে ম্যানুয়ালি ওসিআর করতে হবে। সুতরাং, আপনার কাছে প্রক্রিয়া করার জন্য অনেক ফাইল থাকলে, এটি ক্লান্তিকর হতে পারে।

Tesseract এর মত ওপেন-সোর্স OCR টুলগুলি পিডিএফগুলিকে অনুসন্ধানযোগ্য, সম্পাদনাযোগ্য ফাইলগুলিতে রূপান্তর করার জন্য একটি বিনামূল্যের বিকল্প অফার করে। যদিও এগুলি Adobe Acrobat-এর মতো বাণিজ্যিক সমাধানগুলির মতো সম্পূর্ণ বৈশিষ্ট্যযুক্ত নাও হতে পারে, তবে বেশিরভাগ ব্যবহারের ক্ষেত্রে তারা একটি শালীন স্তরের নির্ভুলতা প্রদান করে। 

Tesseract উইন্ডোজ, ম্যাক এবং লিনাক্সের জন্য উপলব্ধ। এটি ব্যবহার করার জন্য আপনাকে প্রথমে এটি আপনার কম্পিউটারে ইনস্টল করতে হবে৷ একবার ইনস্টল হয়ে গেলে, আপনি পিডিএফ ওসিআর করতে এই পদক্ষেপগুলি অনুসরণ করতে পারেন:

  1. পিডিএফ ফাইলটি ভিউয়ার বা এডিটর টুলে খুলুন যেমন PDFelement। 
  2. আপনি ওসিআর করতে চান এমন এলাকা বা পৃষ্ঠা নির্বাচন করুন এবং একটি স্ক্রিনশট নিন। প্রয়োজনে ছবিটি ক্রপ করুন।
  3. Tesseract অ্যাক্সেস করতে টার্মিনাল খুলুন। যদি Tesseract টার্মিনালে পাওয়া না যায়, Tesseract ইনস্টলেশন ডিরেক্টরিতে সরাসরি যেতে পরিবেশ পরিবর্তনশীল পাথ সম্পাদনা করুন।
  4. আপনি যে ইমেজ ফাইলটি OCR করতে চান তার পাথ কপি করুন। উদাহরণস্বরূপ: "C:UsersJohnDoePicturesScreenshotsScreenshot 230844.png"
  5. টার্মিনালে নিম্নলিখিত কমান্ডটি লিখুন: "C:UsersJohnDoePicturesScreenshots>tesseract Screenshot 230844.png"। এটি চিত্রটিতে OCR চালাবে এবং এটি পাওয়া যে কোনও পাঠ্যকে সম্পাদনাযোগ্য বিন্যাসে রূপান্তর করবে। 
  6. একবার OCR সম্পূর্ণ হলে, Tesseract সমস্ত নিষ্কাশিত পাঠ্য ধারণকারী একটি ফাইল তৈরি করবে।
  7. OCR-ed বিষয়বস্তু দেখতে ও সম্পাদনা করতে এই ফাইলটি যেকোনো টেক্সট এডিটরে খুলুন। প্রয়োজনে Tesseract বিকল্পের সম্পূর্ণ তালিকা পেতে আপনি `–help` কমান্ডটিও প্রবেশ করতে পারেন।

Tesseract এর গুরুত্বপূর্ণ সুবিধা হল এটি সম্পূর্ণ বিনামূল্যে এবং ওপেন সোর্স, তাই আপনাকে কোন লাইসেন্সিং ফি দিতে হবে না। এটি পরিষ্কার স্ক্যান এবং টাইপ করা নথিতে ভাল কাজ করে। 

যাইহোক, এটি হাতে লেখা পাঠ্য, জটিল বিন্যাস, রঙিন ব্যাকগ্রাউন্ড এবং কম-রেজোলিউশন স্ক্যানের সাথে লড়াই করে। যদি আপনার নথিগুলি পরিষ্কার এবং টাইপ করা হয়, Tesseract মৌলিক OCR চাহিদাগুলির জন্য একটি বিনামূল্যে সমাধান অফার করে৷ 

OCR চালানোর আগে স্ক্যান প্রিপ্রসেস করে আপনি Tesseract এর নির্ভুলতা উন্নত করতে পারেন — উজ্জ্বলতা বা বৈপরীত্য সামঞ্জস্য করা, ফিল্টার প্রয়োগ করা, চিত্রগুলিকে উচ্চতর করা এবং আরও অনেক কিছু।

3. Nanonets' PDF OCR ব্যবহার করা

Nanonets হল একটি AI-চালিত নথি প্রক্রিয়াকরণ সমাধান যা উন্নত OCR ক্ষমতা প্রদান করে। Acrobat Pro বা Tesseract এর বিপরীতে, Nanonets সম্পূর্ণ অনলাইন এবং কোনো ইনস্টলেশনের প্রয়োজন নেই। আপনি কেবল তাদের ক্লাউড প্ল্যাটফর্মে আপনার পিডিএফগুলি আপলোড করুন এবং এটি অত্যাধুনিক ওসিআর অ্যালগরিদম ব্যবহার করে অবিলম্বে সেগুলি প্রক্রিয়াকরণ শুরু করে। এটি এমনকি পুরো ফোল্ডার এবং শত শত পিডিএফ একবারে প্রক্রিয়া করতে পারে।

Nanonets সাধারণ টাইপ করা নথি থেকে শুরু করে জটিল লেআউটগুলি হস্তলিখিত টীকা, রঙিন ব্যাকগ্রাউন্ড, গ্রাফ এবং টেবিলের সাথে সবকিছু পরিচালনা করতে পারে, সমস্ত নথির প্রকারের উচ্চ নির্ভুলতা অর্জনের জন্য গভীর শিক্ষার মডেল ব্যবহার করে।

এখানে কিভাবে এটা কাজ করে:

  1. দেখুন Nanonets.com এবং একটি নিখরচায় অ্যাকাউন্ট তৈরি করুন।
  2. চালান, রসিদ বা ক্রয় আদেশের জন্য ন্যানোনেটের বিস্তৃত প্রাক-প্রশিক্ষিত মডেল থেকে একটি OCR মডেল নির্বাচন করুন। আপনি আপনার নির্দিষ্ট নথির ধরন অনুসারে একটি কাস্টম মডেলও তৈরি করতে পারেন।
  3. আপনার এক্সট্র্যাক্ট করার জন্য প্রয়োজনীয় বিভিন্ন লেআউট এবং ডেটা ক্ষেত্র প্রতিনিধিত্বকারী নথিগুলি আপলোড করুন। Nanonets আপনার নথির গঠন বুঝতে এই নমুনা বিশ্লেষণ করবে.
  4. আপনি যে মূল ক্ষেত্রগুলি ক্যাপচার করতে চান তা নির্ধারণ করুন, যেমন তারিখ, মোট পরিমাণ এবং টেবিল ডেটা। আপনি টেবিল, পাঠ্য, JSON, বা XML সহ প্রায় যেকোনো বিন্যাসে ডেটা ক্যাপচার করতে পারেন। Nanonets স্বয়ংক্রিয়ভাবে আপনার PDF থেকে ডেটা বের করবে এবং প্রয়োজনীয় বিন্যাসে আউটপুট করবে।
  5. একবার কনফিগার হয়ে গেলে, আপনার PDF ডকুমেন্টগুলি আপলোড করুন যেগুলি OCR-ed হতে হবে৷ Nanonets উন্নত OCR এবং বুদ্ধিমান ডেটা নিষ্কাশন অ্যালগরিদম ব্যবহার করে ফাইলগুলিকে স্ট্রাকচার্ড ডেটা আউটপুট সহ অনুসন্ধানযোগ্য, সম্পাদনাযোগ্য বিন্যাসে রূপান্তর করতে প্রক্রিয়া করবে। 
  6. এক্সট্র্যাক্ট করা ডেটা সুন্দরভাবে সংগঠিত এবং গঠন করা হয়েছে যাতে আপনি ম্যানুয়াল প্রচেষ্টা ছাড়াই সরাসরি অন্যান্য ব্যবসায়িক সিস্টেমে প্রবেশ করতে পারেন। আপনি এটি JSON, XML, orcustom ফর্ম্যাট হিসাবে রপ্তানি করতে পারেন।

Nanonets 500 পর্যন্ত প্রসেসিং পৃষ্ঠা সহ একটি বিনামূল্যের সংস্করণ অফার করে যাতে আপনি কোনো খরচ ছাড়াই এটি পরীক্ষা করতে পারেন। এর পর খরচ হয় প্রতি পৃষ্ঠায় $ 0.3 OCR এর জন্য।

অন্যান্য সমাধান থেকে ভিন্ন, Nanonets অত্যন্ত মাপযোগ্য। এটি প্রতি ঘন্টায় হাজার হাজার পৃষ্ঠা প্রক্রিয়া করতে পারে, এটি নিশ্চিত করে যে ভলিউম যাই হোক না কেন, আপনার ফাইলগুলি প্রায় সঙ্গে সঙ্গে প্রক্রিয়া করা হয়৷

আপনি অন্যান্য অ্যাপে প্রসেসড ডেটা স্ট্রিম করতে ওয়েবহুক সেট আপ করতে পারেন বা কাস্টম ইন্টিগ্রেশন তৈরি করতে Nanonets এর ডেভেলপার API ব্যবহার করতে পারেন।

কিভাবে PDF OCR প্রক্রিয়া উন্নত করা যায়

OCR প্রযুক্তি, যখন কার্যকরভাবে প্রয়োগ করা হয়, তখন আপনার সময় এবং সম্পদ বাঁচাতে পারে। কমাতে সক্ষম হচ্ছে কল্পনা ক্ষেত্র প্রতি ডেটা এন্ট্রি সময় 95%. আপনার দল জাগতিক ডেটা এন্ট্রির চেয়ে আরও অর্থপূর্ণ কাজগুলিতে ফোকাস করতে পারে।

আপনার পিডিএফ ওসিআর প্রক্রিয়ার নির্ভুলতা এবং কার্যকারিতা উন্নত করার জন্য টিপস অন্বেষণ করা যাক:

1. OCR এর আগে প্রিপ্রসেস স্ক্যান

আপনি যদি স্ক্যান করা নথি নিয়ে কাজ করেন, আপনি উজ্জ্বলতা, বৈসাদৃশ্য এবং তীক্ষ্ণতা সামঞ্জস্য করতে পারেন এবং শব্দ কমাতে এবং স্বচ্ছতা উন্নত করতে ফিল্টার বা চিত্র বর্ধিতকরণ কৌশল প্রয়োগ করতে পারেন। 

এটি উল্লেখযোগ্যভাবে OCR নির্ভুলতা বাড়াবে। Adobe এর স্ক্যানার অ্যাপটি বিল্ট-ইন ইমেজ বর্ধিতকরণ বৈশিষ্ট্য সহ আসে। স্ক্যানগুলি পরিষ্কার করতে আপনি পেপারস্ক্যান এবং NAPS2 এর মতো সরঞ্জামগুলিও ব্যবহার করতে পারেন৷ এই সম্পাদনাগুলির পরে, আপনি OCR চালানোর আগে সম্পাদিত ছবিগুলি PDF হিসাবে সংরক্ষণ করতে পারেন৷

2. বৈধতা কর্মপ্রবাহ এবং অনুমোদনের শ্রেণিবিন্যাস সেট আপ করুন

নিষ্কাশিত ডেটার জন্য বৈধতা নিয়ম সেট আপ করে ডেটা গুণমান উন্নত করুন। উদাহরণস্বরূপ, যদি একটি নথিতে অর্ডার নম্বরে পাঁচটি সংখ্যা না থাকে, তাহলে এটি স্বয়ংক্রিয়ভাবে প্রত্যাখ্যান বা ম্যানুয়াল পর্যালোচনার জন্য পতাকাঙ্কিত হয়৷ এইভাবে, আপনি নিষ্কাশন ত্রুটিগুলি ধরতে পারেন এবং শুধুমাত্র বৈধ ডেটা অনুমোদন করতে পারেন৷ নিষ্কাশিত ডেটা যাচাই করার জন্য আপনি ডাটাবেসের সাথে আপনার OCR সিস্টেমকে একীভূত করতে পারেন।

আপনি অনুমোদনের শ্রেণিবিন্যাস সেট আপ করতে পারেন যেখানে জুনিয়র কর্মচারীরা প্রথমে ডেটা পর্যালোচনা করে, তারপরে চূড়ান্ত সাইন-অফের জন্য সিনিয়র কর্মচারীরা। স্বয়ংক্রিয় বিজ্ঞপ্তি এবং লাইভ স্ট্যাটাস আপডেটের সাহায্যে, আপনি স্বচ্ছতা বজায় রাখতে পারেন এবং অনুমোদনের পিছুটান এড়াতে পারেন, যার ফলে দ্রুত ডকুমেন্ট প্রসেসিং হয়।

3. স্বয়ংক্রিয় কর্মপ্রবাহ তৈরি করুন

একটি গাড়ি ভাড়া চালানোর কল্পনা করুন এবং স্বয়ংক্রিয়ভাবে সেলসফোর্সে গ্রাহকদের ড্রাইভিং লাইসেন্সের ডেটা রপ্তানি করতে সক্ষম হবেন বা কোনও ম্যানুয়াল কাজ ছাড়াই QuickBooks-এ চালান ডেটা পাঠাতে পারবেন৷ এটি শুধুমাত্র আপনার পিডিএফ ওসিআরকে অপ্টিমাইজ করবে না কিন্তু ডাউনস্ট্রিম কার্যক্রমও করবে।

API-এর মাধ্যমে ব্যবসায়িক অ্যাপের সাথে আপনার OCR সমাধান একীভূত করা এই অটোমেশনকে সম্ভব করে তোলে। উদাহরণস্বরূপ, Nanonets-এর সাথে, আপনি কেবল ডকুমেন্ট প্রসেসিং সমাপ্তি, ডেটা নিষ্কাশন, বা একটি নতুন ফাইল আপলোডের মতো ইভেন্টের উপর ভিত্তি করে ট্রিগার সেট আপ করেন। ইন্টিগ্রেশন স্বয়ংক্রিয়ভাবে Nanonets থেকে কাঙ্ক্ষিত ব্যবসায়িক সিস্টেমে স্ট্রাকচার্ড ডেটা রপ্তানি করবে- QuickBooks, Xero, Microsoft Dynamics, Zendesk এবং আরও অনেকগুলি সহ- ম্যানুয়াল প্রচেষ্টাগুলি সরিয়ে দেওয়া এবং সিস্টেমগুলির মধ্যে নির্বিঘ্ন ডেটা প্রবাহ নিশ্চিত করা।

4. এআই/এমএল ক্ষমতা সহ উন্নত ওসিআর-এ বিনিয়োগ করুন

নিয়ম-ভিত্তিক ওসিআরের বিপরীতে, এআই মডেলগুলি অভিযোজিত হয় — ক্রমাগত মানুষের সংশোধন থেকে শেখে এবং সময়ের সাথে সাথে উন্নতি করে। উদাহরণ স্বরূপ, Nanonets লক্ষ লক্ষ নথিতে প্রশিক্ষিত একটি মালিকানাধীন AI মডেল অফার করে, যা এটিকে জটিল এবং চ্যালেঞ্জিং লেআউটগুলি দক্ষতার সাথে পরিচালনা করতে দেয়।

AI-চালিত OCR নিশ্চিত করে যে আপনি প্রসঙ্গ না হারিয়ে নথি থেকে তথ্য বের করতে পারবেন। এটি বিভিন্ন ভাষা, আর্থিক, আইনি, বা পরিমাপ ইউনিট পরিচালনা করতে পারে। টেমপ্লেট-ভিত্তিক বা নিয়ম-চালিত নিষ্কাশনের সাথে এই স্তরের বুদ্ধিমত্তা সম্ভব নয় যা সঠিক ক্ষেত্রের অবস্থানের উপর নির্ভর করে।

5. AI-OCR মডেলগুলিকে প্রশিক্ষণ দিন৷

যদিও AI-চালিত OCR সমাধানগুলি প্রাক-প্রশিক্ষিত মডেলগুলির সাথে আসে, তাদের আপনার নির্দিষ্ট নথির ধরন এবং লেআউটগুলির উপর আরও প্রশিক্ষণ দেওয়া সঠিকতাকে আরও বাড়িয়ে তুলতে পারে। উদাহরণস্বরূপ, Nanonets আপনাকে বিভিন্ন টেমপ্লেট, বিন্যাস এবং ক্ষেত্রগুলিকে উপস্থাপন করে নথিগুলির একটি নমুনা সেট আপলোড করতে দেয় যা আপনি ক্যাপচার করতে চান।

এই নমুনাগুলি মডেলটিকে আপনার নথির গঠন বুঝতে এবং PDF OCR প্রক্রিয়াটিকে সূক্ষ্ম-টিউন করতে সাহায্য করে। আপনি যাচাইকরণের সময় চিহ্নিত নিষ্কাশন ত্রুটিগুলি সংশোধন করে প্রতিক্রিয়া প্রদান করতে পারেন। এই হিউম্যান-ইন-দ্য-লুপ প্রশিক্ষণ ক্রমাগত AI মডেলের কর্মক্ষমতা বাড়ায়।

6. প্রয়োজন হলে কাস্টম OCR মডেল তৈরি করুন

কখনও কখনও, প্রাক-প্রশিক্ষিত মডেলগুলি আপনার নথির সমস্ত জটিলতাগুলি কভার করতে পারে না। উদাহরণস্বরূপ, আপনার অনন্য ক্ষেত্র এবং বিন্যাস সহ শিল্প-নির্দিষ্ট নথি থাকতে পারে। এই ধরনের ক্ষেত্রে, আপনি আপনার নথিতে বিশেষভাবে প্রশিক্ষিত কাস্টম এআই মডেল তৈরি করতে আপনার OCR বিক্রেতার সাথে কাজ করতে পারেন। 

Nanonets-এর সাহায্যে ব্যবহারকারীরা তাদের নথির ধরন এবং ক্ষেত্রগুলির জন্য নির্দিষ্ট কাস্টম মডেল তৈরি করতে পারে। তারা নমুনা নথি আপলোড করতে পারে এবং তারা যে লেবেলগুলি বের করতে চায় তার সাথে টীকা করতে পারে৷ AI তারপর এই উদাহরণগুলি থেকে শেখে এবং নির্দিষ্ট তথ্য চিনতে এবং বের করার জন্য প্রশিক্ষিত হয়। সর্বোত্তম নির্ভুলতা অর্জনের জন্য সিস্টেমের প্রতিটি লেবেলের জন্য কমপক্ষে দশটি উদাহরণের প্রয়োজন, এবং ব্যবহারকারীরা প্রতিটি লেবেলের জন্য উদাহরণের সংখ্যা নিরীক্ষণ করতে পারে এবং প্রয়োজনে আরও যোগ করতে পারে।

Nanonets PDF OCR দিয়ে কিভাবে শুরু করবেন

Nanonets PDF OCR দিয়ে শুরু করা সহজ করে তোলে। Nanonets ওয়েবসাইটে একটি বিনামূল্যে অ্যাকাউন্টের জন্য সহজভাবে সাইন আপ করুন। আপনি একটি ক্রেডিট কার্ড প্রদান করতে হবে না. 

আপনাকে শুরু করতে সাহায্য করার জন্য এখানে একটি নির্দেশিকা রয়েছে:

  1. একটি ফ্রী একাউন্ট তৈরির জন্য সাইন আপ করুন: পরিদর্শন Nanonets.com এবং একটি বিনামূল্যের অ্যাকাউন্টের জন্য সাইন আপ করুন—কোন ক্রেডিট কার্ডের প্রয়োজন নেই৷
  2. একটি মডেল তৈরি করুন বা চয়ন করুন: আপনি আপনার নির্দিষ্ট নথির ধরনগুলির জন্য একটি কাস্টম OCR মডেল তৈরি করতে পারেন বা চালান, রসিদ এবং আরও অনেক কিছুর জন্য Nanonets-এর প্রাক-প্রশিক্ষিত মডেলগুলি থেকে নির্বাচন করতে পারেন৷
  3. স্বয়ংক্রিয় আমদানি সেট আপ করুন৷: স্বয়ংক্রিয়ভাবে ক্রমাগত OCR প্রক্রিয়াকরণের জন্য Nanonets-এ নতুন PDF আমদানি করতে ইমেল ফরওয়ার্ড করুন বা ক্লাউড স্টোরেজ সংযুক্ত করুন।
  4. নমুনা নথি আপলোড করুন: আপনি এক্সট্রাক্ট করতে চান এমন বিভিন্ন টেমপ্লেট, ফরম্যাট এবং ডেটা ক্ষেত্র প্রতিনিধিত্ব করে অন্তত 10টি নমুনা নথি আপলোড করুন। এটি এআই মডেলকে প্রশিক্ষণ দিতে সাহায্য করবে।
  5. নিষ্কাশনের জন্য ক্ষেত্র সংজ্ঞায়িত করুন: আপনার নথিগুলি থেকে আপনি যে গুরুত্বপূর্ণ ডেটা ক্ষেত্রগুলি বের করতে চান, যেমন তারিখ, পরিমাণ, টেবিল ডেটা ইত্যাদির জন্য কেবল নাম উল্লেখ করুন৷
  6. বৈধতা সেট আপ করুন: নিষ্কাশিত ডেটা যাচাই করার জন্য নিয়মগুলি কনফিগার করুন এবং সঠিকতা নিশ্চিত করতে সংশোধনের জন্য যেকোনো ত্রুটিকে ফ্ল্যাগ করুন৷
  7. আপনার ফাইলগুলি প্রক্রিয়া করুন: আপনার পিডিএফ ডকুমেন্ট আপলোড করুন। Nanonets ওসিআর এবং বুদ্ধিমান ডেটা নিষ্কাশনের মাধ্যমে তাৎক্ষণিকভাবে তাদের প্রক্রিয়া করবে।
  8. পর্যালোচনা এবং তথ্য অনুমোদন: নিষ্কাশিত ডেটা পরীক্ষা করুন এবং বৈধ এন্ট্রি অনুমোদন করুন। স্ট্যাটাস আপডেটের সাথে স্বচ্ছতা বজায় রাখুন।
  9. ব্যবসায়িক সিস্টেমে ডেটা রপ্তানি করুন: একবার অনুমোদিত হলে, আপনার ERP, অ্যাকাউন্টিং, CRM বা অন্যান্য সিস্টেমে নির্বিঘ্নে কাঠামোগত ডেটা রপ্তানি করুন।
  10. স্বয়ংক্রিয় কর্মপ্রবাহ: যখন একটি নথি প্রক্রিয়া করা হয় বা ডেটা বের করা হয় তখন অ্যাপগুলিতে ডেটা স্ট্রিম করতে ট্রিগার সেট আপ করুন৷ ম্যানুয়াল প্রচেষ্টা সরান.

সামগ্রিকভাবে, Nanonets আপনার নথির কর্মপ্রবাহে দ্রুত এবং সহজে বুদ্ধিমান ওসিআর ক্ষমতা যোগ করে। স্ব-শিক্ষার এআই ইঞ্জিনটি শুরু থেকেই উচ্চ নির্ভুলতা প্রদান করে এবং কাস্টমাইজেশনকে জটিল নথিগুলি পরিচালনা করার অনুমতি দেয়। বিজনেস সিস্টেমের সাথে নিরবচ্ছিন্ন ইন্টিগ্রেশন সত্যিকারের এন্ড-টু-এন্ড অটোমেশন সক্ষম করে।

মোড়ক উম্মচন

বুদ্ধিমান OCR এবং ডেটা নিষ্কাশন ডকুমেন্ট ওয়ার্কফ্লো থেকে অসাধারণ মান আনলক করতে সাহায্য করতে পারে। মূলটি হল Nanonets-এর মতো একটি সমাধান বেছে নেওয়া যা শুরু থেকেই AI-চালিত OCR অফার করে এবং নির্দিষ্ট প্রয়োজনের জন্য কাস্টমাইজেশনের অনুমতি দেয়। 

কাস্টম মডেল তৈরি করার জন্য স্ব-পরিষেবা ক্ষমতার সাথে, সঠিকতা এবং স্বয়ংক্রিয়তা ক্রমাগত উন্নতি করে, এমনকি আপনার নথিগুলি বিকশিত হওয়ার সাথে সাথে। পরিশেষে, এটি নিশ্চিত করে যে আপনি উত্পাদনশীলতা এবং বৃদ্ধি চালনার জন্য স্কেলে অসংগঠিত ডেটা পরিচালনা করতে পারেন।

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি