জেনারেটিভ ডেটা ইন্টেলিজেন্স

কিভাবে সহজে একটি PDF থেকে কপি এবং পেস্ট করতে হয়

তারিখ:

একটি পিডিএফ ফাইল থেকে বিষয়বস্তু অনুলিপি করার সংগ্রাম বাস্তব. আপনি একটি টেবিল, টেক্সট, বা একটি ছবি বের করার চেষ্টা করছেন না কেন, আপনি মনে করেন যে আপনি এটি সব পেয়েছেন, কপি হিট করুন, এবং তারপর যখন আপনি এটি পেস্ট করার চেষ্টা করেন, আপনি দেখতে পান যে এটি শুধুমাত্র অর্ধেক তৈরি করেছে, বা বিন্যাসটি এলোমেলো হয়েছে আপ হতাশাজনক, তাই না?

কপি-পেস্ট করার প্রক্রিয়াটি সঠিক সরঞ্জাম এবং কৌশলগুলির সাহায্যে সহজে করা যেতে পারে। এই বিস্তৃত নির্দেশিকা আপনাকে ফরম্যাটিং ধরে রাখার সময় PDF ফাইল থেকে পাঠ্য, চিত্র, টেবিল এবং অন্যান্য ডেটা অনুলিপি এবং পেস্ট করার বিভিন্ন পদ্ধতির মাধ্যমে নিয়ে যাবে।

1. PDF থেকে টেক্সট কপি এবং পেস্ট করুন

আপনাকে একাডেমিক উদ্দেশ্যে, বিষয়বস্তু তৈরি, আইনি কারণে বা কেবল রেফারেন্সের জন্য PDF থেকে পাঠ্য অনুলিপি করতে হতে পারে। স্ট্রাকচার্ড বা আনস্ট্রাকচার্ড পিডিএফ থেকে টেক্সট কপি করার কয়েকটি উপায় দেখুন:

ক Adobe Acrobat Reader এর সিলেক্ট টুল ব্যবহার করুন

Adobe Acrobat Reader অন্যতম জনপ্রিয় পিডিএফ ভিউয়ার উপলব্ধ। আপনি যদি অতিরিক্ত সফ্টওয়্যার ইনস্টল করতে বা নতুন কিছুর জন্য সাইন আপ করতে না চান তবে অ্যাক্রোব্যাট রিডারের অন্তর্নির্মিত পাঠ্য নির্বাচন সরঞ্জামটি ব্যবহার করুন।

শুরু করতে এই পদক্ষেপগুলি অনুসরণ করুন:

  1. Adobe Acrobat Reader এ আপনার PDF খুলুন।
  2. পিডিএফ-এ টেক্সট হাইলাইট করতে টুলবারে "সিলেক্ট টুল" বোতামে (তীর আইকন) ক্লিক করুন।
  3. পাঠ্য নির্বাচন করতে ক্লিক করুন এবং টেনে আনুন। প্রয়োজনে আপনি একাধিক পৃষ্ঠা জুড়ে চয়ন করতে পারেন।
  4. টেক্সট হাইলাইট করুন, ডান-ক্লিক করুন, "কপি করুন" নির্বাচন করুন, অথবা উইন্ডোজে Ctrl+C বা Mac-এ Command+C ব্যবহার করুন।
  5. Ctrl+V বা Cmd+V ব্যবহার করে পাঠ্য পেস্ট করুন।

এই পদ্ধতিটি সাধারণ PDF এর জন্য আদর্শ। আপনি ম্যানুয়ালি বিষয়বস্তু অংশে অনুলিপি করতে পারেন এবং আপনার লক্ষ্য নথিতে পেস্ট করতে পারেন। অ্যাক্রোব্যাট রিডার অন্যান্য পাঠকদের থেকে ভিন্ন, বিন্যাসটি ভালভাবে সংরক্ষণ করে।

অ্যাক্রোব্যাট রিডার জটিল পিডিএফ-এর সাথে লড়াই করে — যেগুলিতে একাধিক কলাম এবং চিত্রের সাথে টেক্সট, টেবিল এবং রঙিন ব্যাকগ্রাউন্ডে পাঠ্য মিশ্রিত। কপি করা টেক্সট ফরম্যাটিং হারাতে পারে এবং প্লেইন টেক্সট হিসেবে পেস্ট করা হতে পারে, যার জন্য ম্যানুয়াল ক্লিনআপ বা পরে এডিট করা প্রয়োজন।

এটি PDF থেকে বাল্ক টেক্সট নিষ্কাশনের জন্য আদর্শ নাও হতে পারে। উদাহরণস্বরূপ, বিক্রেতা চুক্তি প্রক্রিয়াকরণ এবং শত শত পিডিএফ থেকে মূল শর্তাবলী এবং ধারাগুলি বের করা ক্লান্তিকর এবং সময়সাপেক্ষ হতে পারে। স্ক্যান করা পৃষ্ঠাগুলি থেকে পাঠ্য অনুলিপি করা আরও কঠিন।

সামগ্রিকভাবে, Acrobat Reader-এর অন্তর্নির্মিত কপি টেক্সট বৈশিষ্ট্যটি পিডিএফ থেকে দ্রুত কয়েকটি লাইন বা অনুচ্ছেদ ধরতে ভাল কাজ করে।

খ. Microsoft Word বা Google Docs-এ PDF খুলুন

Microsoft Word এবং Google ডক্স আপনাকে PDF ফাইলগুলি থেকে পাঠ্য খুলতে, সম্পাদনা করতে এবং বের করার অনুমতি দেয়। আপনি কীভাবে এই সরঞ্জামগুলি ব্যবহার করতে পারেন তা এখানে:

মাইক্রোসফট ওয়ার্ড ব্যবহার করে:

  1. আপনার ডেস্কটপে MS Word খুলুন।
  2. ফাইল > খুলুন > ব্রাউজ করুন এবং আপনার পিডিএফ নির্বাচন করুন।
  3. Word PDF কে একটি সম্পাদনাযোগ্য নথিতে রূপান্তর করবে।
  4. আপনি এখন এই নথি থেকে পাঠ্য কপি এবং পেস্ট করতে পারেন।

ওয়ার্ড ব্যবহারের সুবিধা হল এটি ফন্ট, রঙ এবং অবস্থানের মতো বিন্যাস ধরে রাখার চেষ্টা করে। যাইহোক, এটি অনেক ফর্ম্যাটিং জটিলতা ছাড়াই পাঠ্য-ভারী পিডিএফগুলির জন্য সেরা কাজ করে। স্ক্যান করা নথিগুলি ভালভাবে রূপান্তর করতে পারে না।

পিডিএফ থেকে এক্সেলে টেবিল কপি করতে এমএস ওয়ার্ড কীভাবে ব্যবহার করবেন

Google ডক্স ব্যবহার করে:

  1. Google Drive-এ আপনার PDF আপলোড করুন।
  2. ফাইলটিতে ডান-ক্লিক করুন এবং "Google ডক্সের সাথে খুলুন" নির্বাচন করুন।
  3. বিষয়বস্তু একটি নতুন Google ডক-এ আমদানি করা হবে৷
  4. প্রয়োজন অনুযায়ী পাঠ্য নির্বাচন করুন এবং অনুলিপি করুন।

Google ডক্স তার সমন্বিত OCR ক্ষমতা ব্যবহার করে স্ক্যান করা নথি থেকে পাঠ্য বের করতে পারে। যাইহোক, ফরম্যাটিং প্রায়শই হারিয়ে যায়, এটি পিডিএফ থেকে কাঁচা পাঠ পাওয়ার জন্য সেরা করে তোলে।

কিভাবে Google ডক্স ব্যবহার করে PDF টেবিল কপি করবেন

উভয় সরঞ্জামই PDF থেকে পাঠ্য দ্রুত এবং সহজবোধ্য নিষ্কাশনের অনুমতি দেয়। যাইহোক, তারা পুরোপুরি ফর্ম্যাট করা রূপান্তরগুলির গ্যারান্টি দিতে পারে না, বিশেষত যখন জটিল ফাইলগুলির সাথে কাজ করে। অনুপস্থিত অক্ষর, এলোমেলো বাক্য এবং ফর্ম্যাটিং সমস্যাগুলি রূপান্তরিত নথিতে পরিচিত, পাঠ্যটি পুনরায় ব্যবহার করার আগে ম্যানুয়াল ক্লিনআপের প্রয়োজন। উপরন্তু, এই পদ্ধতি শত শত পৃষ্ঠা থেকে পাঠ্য নিষ্কাশনের জন্য অবাস্তব।

গ. একটি অনলাইন কনভার্টারে ফাইলটি আপলোড করুন

অনেকগুলি বিনামূল্যের অনলাইন পিডিএফ-টু-টেক্সট রূপান্তরকারী উপলব্ধ রয়েছে যা PDF থেকে নিষ্কাশনকে সহজ করে। এই টুলগুলি আপনার পিডিএফকে একটি ফরম্যাটে রূপান্তর করে, যেমন TXT বা DOC, যা আপনাকে সামগ্রী সহজেই অনুলিপি করতে দেয়।

আমাদের বিনামূল্যে ব্যবহার করুন অনলাইন রূপান্তর টুল PDF থেকে টেক্সট বের করতে।

কিছু জনপ্রিয় অনলাইন OCR টুলের মধ্যে রয়েছে:

একটি অনলাইন পিডিএফ এক্সট্র্যাক্টর ব্যবহার করার সময় এখানে সাধারণ পদক্ষেপগুলি রয়েছে:

  1. টুলের ওয়েবসাইটে যান।
  2. আপনার পিডিএফ নির্বাচন করতে "ফাইল নির্বাচন করুন" বা "আপলোড" এ ক্লিক করুন।
  3. আউটপুট বিন্যাসটি TXT, DOC/DOCX, বা অন্যান্য বিন্যাসে সেট করুন।
  4. রূপান্তর শুরু করতে "রূপান্তর করুন" এ ক্লিক করুন।
  5. আপনার কম্পিউটারে রূপান্তরিত ফাইল ডাউনলোড করুন.
  6. টেক্সট ফাইল খুলুন এবং প্রয়োজন অনুযায়ী কপি এবং পেস্ট করুন।

বেশিরভাগ অনলাইন রূপান্তরকারী বিনামূল্যে কিছু মৌলিক ব্যবহার অফার করে। যাইহোক, কিছু উন্নত বৈশিষ্ট্য এবং বর্ধিত সীমার জন্য অর্থপ্রদানের সদস্যতা প্রয়োজন হতে পারে। অতিরিক্তভাবে, সংবেদনশীল ডেটা আপলোড করার আগে গোপনীয়তা নীতিগুলি মনে রাখবেন।

সুবিধাজনক হলেও, এই টুলগুলি পিডিএফ-এ জটিল লেআউটের সাথে ঝিমিয়ে পড়তে পারে। তারা টেক্সট এক্সট্র্যাক্ট করতে ঐতিহ্যগত OCR প্রযুক্তি ব্যবহার করে, তাই তারা অ-মানক ফন্ট, মাল্টি-কলাম লেআউট, টেক্সট, টেবিল এবং রঙিন ব্যাকগ্রাউন্ডের সাথে মিশ্রিত ছবিগুলির সাথে লড়াই করে। 

নিষ্কাশিত পাঠ্য প্রায়শই তার আসল বিন্যাস হারায় এবং ম্যানুয়ালি সংশোধন করা প্রয়োজন, যা বাল্ক প্রক্রিয়াকরণ চুক্তি, প্রতিবেদন এবং বিবৃতিগুলির জন্য সময়সাপেক্ষ এবং অদক্ষ হতে পারে।

2. পিডিএফ থেকে ছবি কপি এবং পেস্ট করুন

আপনার নিজের নথি এবং উপস্থাপনায় ব্যবহারের জন্য আপনি PDF থেকে একটি চার্ট বা স্কেচ বের করতে চাইতে পারেন। মান বজায় রেখে পিডিএফ ফাইল থেকে ছবি কপি করার কয়েকটি উপায় এখানে রয়েছে:

ক পিডিএফ স্নিপ করতে একটি স্ক্রিনশট টুল ব্যবহার করুন

আপনি যদি একটি পিডিএফ পৃষ্ঠার একটি চিত্র হিসাবে একটি নির্দিষ্ট অংশ বের করতে চান তবে স্ক্রিনশট সরঞ্জামগুলি বেশ সহজ হতে পারে।

স্ক্রিনশট সরঞ্জামগুলি ব্যবহার করার সময় এখানে সাধারণ পদক্ষেপগুলি রয়েছে:

  1. পিডিএফ ফাইলটি খুলুন এবং ছবিটি সহ পৃষ্ঠায় যান।
  2. আপনার স্ক্রিনশট টুল চালু করুন, যেমন Snagit, Greenshot, বা Windows বিল্ট-ইন টুল।
  3. আপনি যে অংশটি কপি করতে চান তার একটি স্ক্রিনশট নিন।
  4. স্ক্রিনশটটি আপনার কম্পিউটারে সংরক্ষিত হবে।
  5. আপনি যদি এটি ক্রপ করতে বা আরও সম্পাদনা করতে চান তবে একটি চিত্র সম্পাদকে স্ক্রিনশটটি খুলুন।

স্ক্রিনশট টুলগুলি পিডিএফ থেকে ছবি ক্যাপচার করার একটি সহজ উপায় প্রদান করে যখন আপনাকে পুরো পৃষ্ঠাটি বের করতে হবে না। আপনি নির্দিষ্ট চার্ট, ডায়াগ্রাম, লোগো বা অন্যান্য গ্রাফিক উপাদানের স্ক্রিনশট নিতে পারেন।

যাইহোক, এই পদ্ধতিটি ক্লান্তিকর হতে পারে যদি আপনাকে একটি বৃহৎ পিডিএফ থেকে একাধিক ছবি বের করতে হয় এবং এটি পাঠ্য অনুসন্ধানযোগ্যতা ধরে রাখে না যেহেতু আপনি ছবিটি ক্যাপচার করছেন, অন্তর্নিহিত পাঠ্য নয়।

খ. Acrobat Pro এর স্ন্যাপশট টুল ব্যবহার করুন

আপনি যদি একজন অ্যাক্রোব্যাট প্রো ব্যবহারকারী হন, তাহলে আপনি পিডিএফ থেকে ছবি কপি করতে এর স্ন্যাপশট টুল ব্যবহার করতে পারেন।

এটি কিভাবে ব্যবহার করবেন তা এখানে:

  1. Acrobat Pro এ আপনার PDF খুলুন।
  2. আপনি যে চিত্রটি বের করতে চান তা ধারণকারী পৃষ্ঠা এলাকাটি নির্বাচন করতে ক্লিক করুন এবং টেনে আনুন।
  3. একটি ড্রপ-ডাউন মেনু খুলতে ডান মাউস বোতামে ক্লিক করুন।
  4. "একটি স্ন্যাপশট নিন" নির্বাচন করুন 
  5. স্ন্যাপশট টুলটি পিডিএফ পৃষ্ঠার নির্বাচিত এলাকাটিকে আপনার ক্লিপবোর্ডে ছবি হিসেবে কপি করে। আপনি এটিকে CTRL+V ব্যবহার করে যেকোনো ইমেজ এডিটিং বা ডকুমেন্ট সফটওয়্যারে পেস্ট করতে পারেন।

স্ন্যাপশট টুলটি পিডিএফ ডকুমেন্ট চার্ট, ডায়াগ্রাম, স্কেচ বা অন্যান্য ভিজ্যুয়াল উপাদানগুলি দ্রুত দখল করার জন্য সহজ। তাছাড়া, আপনি ক্যাপচার করা ছবি JPG, PNG এবং আরও অনেক কিছুতে রপ্তানি করতে পারেন। 

আপনি যদি পিডিএফ-এ ছবিগুলিতে ক্লিক করেন, টুলটি আপনাকে সরাসরি সেগুলি বের করার অনুমতি দেবে। তাছাড়া, একটি 'রিকোগনিজ টেক্সট' বিকল্প রয়েছে যা নির্বাচিত অঞ্চলে OCR চালায়, যা স্ক্যান করা ডকুমেন্ট বা পিডিএফ-এর ভিতরের ছবি থেকে পাঠ্য বের করতে সাহায্য করতে পারে।

স্ন্যাপশট টুল কার্যকরভাবে একটি পিডিএফ পৃষ্ঠার নির্দিষ্ট অংশ অনুলিপি করে যখন ফর্ম্যাটিং এবং ভিজ্যুয়াল বজায় রাখে। যাইহোক, এর জন্য মূল্য দেওয়া অ্যাক্রোব্যাট প্রো সাবস্ক্রিপশনে অ্যাক্সেস প্রয়োজন US $ 19.99/mo.

আরেকটি সীমাবদ্ধতা হল স্ন্যাপশট টুলটি একবারে একটি পৃষ্ঠায় কাজ করে, যা ক্লান্তিকর হয়ে উঠতে পারে যদি আপনাকে একটি স্ক্যান করা পিডিএফ থেকে একাধিক ছবি বের করতে হয় বা যদি আপনাকে একবারে শত শত ফাইল প্রক্রিয়া করতে হয়।

গ. পিডিএফ পৃষ্ঠাগুলিকে ইমেজ ফাইলে রূপান্তর করুন

আপনি যদি পিডিএফ ডকুমেন্ট থেকে সমস্ত ছবি বের করতে চান, তাহলে পিডিএফ পৃষ্ঠাগুলিকে ইমেজ ফাইলে রূপান্তর করা সহায়ক হতে পারে। Smallpdf, IlovePDF, এবং PDF2Go-এর মতো অনলাইন কনভার্টারগুলি JPG, PNG, এবং TIFF-এর মতো ইমেজ ফরম্যাটে PDF পৃষ্ঠাগুলিকে বাল্ক রূপান্তরের অনুমতি দেয়। 

এই পদক্ষেপগুলি অনুসরণ করুন:

  1. PDF2JPG এর মতো একটি অনলাইন কনভার্টার টুলে আপনার পিডিএফ আপলোড করুন।
  2. আউটপুট বিন্যাস হিসাবে JPG বা PNG চয়ন করুন।
  3. আপনি ইমেজ রূপান্তর করতে চান পৃষ্ঠা নির্বাচন করুন.
  4. পিডিএফ থেকে ইমেজ এক্সট্রাকশন শুরু করতে "কনভার্ট" এ ক্লিক করুন।
  5. নির্বাচিত প্রতিটি পৃষ্ঠার ছবি সম্বলিত ZIP ফোল্ডারটি ডাউনলোড করুন।
  6. ইমেজ ফাইল খুলুন এবং প্রয়োজন হিসাবে তাদের অনুলিপি.

চিত্রে রূপান্তর করার সময় PDF থেকে পাঠ্য হারিয়ে যেতে পারে, এই পদ্ধতিটি পাঠ্যের পরিবর্তে PDF থেকে চার্ট, ডায়াগ্রাম, ফটো এবং অন্যান্য গ্রাফিকাল উপাদানগুলি বের করার জন্য উপযুক্ত করে তোলে।

পিডিএফ পৃষ্ঠাগুলিকে ইমেজে রূপান্তর করা ক্লান্তিকর হতে পারে, বিশেষ করে যদি আপনাকে একই সাথে শত শত পৃষ্ঠাগুলি প্রক্রিয়া করতে হয়। অনলাইন টুলগুলি প্রায়ই আপনি রূপান্তর করতে পারেন এমন পৃষ্ঠাগুলির সংখ্যা সীমিত করে। তাছাড়া, আলাদা ইমেজ ফাইল ম্যানেজ করা দ্রুত এলোমেলো হয়ে যেতে পারে।

ছোট পিডিএফ থেকে কয়েকটি চার্ট বা ফটো দ্রুত সংগ্রহের জন্য উপযুক্ত হলেও, দীর্ঘ নথি বা ইবুক থেকে প্রচুর পরিমাণে ছবি তোলার সময় এই পদ্ধতির সীমাবদ্ধতা রয়েছে। 

3. পিডিএফ থেকে ডেটা কপি এবং পেস্ট করুন

আপনি যদি পিডিএফ থেকে নির্দিষ্ট ডেটা যেমন সাংখ্যিক মান বা সারণীযুক্ত তথ্য বের করতে চান তবে আপনি ডেটা নিষ্কাশনের জন্য ডিজাইন করা নির্দিষ্ট সরঞ্জামগুলিকে ব্যবহার করতে চাইবেন। এখানে কয়েকটি কার্যকর পদ্ধতি রয়েছে:

আপনি কি পিডিএফের একটি গুচ্ছ থেকে ডেটা অনুলিপি করতে চান? এমএস এক্সেলের গেট ডেটা ফিচার বিস্ময়কর কাজ করে। এটি স্বয়ংক্রিয়ভাবে পিডিএফ ফাইলগুলি থেকে এক্সেল স্প্রেডশীটে টেবিল এবং ডেটা বের করতে পারে।

পিডিএফ থেকে টেবিল বের করতে এক্সেলের গেট ডেটা ট্যাব কীভাবে অ্যাক্সেস করবেন

এই সাধারণ পদক্ষেপগুলি অনুসরণ করুন:

  1. এক্সেল খুলুন এবং ডেটা ট্যাবে যান।
  2. Get Data > From File > PDF এ ক্লিক করুন।
  3. আপনি যে পিডিএফ ফাইল(গুলি) থেকে ডেটা আমদানি করতে চান তা নির্বাচন করুন৷ এক্সেল স্বয়ংক্রিয়ভাবে নথি (গুলি) থেকে টেবিলগুলি সনাক্ত করবে এবং বের করবে৷
  4. আমদানি ডেটা ডায়ালগ বক্স ডেটার একটি পূর্বরূপ প্রদর্শন করে। আপনি যে টেবিলটি আমদানি করতে চান তা চয়ন করুন এবং লোড ক্লিক করুন৷
  5. নিষ্কাশিত পিডিএফ ডেটা একটি টেবিল হিসাবে স্প্রেডশীটে ঢোকানো হবে, ডেটা বিশ্লেষণের অনুমতি দেবে।

পাঠ্য পিডিএফের জন্য ডেটা নিষ্কাশন ভাল কাজ করে। ব্যবহারকারীরা এক বা একাধিক পিডিএফ ফাইল থেকে আমদানি করতে একটি টেবিল বা একাধিক টেবিল নির্বাচন করতে পারেন। এক্সেল বুদ্ধিমত্তার সাথে ডেটাকে সারি এবং কলামে আলাদা করতে পারে। এটি ব্যবহারকারীদের ফিল্টার যোগ করতে বা এক্সেলের মধ্যে আমদানি করা ডেটা রূপান্তর করার অনুমতি দেয়। এটি আরও বিশ্লেষণ এবং ড্যাশবোর্ডিংয়ের জন্য PDF থেকে দ্রুত এক্সেলে ব্যবহারযোগ্য ডেটা পেতে সহজ করে তোলে।

এক্সেল স্ক্যান করা নথি বা পিডিএফগুলি থেকে জটিল লেআউট, যেমন কলাম বা চিত্র সহ ডেটা বের করতে সংগ্রাম করে। এটি স্পষ্টভাবে সংজ্ঞায়িত ডেটা টেবিল এবং গ্রিডের মতো লেআউট সহ পাঠ্য পিডিএফগুলির সাথে সর্বোত্তমভাবে সম্পাদন করে। যখন আপনার পিডিএফ ডেটা টেবিলে সুন্দরভাবে সংগঠিত হয়, তখন এক্সেল ব্যবহার করে আপনি উল্লেখযোগ্য পরিমাণে ম্যানুয়াল কপি, পেস্ট এবং রিফর্ম্যাটিং কাজ বাঁচাতে পারেন।

স্ক্যান করা নথি বা জটিল রিপোর্টে লক করা অসংগঠিত ডেটার জন্য আপনার আরও উন্নত ডেটা নিষ্কাশন ক্ষমতার প্রয়োজন হবে।

ট্যাবুলা এবং এক্সক্যালিবুরের মতো ওপেন সোর্স লাইব্রেরিগুলি পিডিএফ ফাইলগুলি থেকে ডেটা টেবিল বের করার জন্য ভাল বিকল্পগুলি অফার করে। এই টুলগুলি টেবিল সনাক্ত করতে পারে, তাদের সারি এবং কলামে বিভক্ত করতে পারে এবং CSV বা এক্সেল ফাইলগুলিতে ডেটা রপ্তানি করতে পারে। 

পিডিএফ-এ টেবিল স্নিপ করুন এবং ট্যাবুলা ব্যবহার করে সেগুলি বের করুন

সাধারণত, কর্মপ্রবাহটি দেখতে এইরকম হবে:

  1. আপনার কম্পিউটারে ওপেন সোর্স সফ্টওয়্যারটি ডাউনলোড এবং ইনস্টল করুন।
  2. পিডিএফ আমদানি করুন।
  3. আপনি যে টেবিলটি বের করতে চান তার সারি এবং কলামগুলি স্নিপ করুন।
  4. 'প্রিভিউ এবং এক্সপোর্ট এক্সট্রাক্টেড ডেটা' বোতামে ক্লিক করুন।
  5. প্রিভিউতে ডেটা যাচাই করুন; এটি ভাল দেখায়, 'রপ্তানি' ক্লিক করুন.
  6. আপনার পছন্দের বিন্যাস (CSV বা XLS) চয়ন করুন এবং ফাইলটি সংরক্ষণ করুন।
  7. Excel এ সংরক্ষিত ফাইলটি খুলুন, প্রয়োজনীয় কোষগুলি অনুলিপি করুন এবং আপনার এক্সেল স্প্রেডশীটে পেস্ট করুন।

যদিও ওপেন-সোর্স পিডিএফ নিষ্কাশন সরঞ্জামগুলি এক্সেলের অন্তর্নির্মিত বিকল্পের চেয়ে আরও উন্নত ক্ষমতা সরবরাহ করে, তাদের প্রতিটি নথি সেট আপ এবং প্রক্রিয়া করার জন্য আরও ম্যানুয়াল প্রচেষ্টার প্রয়োজন হতে পারে। এই সরঞ্জামগুলি কার্যকরভাবে ব্যবহার করার জন্য আপনাকে আরও প্রযুক্তি-বুদ্ধিমান হতে হবে। 

এই টুলগুলি পরিষ্কার পিডিএফ লেআউটগুলি থেকে ট্যাবুলার ডেটা বের করার জন্য সবচেয়ে কার্যকর যেগুলিতে টেবিলের চারপাশে খুব বেশি পাঠ্য বা গ্রাফিক্স নেই। যাইহোক, তারা জটিল প্রতিবেদন বা বিবৃতিতে স্ক্যান করা নথি বা অসংগঠিত ডেটার সাথে লড়াই করতে পারে। 

Nanonets হল একটি AI-চালিত ডকুমেন্ট প্রসেসিং প্ল্যাটফর্ম যেখানে উন্নত OCR এবং অটোমেশন ক্ষমতা রয়েছে, যা PDF এবং স্ক্যান করা ডকুমেন্ট থেকে টেক্সট, ইমেজ এবং ডেটার সঠিক নিষ্কাশন সক্ষম করে।

ন্যানোনেট অন্যান্য ডেটা নিষ্কাশন সফ্টওয়্যার থেকে কীভাবে আলাদা

মূল ক্ষমতা

এটি একাধিক পাঠ্য কলাম, চিত্র, টেবিল এবং অন্যান্য উপাদানগুলির সাথে জটিল লেআউটগুলিকে সঠিকভাবে পরিচালনা করতে পারে। ন্যানোনেটস নথির কাঠামো "দেখতে" এবং "বুঝতে" মেশিন লার্নিং (এমএল) এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (এনএলপি) ব্যবহার করে। এটি প্রসঙ্গ সহ পাঠ্য এবং ডেটা নিষ্কাশন সক্ষম করে, সঠিক পড়ার ক্রম এবং ডেটা সম্পর্ক বজায় রাখে।

Nanonets স্বয়ংক্রিয়ভাবে PDF এবং স্ক্যান করা নথি, যেমন চালান, বিবৃতি, আইডি কার্ড, প্রশ্নাবলী এবং আরও অনেক কিছু থেকে পাঠ্য, টেবিল, ছবি, QR কোড, বারকোড এবং অন্যান্য উপাদান বের করতে পারে। এর উন্নত OCR এবং AI ক্ষমতাগুলি প্ল্যাটফর্মটিকে কাঠামোগত এবং অসংগঠিত ডেটা অনায়াসে ক্যাপচার করতে সক্ষম করে। 

ঐতিহ্যবাহী সরঞ্জামগুলির বিপরীতে, এটি কেবল তথ্য ক্যাপচার করে না। আপনার সিস্টেমে যোগ করার আগে নিষ্কাশিত ডেটা সঠিক এবং আপনার ব্যবসার প্রয়োজনের সাথে সঙ্গতিপূর্ণ কিনা তা নিশ্চিত করতে আপনি পূর্বনির্ধারিত বৈধতা নিয়ম এবং অনুমোদনের অনুক্রম স্থাপন করতে পারেন। এটি নিম্নধারার ব্যবসায়িক প্রক্রিয়াগুলিতে ব্যয়বহুল ত্রুটি এবং ব্যতিক্রমগুলি দূর করতে সহায়তা করে।

Nanonets নিরবিচ্ছিন্নভাবে REST API, Zapier, বা webhuoks-এর মাধ্যমে জনপ্রিয় ব্যবসায়িক সিস্টেমের সাথে একীভূত করে, প্ল্যাটফর্মে ফাইলের স্বয়ংক্রিয় ইনজেশন এবং অন্যান্য অ্যাপ্লিকেশনে এক্সট্রাক্ট করা ডেটা রপ্তানি সক্ষম করে, এইভাবে ম্যানুয়াল বাছাই, শ্রেণীবিভাগ, নাম পরিবর্তন বা ডেটা এন্ট্রির প্রয়োজনীয়তা দূর করে। .

একবার অ্যাপগুলি সংযুক্ত হয়ে গেলে এবং ওয়ার্কফ্লো সেট আপ হয়ে গেলে, পিডিএফ এবং স্ক্যান করা নথিগুলি থেকে ডেটা নিষ্কাশন এবং ইনজেশন অটোপাইলটে চলতে পারে। এটি আপনার কর্মীদের জাগতিক নথি প্রক্রিয়াকরণের কাজ থেকে মুক্ত করে, তাদের মূল্য সংযোজন কাজের উপর ফোকাস করার অনুমতি দেয়।

একটি উদাহরণ

ধরুন আপনি একটি নিয়োগ সংস্থা চালাচ্ছেন যা প্রতিদিন শত শত পিডিএফ প্রক্রিয়া করছে। আপনার দল ম্যানুয়ালি নাম, ইমেল ঠিকানা, ফোন নম্বর, দক্ষতা এবং অভিজ্ঞতা সারসংকলন এবং অ্যাপ্লিকেশন থেকে বের করে। Nanonets-এর সাহায্যে, আপনি OCR পিডিএফ-এ একটি স্বয়ংক্রিয় পাইপলাইন তৈরি করতে পারেন এবং স্কেলে জীবনবৃত্তান্ত থেকে স্ট্রাকচার্ড ডেটা বের করতে পারেন। প্ল্যাটফর্মটি সারসংকলন লেআউটগুলিকে বোঝায় এবং সঠিক ডেটা ক্ষেত্রগুলি বের করে, যা ন্যূনতম ম্যানুয়াল হস্তক্ষেপের সাথে উচ্চ পরিমাণের নথিগুলির দ্রুত প্রক্রিয়াকরণের অনুমতি দেয়।

আপনি Gmail, Google Drive, OneDrive, এবং Dropbox থেকে নথিগুলির স্বয়ংক্রিয় আমদানি সেট আপ করতে পারেন৷ মাইক্রোসফ্ট ডায়নামিক্স, কুইকবুকস এবং জেরোর মতো সরঞ্জামগুলির সাথে একীকরণ আপনাকে আপনার ব্যবসায়িক সিস্টেমে স্বয়ংক্রিয়ভাবে নিষ্কাশিত ডেটা রুট করার অনুমতি দেয়। এটি জনপ্রিয় ওয়ার্কফ্লো অটোমেশন প্ল্যাটফর্ম Zapier-এর সাথেও সংহত করে, 5,000 টিরও বেশি অ্যাপকে সংযুক্ত করে।

উদাহরণস্বরূপ, আপনি একটি স্বয়ংক্রিয় ওয়ার্কফ্লো তৈরি করতে পারেন যা OCRগুলি আপনার Google ড্রাইভে আপলোড করা PDF ফর্ম্যাটে পুনরায় শুরু করে, Google শিটে নাম, ইমেল এবং ফোন নম্বর বের করে এবং তারপরে এই পরিচিতিগুলিকে আপনার CRM-এ যোগ করতে এবং HR-কে কাজগুলি বরাদ্দ করতে Zapier ব্যবহার করে। প্রতিনিধিরা উচ্চ-সম্ভাব্য প্রার্থীদের অনুসরণ করতে।

এটি প্রসঙ্গ না হারিয়ে বিভিন্ন মুদ্রা, ভাষা, বিন্যাস এবং বিন্যাসে নথি প্রক্রিয়া করতে পারে। AI সঠিকতা উন্নত করতে প্রশিক্ষণের ডেটা এবং ম্যানুয়াল হস্তক্ষেপ থেকে শেখে।

কিভাবে শুরু করেছিল?

5-10 টি নথির একটি নমুনা সেট আপলোড করুন, আপনি যে পাঠ্যটি বের করতে চান তা টীকা করুন এবং Nanonets স্বয়ংক্রিয়ভাবে আপনার নথির জন্য তৈরি একটি কাস্টম AI মডেল তৈরি করবে৷ এটি 95% এর নির্ভুলতা বজায় রেখে প্রতি মাসে হাজার হাজার পৃষ্ঠা প্রক্রিয়া করতে পারে।

Nanonets-এর মূল্য ব্যবহার-ভিত্তিক, যা আপনাকে ছোট শুরু করতে এবং আপনার চাহিদা বাড়ার সাথে সাথে বড় করতে দেয়। প্রথম 500 পৃষ্ঠাগুলি বিনামূল্যে, এবং আপনি তিনটি AI মডেল অ্যাক্সেস করতে পারবেন, যা আপনাকে প্রতিশ্রুতি দেওয়ার আগে একাধিক নথির প্রকারে Nanonets পরীক্ষা করতে সক্ষম করে।

সর্বশেষ ভাবনা

পিডিএফ থেকে অনুলিপি এবং আটকানো একটি কাজ হতে হবে না. আপনি সঠিক সরঞ্জাম এবং কৌশলগুলির সাহায্যে প্রক্রিয়াটিকে সহজ এবং প্রবাহিত করতে পারেন।

সর্বোত্তম পদ্ধতি আপনার নির্দিষ্ট চাহিদা এবং নথির উপর নির্ভর করে। আপনার PDF এর জটিলতা, কর্মপ্রবাহের চাহিদা, ডেটা গোপনীয়তা নীতি এবং আরও অনেক কিছু মূল্যায়ন করুন। আপনার পরিস্থিতির জন্য সমস্ত বাক্স চেক করে এমন সমাধান খুঁজে বের করা দীর্ঘমেয়াদী দক্ষতার জন্য গুরুত্বপূর্ণ। লক্ষ্য হল পিডিএফ টেক্সট অনুলিপি করার ম্যানুয়াল কষ্ট দূর করা। আপনি মাসে কয়েকটি নথি পরিচালনা করুন বা প্রতিদিন হাজার হাজার পৃষ্ঠা প্রক্রিয়া করুন, আপনার জীবনকে সহজ করার জন্য সমাধান বিদ্যমান।

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি