ফাইল ফরম্যাট সমর্থন (DOCX, DOC)

Java Technologies - অ্যাপাচি পিওআই (ওয়ার্ড) XWPFDocument: Word ডকুমেন্ট তৈরি এবং ব্যবস্থাপনা |
171
171

Apache POI একটি শক্তিশালী ওপেন সোর্স লাইব্রেরি, যা Microsoft Office ফাইল ফরম্যাটগুলির ম্যানিপুলেশন করতে সক্ষম। বিশেষত, Microsoft Word ফাইল ফরম্যাটের জন্য POI দুটি প্রধান ক্লাস প্রদান করে: HWPF এবং XWPF। এই ক্লাস দুটি .doc এবং .docx ফরম্যাটের ফাইলের জন্য আলাদা আলাদা সমর্থন প্রদান করে।

DOCX (Word 2007 এবং পরবর্তী সংস্করণ)

.docx ফাইল ফরম্যাটটি Office Open XML (OOXML) ফরম্যাটে ভিত্তি করে তৈরি, যা Microsoft Word 2007 এবং পরবর্তী সংস্করণের জন্য ডিজাইন করা হয়েছে। এটি একটি আধুনিক এবং উন্নত ফরম্যাট যা XML ভিত্তিক, ফলে এটি অন্যান্য প্ল্যাটফর্মে সহজে এক্সপোর্ট এবং ইমপোর্ট করা যায়।

XWPF (XML Word Processing Format)

  • XWPF ক্লাসটি .docx ফাইলের জন্য ব্যবহৃত হয়। এটি POI লাইব্রেরির অন্যতম গুরুত্বপূর্ণ উপাদান, যা XML ফরম্যাটের Word ফাইলগুলির মধ্যে কন্টেন্ট রিড, রাইট, এবং ম্যানিপুলেট করতে সাহায্য করে।
  • XWPF ব্যবহারের মাধ্যমে আপনি Word ডকুমেন্টের প্যারাগ্রাফ, টেবিল, ইমেজ, শিরোনাম, তালিকা, স্টাইল এবং অন্যান্য অনেক ফিচার পরিচালনা করতে পারবেন।

DOCX ফাইলের সুবিধা:

  • XML ভিত্তিক হওয়ায় এই ফাইল ফরম্যাটে আরও বেশি ডেটা প্রক্রিয়াকরণ এবং স্টাইলিং এর সুবিধা রয়েছে।
  • এটি সঠিকভাবে ফাইলের কন্টেন্ট এবং ফরম্যাট বজায় রাখে এবং অনেকগুলি ফিচার যেমন টেবিল, চার্ট, গ্রাফিক্স, অ্যানিমেশন সমর্থন করে।
  • ওপেন সোর্স লাইব্রেরি যেমন POI এবং অন্যান্য টুলসের মাধ্যমে খুব সহজে এক্সপোর্ট এবং ইমপোর্ট করা যায়।

DOC (Word 97-2003 ফরম্যাট)

.doc ফরম্যাটটি Microsoft Word 97-2003 এর জন্য ব্যবহৃত ছিল এবং এটি একটি বাইনারি ফরম্যাট। এই ফাইলটি একটি পুরনো ফরম্যাট হওয়ায় আধুনিক প্ল্যাটফর্মে ব্যবহার করা কিছুটা সীমিত হতে পারে, তবে এখনও অনেক legacy সিস্টেমে এটি ব্যবহৃত হয়।

HWPF (Horrible Word Processing Format)

  • HWPF ক্লাসটি .doc ফরম্যাটের জন্য ব্যবহৃত হয়। এটি একটি পুরনো বাইনারি ফরম্যাটের জন্য ডিজাইন করা হয়েছে, যা বেশ কিছু সীমাবদ্ধতার কারণে আধুনিক ফিচার সমর্থন করে না। তবে, এটি এখনও কিছু পুরনো Word ডকুমেন্ট পড়তে এবং সম্পাদনা করতে ব্যবহৃত হয়।
  • HWPF এ ব্যবহৃত ফাইলের মধ্যে প্যারাগ্রাফ, টেবিল এবং সাধারণ স্টাইলিং কার্যাবলী করতে পারবেন, তবে গ্রাফিক্স এবং অ্যানিমেশন এর মতো উন্নত বৈশিষ্ট্যগুলি সীমিত।

DOC ফাইলের সীমাবদ্ধতা:

  • বাইনারি ফরম্যাট হওয়ায় এর মধ্যে সংরক্ষিত ডেটা এবং ফরম্যাটগুলোকে প্রক্রিয়াকরণ করা তুলনামূলকভাবে কঠিন।
  • আধুনিক ডকুমেন্ট ফিচার (যেমন: স্লাইড, গ্রাফ, অ্যানিমেশন) সম্পূর্ণরূপে সমর্থিত নয়।
  • অল্প জায়গায় ফাইল সাইজ বেশি হতে পারে এবং XML ভিত্তিক ফরম্যাটের মতো সহজে অ্যাক্সেসযোগ্য নয়।

DOC এবং DOCX ফরম্যাটের তুলনা

বৈশিষ্ট্যDOC (Word 97-2003)DOCX (Word 2007+)
ফাইল ফরম্যাটবাইনারি ফরম্যাটXML ভিত্তিক ফরম্যাট
ফরম্যাটিংসীমিতউন্নত এবং কাস্টমাইজযোগ্য
টেবিল, ছবি, চার্টসীমিতসম্পূর্ণ সমর্থন
এডিটিং এবং প্রসেসিংসহজ নয়, বাইনারিসহজ, XML ভিত্তিক
ফাইল সাইজছোট কিন্তু কম কার্যকরীবড়, তবে আরও কার্যকরী
গ্রাফিক্স এবং অ্যানিমেশনসীমিতসমর্থিত
পারফরম্যান্সতুলনামূলকভাবে ধীরদ্রুত এবং কার্যকরী

DOC এবং DOCX ফাইল ম্যানিপুলেশন

Apache POI ব্যবহার করে আপনি .doc এবং .docx ফাইলগুলোকে খুব সহজেই ম্যানিপুলেট করতে পারেন। নিম্নলিখিত উদাহরণ দেখানো হলো:

DOCX ফাইল পড়া এবং টেক্সট যোগ করা (XWPF):

import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;
import java.io.*;

public class WordFileExample {
    public static void main(String[] args) {
        try (FileInputStream fis = new FileInputStream("input.docx")) {
            XWPFDocument document = new XWPFDocument(fis);
            XWPFParagraph paragraph = document.createParagraph();
            XWPFRun run = paragraph.createRun();
            run.setText("এটি একটি নতুন টেক্সট।");

            try (FileOutputStream fos = new FileOutputStream("output.docx")) {
                document.write(fos);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

DOC ফাইল পড়া এবং টেক্সট ম্যানিপুলেশন (HWPF):

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.Range;
import java.io.*;

public class WordFileExample {
    public static void main(String[] args) {
        try (FileInputStream fis = new FileInputStream("input.doc")) {
            HWPFDocument document = new HWPFDocument(fis);
            Range range = document.getRange();
            System.out.println("Document Text: " + range.text());
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Apache POI .doc এবং .docx ফরম্যাটের ফাইল ম্যানিপুলেশনে শক্তিশালী টুল হিসেবে কাজ করে। যেখানে XWPF আধুনিক .docx ফাইল ফরম্যাটের জন্য একটি উন্নত এবং নমনীয় লাইব্রেরি, HWPF পুরনো .doc ফাইল ফরম্যাটের জন্য ব্যবহৃত হয়। .docx ফরম্যাটটি XML ভিত্তিক হওয়ায় অনেক বেশি ফিচার এবং সহজ প্রসেসিং সমর্থন করে, যেখানে .doc বাইনারি ফরম্যাট হওয়ায় এর কিছু সীমাবদ্ধতা রয়েছে।

common.content_added_by
টপ রেটেড অ্যাপ

স্যাট অ্যাকাডেমী অ্যাপ

আমাদের অল-ইন-ওয়ান মোবাইল অ্যাপের মাধ্যমে সীমাহীন শেখার সুযোগ উপভোগ করুন।

ভিডিও
লাইভ ক্লাস
এক্সাম
ডাউনলোড করুন
Promotion