অ্যাপাচি পিওআই (Apache POI) আপনাকে PowerPoint ফাইলের metadata পড়ার জন্য সক্ষম করে, যা PowerPoint ডকুমেন্টের প্রাথমিক তথ্য যেমন লেখক, শিরোনাম, সৃষ্টির তারিখ, পরিবর্তন তারিখ ইত্যাদি সংগ্রহ করতে সহায়তা করে। এই তথ্য সাধারণত ফাইলের প্রপার্টি অংশে সংরক্ষিত থাকে এবং এটি .ppt
(HSLF) এবং .pptx
(XSLF) উভয় ফরম্যাটেই পাওয়া যায়।
NiFi, Java বা অন্য কোনও Java ভিত্তিক টুল ব্যবহার করে POI এর সাহায্যে আপনি PowerPoint ফাইলের মেটাডেটা পড়তে পারেন। এখানে দেখানো হবে কিভাবে Apache POI ব্যবহার করে PowerPoint ফাইলের মেটাডেটা এক্সট্র্যাক্ট করা যায়।
প্রথমত, আপনাকে Apache POI Maven ডিপেনডেন্সি আপনার প্রোজেক্টে যোগ করতে হবে। .pptx
ফাইলের জন্য poi-ooxml এবং .ppt
ফাইলের জন্য poi লাইব্রেরি ব্যবহৃত হবে।
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.3</version> <!-- NiFi ব্যবহারকারীর নির্দিষ্ট ভার্সন চেক করুন -->
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.2.3</version> <!-- NiFi ব্যবহারকারীর নির্দিষ্ট ভার্সন চেক করুন -->
</dependency>
XSLF ব্যবহার করে .pptx
ফাইলের metadata পড়তে নিচের কোডটি ব্যবহার করতে পারেন:
import org.apache.poi.xslf.usermodel.XMLSlideShow;
import org.apache.poi.sl.usermodel.SlideShow;
import org.apache.poi.ooxml.POIXMLProperties;
import java.io.FileInputStream;
import java.io.IOException;
public class PowerPointMetadataXSLF {
public static void main(String[] args) throws IOException {
// .pptx ফাইল খোলার জন্য ইনপুট স্ট্রিম
FileInputStream fis = new FileInputStream("example_presentation.pptx");
// XMLSlideShow অবজেক্ট তৈরি করা
XMLSlideShow ppt = new XMLSlideShow(fis);
// মেটাডেটা এক্সট্র্যাক্ট করা
POIXMLProperties props = ppt.getProperties();
POIXMLProperties.CoreProperties coreProps = props.getCoreProperties();
// মেটাডেটা প্রিন্ট করা
System.out.println("Title: " + coreProps.getTitle());
System.out.println("Creator: " + coreProps.getCreator());
System.out.println("Subject: " + coreProps.getSubject());
System.out.println("Keywords: " + coreProps.getKeywords());
System.out.println("Last Modified By: " + coreProps.getLastModifiedBy());
System.out.println("Created Date: " + coreProps.getCreated());
System.out.println("Modified Date: " + coreProps.getModified());
fis.close();
}
}
এটি .pptx
ফাইলের মূল মেটাডেটা যেমন শিরোনাম, লেখক, বিষয়, কীওয়ার্ড, তৈরি এবং পরিবর্তিত তারিখ ইত্যাদি এক্সট্র্যাক্ট করবে।
HSLF ব্যবহার করে .ppt
ফাইলের metadata পড়ার জন্য কোডটি কিছুটা আলাদা হবে, কারণ এটি পুরনো .ppt
ফাইল ফরম্যাটের জন্য ব্যবহৃত হয়।
import org.apache.poi.hslf.usermodel.HSLFSlideShow;
import org.apache.poi.hslf.usermodel.HSLFProperties;
import java.io.FileInputStream;
import java.io.IOException;
public class PowerPointMetadataHSLF {
public static void main(String[] args) throws IOException {
// .ppt ফাইল খোলার জন্য ইনপুট স্ট্রিম
FileInputStream fis = new FileInputStream("example_presentation.ppt");
// HSLFSlideShow অবজেক্ট তৈরি করা
HSLFSlideShow ppt = new HSLFSlideShow(fis);
// মেটাডেটা এক্সট্র্যাক্ট করা
HSLFProperties props = ppt.getProperties();
HSLFProperties.CoreProperties coreProps = props.getCoreProperties();
// মেটাডেটা প্রিন্ট করা
System.out.println("Title: " + coreProps.getTitle());
System.out.println("Creator: " + coreProps.getCreator());
System.out.println("Subject: " + coreProps.getSubject());
System.out.println("Keywords: " + coreProps.getKeywords());
System.out.println("Last Modified By: " + coreProps.getLastModifiedBy());
System.out.println("Created Date: " + coreProps.getCreated());
System.out.println("Modified Date: " + coreProps.getModified());
fis.close();
}
}
এটি .ppt
ফাইলের জন্যও একই ধরনের মেটাডেটা এক্সট্র্যাক্ট করবে।
PowerPoint ফাইলের মেটাডেটা সাধারণত নিচের তথ্য ধারণ করে:
এই মেটাডেটাগুলি সাধারণত ফাইলটির বৈশিষ্ট্যভুক্ত ডাটা, যা ফাইলের সাথে সংযুক্ত থাকে এবং অডিটিং, ফাইল ট্র্যাকিং এবং ফাইল ব্যবস্থাপনা প্রক্রিয়ায় সহায়ক হতে পারে।
অ্যাপাচি পিওআই (Apache POI) PowerPoint ফাইলের মেটাডেটা পড়তে খুবই সহায়ক। XSLF (নতুন .pptx
ফাইল) এবং HSLF (পুরানো .ppt
ফাইল) মডিউলগুলি ব্যবহার করে আপনি PowerPoint ফাইলের মেটাডেটা যেমন শিরোনাম, লেখক, তৈরি এবং পরিবর্তিত তারিখ, কীওয়ার্ড ইত্যাদি সহজে এক্সট্র্যাক্ট করতে পারেন। এই মেটাডেটা পড়া এবং ব্যবহার করা ফাইল ব্যবস্থাপনা এবং অডিটিংয়ের জন্য খুবই গুরুত্বপূর্ণ।
common.read_more