כיצד לחלץ ולשמור תמונות מתוך קובץ PDF ב - Linux
אתה יכול בקלות להמיר קבצי PDF לטקסט לעריכה לינוקס באמצעות "pdftotext" כלי שורת הפקודה. עם זאת, אם יש תמונות בקובץ PDF המקורי, הם לא חילוץ. כדי לחלץ תמונות מקובץ PDF, ניתן להשתמש בכלי שורת פקודה נוסף הנקרא "pdfimages".
הערה: כאשר אנו אומרים להקליד משהו במאמר זה ויש ציטוטים מסביב לטקסט, אל תקליד את המרכאות, אלא אם כן ציין אחרת.
הכלי "pdfimages" הוא חלק מחבילת ה- poppler-utils. באפשרותך לבדוק אם הוא מותקן במערכת ולהתקין אותו במידת הצורך באמצעות השלבים המתוארים במאמר זה.
כדי לחלץ תמונות מקובץ PDF באמצעות pdfimages, הקש "Ctrl + Alt + T" כדי לפתוח חלון Terminal. הקלד את הפקודה הבאה בשורת הפקודה.
pdfimages / home /lori/Documents/SampleWithImages.pdf / home / lori / מסמכים / ExtractedImages / image
הערה: עבור כל הפקודות שמופיעות במאמר זה, החלף את הנתיב הראשון בפקודה ואת שם הקובץ ל- PDF לנתיב ושם הקובץ עבור קובץ ה- PDF המקורי. הנתיב השני צריך להיות הנתיב לתיקיית הבסיס שבה ברצונך לשמור את התמונות שחולצו. המילה "תמונה" בסוף השביל השני מייצגת את מה שאתה רוצה להקדים את שם הקובץ שלך. שמות הקבצים של התמונות ממוספרים אוטומטית (000, 001, 002, 003 וכו '). אם ברצונך להוסיף טקסט לתחילת כל תמונה, הזן את הטקסט בסוף הנתיב השני. בדוגמה שלנו, כל שם קובץ תמונה יתחיל עם "image", כגון image-001.ppm, image-002.ppm, וכו '. מקף מתווסף בין הטקסט שתציין לבין המספר.
תבנית התמונה המוגדרת כברירת מחדל היא PPM (pixmap נייד) לתמונות שאינן חד-שכבתיות, או PBM (מפת סיביות ניידת) לתמונות בשחור-לבן. פורמטים אלה נועדו להחליף בקלות בין פלטפורמות.
הערה: באפשרותך לקבל שני קבצי תמונה עבור כל תמונה בקובץ PDF. התמונה השנייה עבור כל תמונה ריקה, לכן, תוכל לדעת אילו תמונות מכילות את התמונות מהקובץ על-ידי התמונה הממוזערת בקובץ במנהל הקבצים.
כדי ליצור קבצי תמונה מסוג .jpg, הוסף את האפשרות "-j" לפקודה, כפי שמוצג להלן.
pdfimages -j / home/lori/Documents/SampleWithImages.pdf / home / lori / מסמכים / ExtractedImages / image
הערה: ניתן גם לשנות את פלט ברירת המחדל ל- PNG באמצעות האפשרות "-png" או TIFF באמצעות האפשרות "tiff".
קובץ התמונה הראשי עבור כל תמונה נשמר כקובץ .jpg. התמונה הריקה השנייה היא עדיין קובץ .ppm או .pbm.
אם ברצונך להמיר תמונות בדף ואחרי דף מסוים בלבד, השתמש באפשרות "-f" עם מספר כדי לציין את הדף הראשון להמרה, כפי שמוצג בפקודה לדוגמה למטה.
pdfimages -f 2 -j / home /lori/Documents/SampleWithImages.pdf / home / lori / מסמכים / ExtractedImages / image
הערה: שילבנו את האפשרות "-j" עם האפשרות "f" כדי שנוכל לקבל תמונות .jpg ועשינו אותו עם האפשרות "l" המוזכרת להלן גם כן.
כדי להמיר את כל התמונות לפני ובדף מסוים, השתמש ב- "l" ("L" קטן, לא במספר "1") עם מספר כדי לציין את הדף האחרון להמרה, כפי שמוצג להלן.
pdfimages -l 1 -j / home /lori/Documents/SampleWithImages.pdf / home / lori / מסמכים / ExtractedImages / image
הערה: ניתן להשתמש באפשרויות "-f" ו- "l" יחד כדי להמיר תמונות בטווח דפים מסוים באמצע המסמך.
אם יש סיסמת הבעלים בקובץ PDF, השתמש באפשרות "-opw" ובסיסמה במרכאות בודדות, כפי שמוצג להלן. אם הסיסמה בקובץ ה- PDF היא סיסמת משתמש, השתמש באפשרות "-upw" במקום עם הסיסמה.
הערה: ודא שיש ציטוטים בודדים סביב הסיסמה שלך בפקודה.
pdfimages -opw 'סיסמה' -j / home /lori/Documents/SampleWithImages.pdf / home / lori / מסמכים / ExtractedImages / image
לקבלת מידע נוסף על השימוש בפקודה pdfimages, הקלד "pdfimages" בהנחיית חלון טרמינל ולחץ על "Enter". השימוש בפקודה מציג רשימה של אפשרויות זמינות לשימוש בפקודה.