דף הבית » איך ל » כיצד להמיר קובץ PDF לטקסט לעריכה באמצעות שורת הפקודה ב - Linux

    כיצד להמיר קובץ PDF לטקסט לעריכה באמצעות שורת הפקודה ב - Linux

    ישנן סיבות שונות לכך שתרצה להמיר קובץ PDF לטקסט הניתן לעריכה. אולי אתה צריך לשנות מסמך ישן וכל מה שיש לך הוא גרסת PDF של זה. המרת קבצי PDF ב- Windows היא קלה, אבל מה אם אתה משתמש לינוקס?

    אין דאגות. אנו נראה לכם כיצד להמיר בקלות קבצי PDF לטקסט הניתן לעריכה באמצעות כלי שורת פקודה הנקרא pdftotext, המהווה חלק מהחבילה "poppler-utils". ייתכן שכלי זה כבר מותקן. כדי לבדוק אם pdftotext מותקן במערכת שלך, הקש "Ctrl + Alt + T" כדי לפתוח חלון מסוף. הקלד את הפקודה הבאה בשורת הפקודה ולחץ על "Enter".

    dpkg -s poppler-utils

    הערה: כאשר אנו אומרים להקליד משהו במאמר זה ויש ציטוטים מסביב לטקסט, אל תקליד את המרכאות, אלא אם כן ציין אחרת.

    אם pdftotext אינו מותקן, הקלד את הפקודה הבאה בשורת הפקודה ולחץ על "Enter".

    sudo apt- לקבל להתקין poppler-utils

    הקלד את הסיסמה שלך כשתתבקש לעשות זאת ולחץ על "Enter".

    ישנם מספר כלים הזמינים בחבילה puppler-utils להמרת PDF לפורמטים שונים, מניפולציה של קובצי PDF וחילוץ מידע מקבצים.

    להלן הפקודה הבסיסית להמרת קובץ PDF לקובץ טקסט הניתן לעריכה. הקש "Ctrl + Alt + T" כדי לפתוח חלון טרמינל, הקלד את הפקודה בשורת הפקודה ולחץ על "Enter".

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    שנה את הנתיב לכל קובץ כך שיתאים למיקום ולשם של קובץ ה- PDF המקורי והיכן ברצונך לשמור את קובץ הטקסט שנוצר. כמו כן, שנה את שמות הקבצים כך שיתאימו לשמות הקבצים שלך.

    קובץ הטקסט נוצר וניתן לפתוח בדיוק כפי שהיית פותח כל קובץ טקסט אחר ב- Linux.

    הטקסט המומר עשוי להיות מעברי שורה במקומות שאינך מעוניין בהם. מעברי שורה מוכנסים לאחר כל שורה של טקסט בקובץ PDF.

    באפשרותך לשמור על הפריסה של המסמך (כותרות עליונות, כותרות תחתונות, החלפה וכו ') מקובץ PDF המקורי בקובץ הטקסט המומר באמצעות הדגל "Layout".

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    אם ברצונך להמיר רק טווח של דפים בקובץ PDF, השתמש בדגלים "-f" ו- "-l" (אותיות קטנות "L") כדי לציין את הדפים הראשונים והאחרונים בטווח שברצונך להמיר.

    pdftotext -f 5 -l 9 /home /lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    כדי להמיר קובץ PDF המוגן ומוצפן באמצעות סיסמת הבעלים, השתמש בדגל "-opw" (התו הראשון בדגל הוא אות קטנה "O", לא אפס).

    pdftotext-up 'password' /home /lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    שינוי "סיסמה" לזה המשמש להגנה על קובץ PDF המקורי המומר. ודא שיש ציטוטים בודדים, לא כפול, סביב "סיסמה".

    אם קובץ ה- PDF מוגן ומוצפן באמצעות סיסמת משתמש, השתמש בדגל "-upw" במקום בדגל "-opw". שאר הפקודה היא זהה.

    ניתן גם לציין את סוג תו הסיום של הקו המוחל על הטקסט המומר. אפשרות זו שימושית במיוחד אם בכוונתך לגשת לקובץ במערכת הפעלה אחרת, כגון Windows או Mac. כדי לעשות זאת, השתמש בדגל "-Eol" (התו האמצעי בדגל הוא אות קטנה "O", לא אפס) ואחריו רווח וסוג תו הקצה שברצונך להשתמש בו (" unix "," dos "או" mac ").

    הערה: אם לא תציין קובץ קובץ טקסט, pdftotext משתמש באופן אוטומטי בבסיס קובץ ה- PDF ומוסיף את הסיומת ".txt". לדוגמה, "file.pdf" יומר ל "file.txt". אם קובץ הטקסט מוגדר כ - "", הטקסט המומר נשלח ל stdout, כלומר הטקסט מוצג בחלון טרמינל ולא נשמר בקובץ.

    כדי לסגור את חלון הטרמינל, לחץ על הלחצן "X" בפינה השמאלית העליונה.

    לקבלת מידע נוסף על הפקודה pdftotext, הקלד "man page pdftotext" בשורת הפקודה בחלון Terminal.