חלץ טקסט PDF ו קבצי תמונה
יש לך מסמך PDF שאתה רוצה לחלץ את כל הטקסט מתוך? מה לגבי קובצי תמונות של מסמך סרוק שברצונך להמיר לטקסט הניתן לעריכה? אלה הן חלק מן הבעיות הנפוצות ביותר שראיתי במקום העבודה בעת עבודה עם קבצים.
במאמר זה, אני אדבר על כמה דרכים שונות אתה יכול ללכת על מנסה לחלץ טקסט מתוך PDF או מתמונה. תוצאות החילוץ שלך ישתנו בהתאם לסוג ואיכות הטקסט במסמך PDF או בתמונה. כמו כן, התוצאות שלך ישתנו בהתאם לכלי שבו אתה משתמש, לכן מומלץ לנסות כמה שיותר מהאפשרויות הבאות כדי לקבל את התוצאות הטובות ביותר.
חלץ טקסט מתוך תמונה או PDF
הדרך הפשוטה והמהירה ביותר להתחיל היא לנסות טקסט מקוון טקסט טקסט חולץ. אלה בדרך כלל ללא תשלום והוא יכול לתת לך בדיוק מה שאתה מחפש מבלי להתקין שום דבר במחשב. הנה שני כי השתמשתי עם תוצאות טובות מאוד מעולה:
ExtractPDF
ExtractPDF הוא כלי ללא תשלום לתפוס תמונות, טקסט וגופנים מתוך קובץ PDF. המגבלה היחידה היא שהגודל המקסימלי לקובץ PDF הוא 10 MB. זה קצת קטן; אז אם יש לך קובץ גדול יותר, נסה כמה שיטות אחרות להלן. בחר את הקובץ ולאחר מכן לחץ על שלח קובץ כפתור. התוצאות הן בדרך כלל מהר מאוד ואתה צריך לראות תצוגה מקדימה של הטקסט בעת לחיצה על הכרטיסייה טקסט.
זה גם יתרון נוסף נחמד כי זה מחלץ תמונות מתוך קובץ PDF מדי, רק במקרה שאתה צריך את אלה! בסך הכל, הכלי המקוון עובד נהדר, אבל יש לי לרוץ לתוך כמה מסמכים PDF זה נותן לי פלט מצחיק. הטקסט הוא חילוץ בסדר גמור, אבל מסיבה כלשהי זה יהיה הפסקה שורה אחרי כל מילה! לא בעיה ענקית עבור קובץ PDF קצר, אבל בהחלט בעיה עבור קבצים עם הרבה טקסט. אם זה קורה לך, נסה את הכלי הבא.
OCR מקוון
OCR מקוון בדרך כלל נטו לעבוד על מסמכים שלא להמיר כראוי עם ExtractPDF, אז זה רעיון טוב לנסות את שני השירותים כדי לראות אילו מהם נותן לך פלט טוב יותר. OCR באינטרנט יש גם כמה תכונות יותר נחמד שיכול להוכיח שימושי עבור כל אדם עם קובץ PDF גדול רק צריך להמיר טקסט על כמה עמודים ולא את המסמך כולו.
הדבר הראשון שאתה רוצה לעשות הוא ללכת קדימה וליצור חשבון חינם. זה קצת מעצבן, אבל אם לא תיצור את החשבון בחינם, זה יהיה רק להמיר באופן חלקי את ה- PDF שלך ולא את המסמך כולו. בנוסף, במקום להעלות רק מסמך בגודל 5 MB, תוכל להעלות עד 100MB לקובץ עם חשבון.
ראשית, בחר שפה ולאחר מכן בחר את סוג הפורמטים הפלט שאתה רוצה עבור הקובץ המומר. יש לך כמה אפשרויות ואתה יכול לבחור יותר מאחד אם אתה רוצה. תחת מסמך מרובה עמודים, אתה יכול לבחור מספרי עמודים ולאחר מכן לבחור רק את הדפים שברצונך להמיר. לאחר מכן אתה בוחר את הקובץ ולחץ להמיר!
לאחר ההמרה, תובא אל הקטע 'מסמכים' (אם אתה מחובר), שבו תוכל לראות כמה דפים זמינים זמינים בחינם וקישורים להורדת הקבצים שהומרו. נראה כאילו יש לך רק 25 עמודים בחינם ביום, אז אם אתה צריך יותר מזה, תצטרך לחכות קצת או לקנות דפים נוספים.
Online OCR עשה עבודה מצויינת של המרת קבצי PDF שלי כי הוא היה מסוגל לשמור על הפריסה בפועל של הטקסט. במבחן שלי, לקחתי מסמך Word כי השתמשו כדורים, גודלי גופן שונים, וכו 'והמרה אותו ל- PDF. אז השתמשתי OCR Online להמיר אותו בחזרה בפורמט Word וזה היה כ 95% זהה המקורי. זה די מרשים בשבילי.
בנוסף, אם אתם מחפשים להמיר תמונה לטקסט, אז OCR מקוון יכול לעשות את זה בדיוק באותה מידה כמו לחלץ טקסט מקבצי PDF.
חינם באינטרנט OCR
מאז היו מדברים על התמונה טקסט OCR, תן לי להזכיר עוד אתר טוב שעובד ממש טוב על תמונות. חינם באינטרנט OCR היה טוב מאוד מאוד מדויק בעת חילוץ טקסט תמונות הבדיקה שלי. לקחתי כמה תמונות iPhone שלי של עמודים מתוך ספרים, חוברות, וכו 'ואני הופתעתי כמה טוב זה היה מסוגל להמיר את הטקסט.
בחר את הקובץ ולאחר מכן לחץ על הלחצן העלה. במסך הבא, יש כמה אפשרויות תצוגה מקדימה של התמונה. אתה יכול לחתוך את זה אם אתה לא רוצה OCR את כל העניין. לאחר מכן פשוט לחץ על הלחצן OCR והטקסט המומר יופיע מתחת לתצוגה המקדימה של התמונה. זה גם אין שום מגבלות, וזה ממש נחמד.
בנוסף לשירותים מקוונים, יש שני ממיר PDF חופשית אני רוצה להזכיר במקרה שאתה צריך תוכנה פועלת באופן מקומי במחשב כדי לבצע את ההמרות. עם שירותים מקוונים, אתה תמיד צריך חיבור לאינטרנט וזה לא יכול להיות אפשרי עבור כולם. עם זאת, שמתי לב כי איכות ההמרות של תוכניות freeware היו גרועים משמעותית מאלה של אתרי אינטרנט.
A-PDF טקסט Extractor
A-PDF טקסט Extractor היא תוכנה חופשית עושה עבודה טובה למדי של חילוץ טקסט מתוך קבצי PDF. לאחר שתוריד אותו ותתקין אותו, לחץ על הלחצן פתח כדי לבחור את קובץ ה- PDF שלך. לאחר מכן לחץ על חלץ טקסט כדי להתחיל את התהליך.
זה יבקש ממך מיקום כדי לאחסן את קובץ הפלט טקסט ולאחר מכן הוא יתחיל לחלץ. אתה יכול גם ללחוץ על אפשרות כפתור, המאפשר לך לבחור רק דפים מסוימים כדי לחלץ את סוג החילוץ. האפשרות השנייה היא מעניינת כי זה מחלץ את הטקסט פריסות שונות וזה שווה לנסות את כל שלוש כדי לראות אילו נותן לך את הפלט הטוב ביותר.
PDF2Text פיילוט
PDF2Text פיילוט עושה עבודה טובה של חילוץ טקסט. אין לו אפשרויות; אתה רק להוסיף קבצים או תיקיות, להמיר ולקוות לטוב. זה עבד טוב על כמה מסמכי PDF, אבל עבור רובם, היו בעיות רבות.
פשוט לחץ על הוסף קבצים ולאחר מכן לחץ על אישור להמיר. לאחר שההמרה הושלמה, לחץ על עיון כדי לפתוח את הקובץ. אתה קילומטראז ישתנה באמצעות תוכנית זו ולכן לא מצפה הרבה.
כמו כן, ראוי להזכיר כי אם אתה בסביבה ארגונית או יכול לקבל את הידיים על עותק של Adobe Acrobat מהעבודה, אז אתה באמת יכול להשיג תוצאות טובות יותר. Acrobat הוא כמובן לא בחינם, אבל יש לו אפשרויות להמיר PDF ל- Word, Excel ו- HTML פורמט. זה גם עושה את העבודה הטובה ביותר של שמירה על המבנה של המסמך המקורי המרת טקסט מסובך.