ווי אַזוי צו איבערזעצן אַ בילד אין טעקסט ניצן ABBYY FineReader?

Pin
Send
Share
Send

דער אַרטיקל וועט זיין אַ העסאָפע צו די פריערדיקע (//pcpro100.info/skanirovanie-teksta/), און אין מער דעטאַל וועט אַנטדעקן די עסאַנס פון דירעקט טעקסט דערקענונג.

לאָמיר אָנהייבן מיט די עסאַנס אַז פילע ניצערס טאָן ניט גאָר פֿאַרשטיין.

נאָך סקאַנינג אַ בוך, צייטונג, זשורנאַל, אאז"ו ו, איר באַקומען אַ סכום פון בילדער (י.ע. גראַפיק טעקעס, נישט טעקסט טעקעס) וואָס איר דאַרפֿן צו דערקענען אין אַ ספּעציעל פּראָגראַם (איינער פון די בעסטער פֿאַר דעם איז ABBYY FineReader). דערקענונג - דאָס איז עס, דער פּראָצעס פון באקומען טעקסט פֿון גראַפיקס, און עס איז דעם פּראָצעס וואָס מיר וועלן דיסקרייבד אין מער דעטאַל.

אין מיין בייַשפּיל, איך וועל נעמען אַ סקרעענשאָט פון דעם פּלאַץ און פּרובירן צו באַקומען טעקסט פֿון עס.

 

1) עפן אַ טעקע

עפֿן די בילד (s) וואָס מיר פּלאַן צו דערקענען.

דורך דעם וועג, עס זאָל זיין אנגעוויזן דאָ אַז איר קענען עפענען נישט בלויז בילד פאָרמאַץ, אָבער אויך, למשל, DJVU און PDF טעקעס. דערלויבט איר צו געשווינד דערקענען די גאנצע ספר, וואָס איז יוזשאַוואַלי פונאנדערגעטיילט אין די פאָרמאַץ אויף דער נעץ.

2) עדיטינג

גלייך שטימען מיט אַוטאָ-דערקענונג איז נישט פיל זינען. אויב איר האָט דאָך אַ בוך וואָס עס איז בלויז טעקסט, עס זענען קיין בילדער און פּלאַטעס, פּלוס עס איז סקאַנד אין ויסגעצייכנט קוואַליטעט, איר קענען. אין אנדערע קאַסעס, עס איז בעסער צו באַשטעטיקן אַלע געביטן מאַניואַלי.

יוזשאַוואַלי איר ערשטער דאַרפֿן צו באַזייַטיקן ומנייטיק געביטן פון דעם בלאַט. צו טאָן דאָס, דריקט אויף די רעדאַגירן קנעפּל אויף די טאַפליע.

דערנאָך איר דאַרפֿן צו לאָזן בלויז די געגנט מיט וואָס איר ווילט צו אַרבעטן מער. צו טאָן דאָס, עס איז אַ געצייַג צו טרים אַנוואָנטיד געמארקן. סעלעקטירן דעם מאָדע אין די רעכט זייַל גערעטעניש.

ווייַטער, סעלעקטירן דעם שטח איר ווילן צו לאָזן. אין די בילד אונטן, עס איז כיילייטיד אין רויט.

דורך דעם וועג, אויב איר האָבן עטלעכע בילדער אָפּענעד, די קראַפּינג קענען זיין געווענדט צו אַלע בילדער אין אַמאָל! באַקוועם נישט צו שנייַדן יעדער ינדיווידזשואַלי. ביטע טאָן אַז אין די דנאָ פון דעם טאַפליע עס איז אן אנדער גרויס געצייַג -מעקער. מיט דעם, איר קענען ויסמעקן אַנוואָנטיד סטאַינס, בלאַט נומערן, ספּעקס, ומנייטיק ספּעציעל אותיות און יחיד סעקשאַנז פון די בילד.

נאָך געבן אַ קליק צו שניידן די עדזשאַז, דיין אָריגינעל בילד זאָל טוישן: בלויז די אַרבעט שטח בלייבט.

דערנאָך איר קענען אַרויסגאַנג די בילד רעדאַקטאָר.

3) הויכפּונקט געביטן

אויף די טאַפליע אויבן די עפענען בילד, עס זענען קליין רעקטאַנגגאַלז וואָס דעפינירן די יבערקוקן געגנט. עס זענען עטלעכע פון ​​זיי, בעקיצער באַטראַכטן די מערסט פּראָסט.

בילד - די פּראָגראַם קען נישט דערקענען דעם שטח, נאָר קאַפּיינג די ספּעסאַפייד גראָדעק און פּאַפּ עס אין די דערקענט דאָקומענט.

טעקסט איז די הויפּט געגנט אויף וואָס די פּראָגראַם וועט פאָקוס און וועט פּרובירן צו באַקומען טעקסט פֿון די בילד. אין דעם בייַשפּיל מיר ונטערשטרייַכן דעם שטח.

נאָך סעלעקציע, די שטח איז פּיינטיד אין ליכט גרין. דעמאָלט איר קענען גיין צו די ווייַטער שריט.

4) טעקסט דערקענונג

נאָך דעפינירן אַלע געביטן, גיט די דערקענען באַפֿעל אין די מעניו. צומ גליק, גאָרנישט אַנדערש איז דארף אין דעם שריט.

דער דערקענונג צייַט דעפּענדס אויף די נומער פון בלעטער אין דיין דאָקומענט און די מאַכט פון די קאָמפּיוטער.

אין גאַנץ קוואַליטעט, איין גאַנץ בלאַט סקאַנד אין גוט קוואַליטעט נעמט 10-20 סעקונדעס. דורכשניטלעך פּיסי מאַכט (לויט הייַנט ס סטאַנדאַרדס).

 

5) טעות קאָנטראָלירונג

וועלכער די ערשט קוואַליטעט פון די בילדער, ערראָרס יוזשאַוואַלי שטענדיק בלייבן נאָך דערקענונג. אין דער זעלביקער צייט, קיין פּראָגראַם איז געווען ביכולת צו גאָר ויסשליסן מענטשלעך אַרבעט.

דריקט אויף די טשעק אָפּציע, און ABBYY FineReader וועט אָנהייבן צו ווייַזן איר איין פֿאַר איין די ערטער אין דעם דאָקומענט וווּ עס איז סטאַמבאַלד. דיין אַרבעט, קאַמפּערינג די אָריגינעל בילד (דורך דעם וועג, דעם אָרט עס וועט זיין געוויזן אין אַ ענלאַרגעד ווערסיע) מיט די דערקענונג אָפּציע - ענטפֿערן אַפערמאַטיוו, אָדער ריכטיק און אַפּרווו. דערנאָך, די פּראָגראַם וועט גיין צו די ווייַטער שווער אָרט און אַזוי אויף ביז די גאנצע דאָקומענט איז אָפּגעשטעלט.

 

אין אַלגעמיין, דעם פּראָצעס קען זיין לאַנג און נודנע ...

6) שפּאָרן

ABBYY FineReader אָפפערס עטלעכע אָפּציעס פֿאַר שפּאָרן דיין אַרבעט. די מערסט אָפט געניצט איינער איז די "פּינטלעך קאָפּיע". י.ע. די גאנצע דאָקומענט, דער טעקסט אין עס, וועט זיין פֿאָרמאַטירט ווי אין דער מקור. אַ באַקוועם אָפּציע פֿאַר טראַנספערינג עס צו Word. אַזוי מיר טאָן אין דעם בייַשפּיל.

דערנאָך איר וועט זען דיין דערקענט טעקסט אין אַ באַקאַנט וואָרט דאָקומענט. איך טראַכטן עס איז נישט פיל זינען צו מאָלן ווייטער וואָס צו טאָן מיט אים ...

אזוי, מיר געמאכט אַ באַטאָנען ביישפּיל פון איבערזעצונג פון אַ בילד אין קלאָר טעקסט. דער פּראָצעס איז ניט שטענדיק פּשוט און געשווינד.

אין קיין פאַל, אַלץ דעפּענדס אויף די קוואַל בילד קוואַליטעט, דיין דערפאַרונג און קאָמפּיוטער גיכקייַט.

האָבן אַ גוט אַרבעט!

 

Pin
Send
Share
Send