טעקסט דערקענונג. Free פּראָגראַם - אַנאַלאָג פון פינרעאַדער

Pin
Send
Share
Send

גיכער אָדער שפּעטער, אַלעמען וואָס אָפט אַרבעט מיט אָפיס מגילה איז פייסינג אַ טיפּיש אַרבעט - צו יבערקוקן טעקסט פון אַ בוך, זשורנאַל, צייטונג, נאָר ליפלאַץ און איבערזעצן די בילדער אין טעקסט פֿאָרמאַט, למשל, אין אַ וואָרט דאָקומענט.

צו טאָן דאָס, איר דאַרפֿן אַ סקאַננער און אַ ספּעציעל פּראָגראַם פֿאַר רעקאַגנייזינג טעקסט. דער אַרטיקל וועט דיסקוטירן די פריי אַנטקעגענער פון FineReader -Cuneiform (וועגן דערקענונג אין FineReader - זען דעם אַרטיקל).

זאל ס אָנהייבן ...

אינהאַלט

  • 1. פֿעיִקייטן פון די CuneiForm פּראָגראַם, פֿעיִקייטן
  • 2. בייַשפּיל פון טעקסט דערקענונג
  • 3. פּעקל טעקסט דערקענונג
  • 4. קאַנקלוזשאַנז

1. פֿעיִקייטן פון די CuneiForm פּראָגראַם, פֿעיִקייטן

Cuneiform

איר קענט אראפקאפיע די וועבזייטל פון די דעוועלאָפּער: //cognitiveforms.com/

אַ עפענען מקור טעקסט דערקענונג פּראָגראַם. דערצו, עס אַרבעט אין אַלע ווערסיעס פון Windows: XP, Vista, 7, 8, וואָס איז וואוילגעפעלן. פּלוס, לייגן די פול רוסיש איבערזעצונג פון די פּראָגראַם!

פּראָס:

- טעקסט דערקענונג אין די 20 מערסט פאָלקס שפּראַכן פון דער וועלט (ענגליש און רוסיש אַליין איז אַרייַנגערעכנט אין דעם נומער);

- ריזיק שטיצן פֿאַר פאַרשידן דרוק פאַנץ;

- קאָנטראָלירן די ווערטערבוך פון דערקענט טעקסט;

- די פיייקייט צו ראַטעווען אַרבעט רעזולטאַטן אין עטלעכע וועגן;

- פּרעזערוויישאַן פון די סטרוקטור פון דעם דאָקומענט;

- גרויס שטיצן און טיש דערקענונג.

קאָנס:

- קען נישט שטיצן צו גרויס דאָקומענטן און טעקעס (מער ווי 400 דפּי);

- שטיצט ניט גלייַך טייפּס פון סקאַנערז (נו, עס ס 'נישט אַ גרויס האַנדלען. אַ ספּעציעל סקאַננער פּראָגראַם איז אַרייַנגערעכנט מיט די סקאַנערז דריווערס)

- דער פּלאַן טוט נישט גלאַנצן (אָבער וואָס דאַרף עס אויב די פּראָגראַם גאָר סאַלווז די פּראָבלעם).

2. בייַשפּיל פון טעקסט דערקענונג

מיר יבערנעמען אַז איר האָט שוין באקומען די נייטיק בילדער פֿאַר דערקענונג (סקאַנד עס, אָדער דאַונלאָודיד אַ בוך אין פּדף / דדזשווו פֿאָרמאַט אויף דער אינטערנעץ און אַוועקגענומען די נייטיק בילדער פֿון זיי. ווי אַזוי צו טאָן דאָס, זען דעם אַרטיקל).

1) עפֿן די געוואלט בילד אין די CuineForm פּראָגראַם (טעקע / עפענען אָדער "Cntrl + O").

2) צו אָנהייבן דערקענונג - איר מוזן ערשטער סעלעקטירן פאַרשידן געביטן: טעקסט, בילדער, טישן, אאז"ו ו אין די Cuneiform פּראָגראַם, דאָס קען זיין געטאן ניט בלויז מאַניואַלי, אָבער אויך אויטאָמאַטיש! צו טאָן דאָס, דריקט אויף די "אויסלייג" קנעפּל אין די שפּיץ טאַפליע פון ​​די פֿענצטער.

3) נאָך 10-15 סעקונדעס. די פּראָגראַם וועט אויטאָמאַטיש הויכפּונקט אַלע געביטן מיט פאַרשידענע פארבן. פֿאַר בייַשפּיל, אַ טעקסט געגנט איז כיילייטיד אין בלוי. דורך דעם וועג, זי כיילייטיד אַלע געביטן ריכטיק און פערלי געשווינד. האָנעסטלי, איך האט ניט דערוואַרטן אַזאַ אַ גיך און ריכטיק אָפּרוף פון איר ...

4) פֿאַר די וואס טאָן ניט צוטרוי די אָטאַמאַטיק אויסלייג, איר קענען נוצן מאַנואַל. צו טאָן דאָס, עס איז אַ מכשיר (זען די בילד אונטן), דאַנק וואָס איר קענען אויסקלייַבן: טעקסט, טיש, בילד. מאַך, פאַרגרעסערן / רעדוצירן די ערשט בילד, גערעטעניש די עדזשאַז. אין אַלגעמיין, אַ גוט גאַנג.

5) נאָך אַלע סאָרץ זענען אנגעצייכנט, מיר קענען גיין צו דערקענונג. צו טאָן דאָס, פשוט דריקט דעם קנעפּל מיט די זעלבע נאָמען ווי אין די בילד אונטן.

6) ממש אין 10-20 סעקונדעס. איר וועט זען אַ דאָקומענט אין Microsoft Word מיט דערקענט טעקסט. ינטערעסטינגלי, אין דעם טעקסט פֿאַר דעם בייַשפּיל, דאָך עס זענען געווען ערראָרס, אָבער עס זענען זייער ווייניק פון זיי! דערצו, קאַנסידערינג אין וואָס ונפּרעפּאָסעססינג קוואַליטעט די מקור מאַטעריאַל איז געווען - אַ בילד.

די גיכקייַט און קוואַליטעט איז גאַנץ פאַרגלייַכלעך צו פינרעאַדער!

3. פּעקל טעקסט דערקענונג

דער פּראָגראַם פֿונקציע קען קומען אין האַנטיק ווען איר דאַרפֿן צו דערקענען ניט איין בילד, אָבער עטלעכע מאָל. דער דורכוועג פֿאַר סטאַרטינג פּעקל דערקענונג איז יוזשאַוואַלי פאַרבאָרגן אין די אָנהייב מעניו.

1) נאָך עפן דעם פּראָגראַם, איר דאַרפֿן צו שאַפֿן אַ נייַע פּעקל, אָדער עפענען אַ ביז אַהער געראטעוועט. אין אונדזער בייַשפּיל, שאַפֿן אַ נייַע.

2) אין דער ווייַטער שריט מיר געבן עס אַ נאָמען, פּרעפעראַבלי איינער וואָס ריקאָלז וואָס איז סטאָרד אין עס זעקס חדשים שפּעטער.

3) ווייַטער, אויסקלייַבן די דאָקומענט שפּראַך (רוסיש-ענגליש), אָנווייַזן צי עס זענען בילדער און טישן אין דיין סקאַנד מאַטעריאַל.

4) איצט איר דאַרפֿן צו ספּעציפיצירן דער טעקע אין וואָס די טעקעס פֿאַר דערקענונג זענען ליגן. דורך דעם וועג, וואָס איז טשיקאַווע, די פּראָגראַם זיך וועט געפֿינען אַלע די בילדער און אנדערע גראַפיק טעקעס אַז זיי קענען דערקענען און לייגן זיי צו די פּרויעקט. איר נאָר האָבן צו באַזייַטיקן די עקסטרע.

5) די ווייַטער שריט איז נישט וויכטיק - קלייַבן וואָס איר וועט טאָן מיט די מקור טעקעס נאָך דערקענונג. איך רעקאָמענדירן איר סעלעקטירן דעם "טאָן גאָרנישט" טשעקקבאָקס.

6) עס בלייבט נאָר צו קלייַבן די פֿאָרמאַט אין וואָס דער דערקענט דאָקומענט וועט זיין גילטיג. עס זענען עטלעכע אָפּציעס:

- rtf - אַ טעקע פֿון אַ וואָרט דאָקומענט, געעפנט דורך אַלע פאָלקס אָפאַסיז (אַרייַנגערעכנט פריי אָנעס, אַ לינק צו מגילה);

- טקסט - טעקסט פֿאָרמאַט, איר קענען בלויז שפּאָרן טעקסט, בילדער און טישן קענען ניט זיין;

- htm - אַ היפּערטעקסט בלאַט, באַקוועם אויב איר יבערקוקן און דערקענען טעקעס פֿאַר די פּלאַץ. מיר וועלן סעלעקטירן עס אין אונדזער בייַשפּיל.

7) נאָך קליקינג די "ענדיקן" קנעפּל, דער פּראָצעס פון פּראַסעסינג דיין פּרויעקט וועט אָנהייבן.

8) די פּראָגראַם אַרבעט שיין שנעל. נאָך דערקענונג, אַ קוויטל מיט HTML טעקעס וועט דערשייַנען אין פראָנט פון איר. אויב איר דריקט אויף אַזאַ אַ טעקע, אַ בלעטערער סטאַרץ, ווו איר קענען זען די רעזולטאַטן. דורך דעם וועג, דער פּעקל קענען זיין גילטיג פֿאַר ווייַטער אַרבעט מיט אים.

9) ווי איר קענט זען די רעזולטאַטן די אַרבעט איז זייער ימפּרעסיוו. דער פּראָגראַם קען דערקענען די בילד לייכט און ונטער דעם טעקסט איז געווען לייכט דערקענט. טראָץ דעם פאַקט אַז די פּראָגראַם איז פריי, עס איז בכלל סופּער!

4. קאַנקלוזשאַנז

אויב איר אָפט טאָן ניט יבערקוקן און דערקענען דאָקומענטן, מיסטאָמע עס איז קיין זינען צו קויפן די FineReader פּראָגראַם. רובֿ טאַסקס זענען לייכט כאַנדאַלד דורך CuneiForm.

אויף די אנדערע האַנט, זי האט אויך דיסאַדוואַנטידזשיז.

פירסטלי, עס זענען אויך ווייניק מכשירים פֿאַר עדיטינג און קאָנטראָלירונג די רעזולטאַט. צווייטנס, ווען איר האָבן צו דערקענען אַ פּלאַץ פון בילדער, עס איז מער באַקוועם אין FineReader צו גלייך זען אַלץ צוגעלייגט צו די פּרויעקט אין די רעכט זייַל: געשווינד באַזייַטיקן ומנייטיק אָנעס, מאַכן קערעקשאַנז, עטק. און דריטנס, CuneiForm פארלירט ווי דערקענונג אויף דאָקומענטן: איך מוזן ברענגען דעם דאָקומענט צו מיינונג - רעדאַגירן ערראָרס, שטעלן פּונקטואַציע מאַרקס, ציטאַט מאַרקס, עטק.

אַז ס אַלע. צי איר וויסן קיין אנדערע ווערט פריי פּראָגראַם דערקענונג פּראָגראַם?

Pin
Send
Share
Send