אתרי אינטרנט

Google קונה ReCAPTCHA כדי לשפר את המאמצים סריקה הספר

Massive-scale online collaboration | Luis von Ahn

Massive-scale online collaboration | Luis von Ahn
Anonim

גוגל מתכננת להאיץ את המאמצים המאסיביים שלה לסרוק עשרות מיליוני ספרים וכתבי עת עם הרכישה ביום רביעי של חברה בשם reCAPTCHA.

ReCAPTCHA היא ספקית ידועה של טכנולוגיית CAPTCHA, המשמשת למניעת דואר זבל באמצעות מחשבים כדי להירשם באופן אוטומטי לשירותים מקוונים, כגון חשבונות דואר אלקטרוני ורישומי אתר אינטרנט.

CAPTCHA, אשר מייצג "בדיקה אוטומטית לחלוטין Turing מבחן לספר מחשבים ובני אדם חוץ", דורש למשתמשים להקליד באופן אקראי מילים שנבחרו המופיעות תמונות, תהליך שקל לבני אדם אבל קשה למחשבים לעשות בצורה נכונה. [

[קריאה נוספת: שירותי הזרמת הטלוויזיה הטובים ביותר]

מה שמשך את Google ל- ReCAPTCHA הוא שהחברה יש קישור הליבה שלה שירות האימות עם המאמצים כדי לספרת ספרים וכתבי עת דיגיטליים. ענק החיפוש עוסק במאמץ מאסיבי בתחום זה עבור שירותי Google Books ו- Google News Archive.

ReCAPTCHA לוקח את תמונות המילה שלו מחומרי הדפסה סרוקים. בכל פעם שאנשים פותחים CAPTCHA מהחברה, הם גם, כתוצר לוואי, עוזרים להפוך מילים סרוקות לטקסט רגיל שניתן לאינדקס ולבצע חיפוש על ידי מנועי החיפוש.

"אז אנחנו נהיה מיישמים את הטכנולוגיה בתוך גוגל לא רק להגדיל את הונאה והגנה מפני דואר זבל עבור מוצרי Google, אלא גם כדי לשפר את הספרים שלנו ואת תהליך הסריקה בעיתונים ", נכתב בהודעה בבלוג הרשמי של גוגל, שנכתב על ידי לואיס פון אהן, ממייסדי reCAPTCHA, וויל קאתקרט, מנהל מוצר של Google.

שירות ReCAPTCHA נמצא בשימוש של כ -100,000 אתרי אינטרנט, והוא מסייע לדיגיטציה של מהדורות ישנות של ה"ניו יורק טיימס ".