What we learned from 5 million books
עבור אלה שתמיד תהו כמה ספרים שונים נמצאים בעולם, גוגל יש לך תשובה: 129,864,880, על פי לאוניד טייכר, מהנדס תוכנה של Google שעובד על פרויקט הספרים של Google.
הערכת מספר של ספרים בעולם הוא יותר מאשר תרגיל בסקרנות עבור ענקית החיפוש: הוא גם מספק מפת דרכים של חלק מהעבודה שעוד נותר לעשות כדי לענות על המטרה השאפתנית של החברה לארגן את כל המידע בעולם. אתה חלק מחברה שמנסה לספרת את כל הספרים בעולם, השאלה הראשונה שאתה מקבל היא: 'כמה ספרים יש שם?' ", הסביר טייגר בהודעה בבלוג שמכריזה על האומדן. > [לקריאה נוספת: שירותי הזרמת טלוויזיה הטוב ביותר]
כדי להגיע עם קירוב סביר, החברה החלה על ידי בליעת מידע הספר ממערכות קיטלוג מרובים, כגון מספרי הספר הסטנדרטי הבינלאומי (ISBN).
קטלוגים כאלה, בעוד מועיל, לא מספקים ספירה מוחלטת, למרות זאת. לדוגמה, מספרי ISBN הוקצו רק לספרים מאז שנות השישים, ונוטים לשמש רק במדינות המערב.כמו כן, מספר רב של ספרים הוקצו למספרים ISBN בודדים, והמו"ל הקצה מספרי ISBN לפריטים שאינם ספרים, כגון חולצות ו DVD.
אז מהנדסי גוגל כתבו תוכניות לסרוק על כ -150 קטלוגים וספריות כאלה, ולחסל כמו רשומות כפולות רבות כפי שניתן למצוא.
החברה גם היה צריך לעשות מספר, למשל, כריכה רכה ומהדורות של כריכה קשה של טקסט נספרות כשני ספרים, וכך גם הגרסאות השונות של טקסט פופולארי, כמו של שייקספיר, "המלט", בשל ההקדמות ופרשנויות שהם עשויים להכיל. הסידורים עשויים להיחשב כספרים בודדים או כעבודה שנאספה.
נכון לחודש יוני, החברה סרקה 12 מיליון ספרים, על פי מצגת שניתנה על ידי מנהל ההנדסה של Google ספרים, ג'ון אורואנט, בכנס הטכנולוגי השנתי של USENIX בבוסטון. ספרים אלה נכתבו בכ -80 שפות (כולל 3 ספרים בשפה של קלינגון "מסע בין כוכבים").
החברה מתכננת להשלים את הסריקה של ספרים קיימים בתוך עשור. האוסף הוירטואלי שנוצר יכלול ארבעה מיליארדי עמודים ושני טריליון מילים, אומר אורואנט.
כ -20% מספרי העולם נמצאים ברשות הציבור, הסביר אורוואנט. כ -10% -15% מהספרים האלה מודפסים. הספרים הנותרים - רובם המכריע של כל הכותרות - עדיין תחת זכויות יוצרים אך לא של הדפסה. גוגל נמצאת בתהליך של שאילת עותקים של ספרים אלה כדי לספרת אותם, מ -40 ספריות גדולות ברחבי העולם.
זהו מעשה סריקה בספרים שאינם מעודכנים, אך עדיין מכוסה על ידי זכויות יוצרים אשר נפגשו עם התנגדות מסוימת על ידי תעשיית המו"לים.
החברה מחכה כעת לפסק דין של בית המשפט המחוזי של ארה"ב במחוז הדרום של ניו יורק, על השאלה אם היא יכולה לסרוק את הספרים האלה.
בשנת 2005, אגודת המחברים איגוד המו"לים האמריקאים הגיש בנפרד תביעות ייצוגיות נגד ענקית החיפוש, וטען שהחברה מפרה זכויות יוצרים על ידי סריקה בספרים.
Google טענה שהיא רוצה למכור עותקים דיגיטליים של עותקים אלה, להדפיס ספרים, וכן להפריש תמלוגים עבור המחברים לתבוע. החברה גם מקווה לחשוף קטעי טקסט של ספרים אלה בחיפושים באינטרנט, וטוען כי השימוש הזה נופל תחת דוקטרינת השימוש ההוגן של ארה"ב.
סריקה בכל ספרי העולם תוביל להטבות נוספות בנוסף לשיפור החיפושים, הסביר אורוואנט. כאשר כל הכרכים האלה דיגיטציה, התוכן שלהם יכול להיות נתון לניתוח, אשר יכול להוביל תובנות חדשות. בלשנים יכולים לגלות מתי מילים מסוימות נכנסו לשימוש נרחב, או מי מתחיל להשתמש במילים האלהGoogle Book Search יכול לעזור גם לענות על כמה שאלות היסטוריות בולטות: לדוגמה, הוא יכול להודיע על הוויכוח בין אם אייזק ניוטון וגוטפריד לייבניץ - או מישהו אחר לגמרי - המציאו חצץ.
"אנחנו יכולים לחפש לא רק ביטוי אבל עבור מושג ", הסביר Orwant. "אנחנו יכולים לקחת את כל הדרכים השונות [כי הרעיון של] אינסוף יכול להיות מוטה, לתרגם את זה לשפות שונות, ולעשות חיפוש במקביל."
"התקווה שלי היא כי כאשר אנו מתחילים לחשוף הרבה יותר של זה יאפשר לאנשים לשאול שאלות כאלה שלא יכלו לשאול לפני כן ".
IDG News עורך השירות חואן קרלוס פרז תרם לדו"ח זה.
יואב ג'קסון מכסה את התוכנה הארגונית ואת הטכנולוגיה הכללית שבירת חדשות עבור
שירות חדשות IDG
. בצע יואב בטוויטר ב @ Joab_Jackson. כתובת הדואר האלקטרוני של יואב היא [email protected]
אינטל משקיעה 10 מיליון דולר בחברות טכנולוגיה ירוקה <אינטל השקיעה 10 מיליון דולר בחמש חברות המפתחות טכנולוגיות לניהול טוב יותר של אספקת חשמל לבתים ולנתונים "אינטל השקיעה 10 מיליון דולר בחמש חברות שפיתחו טכנולוגיות להפחתת חשבונות החשמל ופליטות גזי חממה בבתים ובמרכזי נתונים", אמר היום (יום ד ') אינטל קפיטל, זרוע ההשקעות של החברה. חברות המפתחות טכנולוגיה המאפשרת ניטור פעיל של צריכת החשמל. החברה השקיעה גם בחברות שמאפשרות ביקוש ואספקה טובים יותר לבתים ולמרכזי נתונים.
ההשקעות בוצעו על ידי אינטל כחלק מיוזמת האנרגיה הפתוחה שלה, המביאה טכנולוגיות אנרגיה חכמה לצרכנים, ארגונים ושירותים. אינטל כבר השקיעה עד 100 מיליון דולר בחלל הטכנולוגי הנקי, אמר סטיב אייכנאלאב, מנכ"ל אינטל קפיטל, באירוע בסן פרנסיסקו.
Foursquare רושמת 100 מיליון צ'ק אין Foursquare, שירות מבוסס הרשת החברתית מבוסס מיקום, רשם את "צ'ק-אין" 100 מיליון שקל שלו ביום שני הערב, אמר יום שלישי. "יום רביעי בערב, ביום רביעי בערב, נרשמה" צ'ק-אין "של 100 מיליון דולר, כך דיווחה החברה ביום שלישי. שירות, אשר ראה צמיחה מהירה בחודשים האחרונים. ב -23 ביוני הודיעה החברה כי היא צומחת בקצב של 100,000 משתמשים בכל 10 ימים - שיעור שיעמיד את מאגר המשתמשים הנוכחי ביותר מ -2 מיליון אנשים, בהנחה שהצמיחה תישאר יציבה במהלך החודש הא
Foursquare מתחבר למשתמשים עם חברים שלהם בעולם האמיתי בכך שהוא מאפשר להם לרשום את המיקום הנוכחי שלהם באמצעות הצ'ק אין. הצ'ק-אין משותפים עם חברים ולעתים קרובות עם זרים באמצעות שירותי רשתות חברתיות כמו Twitter. בדרך כלל ניתן לגשת באמצעות טלפון סלולרי מאובזר GPS, משתמשים יכולים לרשום מקומות חדשים אם האזור הנוכחי שלהם כבר לא במאגר של מאות אלפי מקומות.
לעתים, אנו מרגישים צורך בדרך פשוטה וקלה לגישה לתפריטי Windows שונים. אחת הדרכים היא באמצעות קיצורי מקשים כדי לכבות את Windows. דרך נוספת היא יצירת קיצורי דרך לתפריטים אלה. הדרכה זו תלווה אותך בתהליך יצירת קיצורי דרך לתפריטים שונים של אפשרויות צריכת חשמל ב- Windows - קיצור דרך לכיבוי, הפעלה מחדש, יציאה והשעיה של מחשבי Windows בקלות.
יצירת קיצור דרך SHUTDOWn