רכיבים

Google Open- מקורות נתונים Exchange Exchange

Former FBI Agent Explains How to Read Body Language | Tradecraft | WIRED

Former FBI Agent Explains How to Read Body Language | Tradecraft | WIRED
Anonim

Google פתוחה חיפשו את המאגרים של הפרוטוקול שלה, את השפה של החברה עבור קידוד סוגים שונים של נתונים, על מנת להגדיר את הבמה לגל של מהדורות חדשות, על פי ההודעות הרשומות של החברה הרשמית ומסמכים.

"כמעט כולם בתוך Google" משתמשים בפרוטוקול מאגרים, מציינת דף שאלות נפוצות. "יש לנו פרויקטים רבים אחרים שתרצה לשחרר כמקור פתוח המשתמש במאגרי פרוטוקולים, ולכן כדי לעשות זאת, היינו צריכים לשחרר את המאגרים של הפרוטוקול הראשון".

Google משתמשת באלפי פורמטים שונים של נתונים כדי לייצג הודעות רשת בין שרתים, רשומות אינדקס במאגרים, מערכי נתונים גיאו-מרחביים ועוד ", כתב קנטון ורדה, חבר בצוות הנדסת התוכנה של גוגל, בפוסט בבלוג. "רוב הפורמטים האלה מובנים, לא שטוחים, וזה מעלה שאלה חשובה: איך אנחנו מקודדים את כל זה?"

ה- XML ​​הנפוץ (שפת סימון ניתנת להרחבה) אינו יעיל מספיק לצורכי שיתוף הנתונים של Google, לפי ורדה: "כאשר כל המכונות שלך וקישורים לרשת פועלים בקיבולת, XML הוא הצעה יקרה מאוד."

עם מאגרי פרוטוקול, "אתה מגדיר כיצד אתה רוצה את הנתונים להיות מובנים פעם אחת, ואז אתה יכול להשתמש במקור שנוצר מיוחד קוד כדי לכתוב ולקרוא בקלות את הנתונים המובנים שלך וממנו ממגוון זרמי נתונים ושימוש במגוון שפות ", על פי דף תיעוד. "אתה יכול אפילו לעדכן את מבנה הנתונים שלך מבלי לשבור את התוכניות הפרוסות שנאספו כנגד הפורמט הישן".

מאגרי הפרוטוקול הם קטנים פי שלושה עד פי 10, ו -20 עד 100 פעמים מהר יותר מ- XML, לפי גוגל. אבל ל- XML ​​יש כמה יתרונות למשימות מסוימות, על פי התיעוד: "מאגרים של פרוטוקול לא יהיו דרך טובה לדגם מסמך מבוסס טקסט עם סימון (למשל HTML), שכן לא ניתן בקלות להתערבב עם טקסט.בנוסף, XML הוא קריא מבחינה אנושית וניתן לעריכה אנושית, מאגרי פרוטוקולים, לפחות בפורמט המקורי שלהם. "

Google הכינה pagethat להוריד מכיל מהדר פרוטוקול חיץ עבור Java, C + + ו Python.