Windows

נתונים גדולים 3 V - מושגים & מודלים

Leap Motion SDK

Leap Motion SDK

תוכן עניינים:

Anonim

המונח "נתונים" אינו חדש עבורנו. זהו אחד הדברים העיקריים לימד כאשר אתה בוחר טכנולוגיית מידע ומחשבים. אם אתה זוכר, הנתונים נחשבים צורה גולמית של מידע. למרות שכבר שם עשור, המונח נתונים גדולים הוא באז בימים אלה. כפי שניתן לראות מן המונח, המון, ואת המון נתונים, הוא נתונים גדולים והוא יכול להיות מעובד בדרכים שונות באמצעות שיטות וכלים שונים כדי להשיג את המידע הדרוש. מאמר זה מדבר על המושגים של נתונים גדולים, תוך שימוש 3 V של המוזכרים על ידי דאג Laney, חלוצה בתחום אחסון נתונים אשר נחשב יזמה את השדה של Infonomics (כלכלה מידע). > לפני שתמשיך, ייתכן שתרצה לקרוא את המאמרים שלנו על יסודות של נתונים גדולים ושימוש בנתונים גדולים כדי להבין את המהות. הם עשויים להוסיף עד להודעה זו לקבלת הסבר נוסף על מושגים של נתונים גדולים.

נתונים גדולים 3 לעומת

נתונים, בצורתם העצומה, שנצברו באמצעים שונים הוגשו כראוי במאגרי מידע שונים קודם לכן וזרקו לאחר זמן מה. כאשר התפיסה התברר שככל שהנתונים יותר, כך קל יותר לגלות - מידע שונה ורלוונטי - באמצעות הכלים הנכונים, החלו חברות לאחסן נתונים לתקופות ארוכות יותר. זה כמו להוסיף התקני אחסון חדשים או להשתמש בענן כדי לאחסן את הנתונים בכל צורה שהנתונים נרכשו: מסמכים, גיליונות אלקטרוניים, מסדי נתונים ו- HTML וכו `. לאחר מכן הוא מסודר בתבניות מתאימות באמצעות כלים המסוגלים לעבד נתחים ענקיים של נתונים>

הערה:

היקף הנתונים הגדולים אינו מוגבל לנתונים שאתה אוסף ולאחסן בחצרים ובענן שלך. הוא יכול לכלול נתונים ממקורות שונים אחרים, כולל, אך לא רק, פריטים ברשות הציבור. המודל התלת-ממדי של נתונים גדולים מבוסס על הנתונים הבאים:

Volume: מתייחס לניהול אחסון נתונים

  1. מהירות: מתייחס לקבץ נתונים של ערכות נתונים שונות, לכאורה, שאינן קשורות לכאורה
  2. הסעיפים הבאים מסבירים מודלים של נתונים גדולים על ידי דיבור על כל מאפיין (כל V) בפרטים.
  3. א] נפח של נתונים גדולים

מדברים על הנתונים הגדולים, אפשר להבין נפח כמו אוסף עצום של מידע גולמי. למרות שזה נכון, זה גם על עלויות אחסון של נתונים. נתונים חשובים ניתן לאחסן במקום כמו גם על ענן, האחרון להיות אפשרות גמישה. אבל אתה צריך לאחסן כל דבר?

על פי נייר לבן שפורסם על ידי Meta Group, כאשר נפח הנתונים גדל, חלקים של נתונים להתחיל לחפש מיותר. יתר על כן, הוא קובע כי רק נפח הנתונים צריך להישמר אשר עסקים מתכוונים להשתמש. נתונים אחרים עשויים להיות מושלכים או אם העסקים אינם ששים לעזוב "נתונים שאינם חשובים לכאורה", הם יכולים להיות זרקו על התקני מחשב שאינם בשימוש ואפילו על קלטות, כך עסקים לא צריכים לשלם עבור אחסון נתונים כאלה. > השתמשתי "בנתונים חסרי משמעות", כי גם אני סבור שאפשר לדרוש נתונים מכל סוג שהוא בכל עת בעתיד - במוקדם או במאוחר - ולכן יש לשמור אותו למשך זמן רב לפני שתדע שהנתונים הם אכן לא חשוב. אישית, אני לזרוק נתונים ישנים לדיסקים קשיחים מ yesteryears ולפעמים על תקליטורי DVD. המחשבים העיקריים ואת אחסון ענן מכילים את הנתונים שאני מחשיב חשוב יודע שאני יהיה להשתמש. בין הנתונים הללו גם, יש להשתמש - פעם סוג של נתונים שעלולים בסופו של דבר על HDD הישן לאחר כמה שנים. הדוגמה לעיל היא רק להבנה שלך. זה לא יתאים לתיאור של נתונים גדולים כמו הסכום הוא פחות או יותר בהשוואה למה ארגונים תופסים כמו נתונים גדולים.

B

] מהירות נתונים גדולים

המהירות של עיבוד נתונים הוא גורם חשוב כאשר מדברים על מושגים של נתונים גדולים. ישנם אתרי אינטרנט רבים, במיוחד מסחר אלקטרוני. גוגל כבר הודתה כי המהירות שבה לטעון דף חיוני עבור דירוג טוב יותר. מלבד הדירוג, המהירות גם מספק נוחות למשתמשים בזמן שהם חנות. כך גם לגבי נתונים המעובדים עבור מידע אחרבעוד מדברים על מהירות, זה חיוני לדעת שזה מעבר רוחב פס גבוה יותר. הוא משלב נתונים שמיש בקלות עם כלי ניתוח שונים. נתונים שמישים בקלות פירושו שיעורי בית מסוימים כדי ליצור מבנים של נתונים שקל לעבד. הממד הבא - וראייטי, מפיץ אור נוסף על זה.

C] מגוון רחב של נתונים גדולים כאשר יש המון המון נתונים, זה הופך להיות חשוב לארגן אותם באופן כלי הניתוח יכול בקלות לעבד את נתונים. ישנם כלים לארגון נתונים גם כן. בעת האחסון, הנתונים יכולים להיות בלתי מובנים ובכל צורה. זה תלוי בך כדי להבין מה הקשר יש לו עם נתונים אחרים איתך. ברגע שאתה מבין את הקשר, אתה יכול לאסוף את הכלים המתאימים ולהמיר את הנתונים לטופס הרצוי לאחסון מובנה וממוין.

סיכום

במילים אחרות, מודל 3D של ביג נתונים מבוסס על שלושה ממדים: נתונים USABLE שיש לך; תיוג נאות של נתונים; ועיבוד מהיר יותר. אם שלושת אלה מטופלים, הנתונים שלך יכול בקלות להיות מעובד או לנתח כדי להבין מה שאתה רוצה.

האמור לעיל מסביר את שני מושגים מודל 3D של נתונים גדולים. המאמרים המקושרים בפסקה השנייה יוכיחו תמיכה נוספת אם אתם חדשים לקונספט.

אם ברצונכם להוסיף משהו, אנא שימו לב.