Car-tech

Cloudera Preps Hadoop עבור הארגון

Cloudera Hadoop installation in Azure Cloud fastest way step by step | Manoj Sharma

Cloudera Hadoop installation in Azure Cloud fastest way step by step | Manoj Sharma
Anonim

Cloudera חשפה קבוצה חדשה של כלי ניהול Hadoop, הנקרא Cloudera Enterprise, כי החברה תציע דמי מנוי שנתי, הודיעה ביום שלישי. היא גם עדכנה את חבילת הפצת הקוד הפתוח של Hadoop.

שני מהדורות חדשות, כמו גם מספר שותפויות חדשות עם ספקים של ספקי תוכנה לניהול נתונים, מראות את החברה מתכוננת להציע את טכנולוגיית הנתונים המתפתחת - כיום בשימוש בעיקר על ידי ענקיות אינטרנט כמו גוגל ויאהו - לשוק הארגוני כחלופה למסדי נתונים יחסיים. "

" ההימור שלנו הוא לא רק חברות האינטרנט הגדולות, אלא בנקים, בתי חולים וחברות ביטוח יגלו שהם צריכים לנתח מורכבות ומובנית נתונים יחד, ואת Hadoop היה עשה את זה, "אמר Cloudera מנכ"ל מייק אולסון. "Hadoop פותר בעיה חדשה, בדרך חדשה".

אחד ממספר גדל והולך של מסדי נתונים שאינם מבוססי SQL או מסדי נתונים של NoSQL, Hadoop מבוסס על Google MapReduce, מסגרת לעיבוד נתונים במקביל למספר גדול של מחשבים צמתים. Hadoop, המפותחת כעת כפרויקט קוד פתוח של קרן אפאצ'י, מציעה חלופה למסדי נתונים יחסיים מסורתיים, לפחות באותם מקרים של ניתוח ערכות נתונים גדולות ומשתנות במהירות.

זה יכול לעבוד גם עם SQL וגם לא - נתונים של SQL, והוא יותר גמיש לכישלון שרת מאשר מסדי נתונים יחסיים, אומר אולסון.

Cloudera היא אריזה Hadoop עבור ארגונים midlevel, הן עם ההפצה Hadoop שלה, ואת ערכת שפורסמו לאחרונה של כלי הניהול. שתי החבילות צריכות לאפשר לארגונים ללא הרבה ניסיון טכני מעמיק ב Hadoop להריץ את התוכנה, אמר אולסון. "יש את המיתוס הזה שהדופ הוא שמיש אם יש לך נתונים עם קנה מידה של גוגל, ויש הרבה משתמשים שיש להם רק כמה טרה-בתים של נתונים שהם רוצים לנתח", אומר אולסון. חבילת קוד פתוח של תוכנות משולבות מראש שנבנו סביב Hadoop Common, שנקרא בעבר Hadoop Core. החבילה כוללת: כוורת, המספקת תשתית מחסן נתונים; HBase, בסיס הנתונים בבסיס הדופ; חזיר, מהדר עבור תוכניות לצמצם מפה; Zookeper, תזמון עבור יישומים רצים על פני מספר שרתים, ו- MapReduce.

בגירסה החדשה שפורסמה 3, החבילה כוללת שלוש תוכניות שהחברה פרסמה כמפעילי קוד פתוח, תחת רישיון קוד פתוח של Apache V2. אחד מהם הוא Flume, אשר יכול לסייע בהעמסת הנתונים לתוך Hadoop. תוספת חדשה נוספת היא Oozie, שהיא תוכנת ניהול זרימת עבודה. האחרון הוא קוד ה- Hadoop User Environment (HUE), המספק ממשק משתמש לניהול Hadoop.

"HUE מאפשר לכל אחד לבנות יישומים הממוקדים באנליסטים, והוא יודע איך לדבר עם אשכולות הדופ", אמר אולסון.

חבילת Cloudera Enterprise מעצימה את CDH גרסה 3 עם כלי ניהול נוספים. תוכנה חדשה זו, שאינה קוד פתוח, מאפשרת למנהלי מערכת לשלוט על ניהול גישה באמצעות שימוש בפרוטוקול Lightweight Access Protocol. התוכניות מסופקות גם למשאבים של הקצאת משאבים, לביצוע ניטור תצורה וביצועים.

אולסון לא תדון בכמה קלואדרה ביצעה דמי מנוי עד כה, אך היא מציינת כי ברבעון הראשון של 2010, מה היא הרוויחה עד מחצית 2009. בין הענפים השונים, השירותים הפיננסיים, התקשורת, הקמעונאות, החברות הממשלתיות והמסחר באינטרנט גילו עניין בטכנולוגיה, אמר אולסון. "הדברים שעושים החברות עם הדופ משתנים. באופן כללי, אנשים אלה תופסים הרבה נתונים ממספר רב של מקומות ועליכם להעמיד אותם על אנליזה מתוחכמת ", אמר אולסון. "השירותים הפיננסיים מעוניינים להשתמש בדופ לזיהוי הונאה, בתחום התקשורת יש צורך אמיתי לייעל רשתות ולהפחית את הנטישה של לקוחות".בנוסף לחבילות אלו, קלודרה מגייסת תמיכה בחברת Hadoop מספקי בינה עסקית (BI) ותוכנות לניהול נתונים.

אולסון מתכנן להודיע, במהלך דבריו בפסגת הדופ 2010, שהתקיימה בסנטה קלרה, קליפורניה ביום שלישי, כי ספקית ה- BI MicroStrategy יתמוך בשימוש Hadoop.

שותף חדש נוסף הוא Talend, ספק של תוכנת קוד פתוח לשילוב נתונים. החברה הרחיבה את חבילת האינטגרציה של Talend כדי ליצור ממשק עם מסדי נתונים של Hadoop. הסוויטה מאפשרת למנהלי מערכת לנהל ולצטבר מקורות נתונים מרובים ממסוף יחיד. עם Hadoop, התוכנה "יכולה להכניס או לאחזר נתונים באופן מקורי ולעבד את הנתונים בתוך הארכיטקטורה של Hadoop", אמר סגן נשיא השיווק של טאלנד, איב דה מונטצ'ייל.

Microstrategy and Talend הצטרפו למספר גדל והולך של חברות המפעילות קוד פתוח או כלי ניהול מסחריים עבור Hadoop. בשבוע שעבר, Cloudera ו Quest יצא על פרויקט לבנות תוכנה שיכולה לקשר Hadoop עם מסדי נתונים של אורקל. בחודש מאי, קוד פתוח, חברת בינה עסקית הודיעה כי חבילת ה- BI שלה תעבוד עם מסדי נתונים של Hadoop.

בראיון נפרד ל- IDG News Service, CTO של יאהו, ריימי סטאטה, הצביע על כך שהדופ יכול להפחית את הצורך בבניית מחשבי על לנתח קבוצות נתונים גדולות. באופן מסורתי, קבוצות נתונים גדולות הועברו מהמחשב אל מחשב-העל, שהוא מערך שרתים משולב, הניתן לניתוח. לעומת זאת, הדופ מעבירה את החישוב האנליטי למקום שבו הנתונים מתגוררים, ומבטלת את הצורך במכונה ענקית לריסוק מספרים. יאהו הייתה תורם מוביל מוקדם ל- Hadoop.

בנוסף להנפקה של Cloudera, חברת Hadoop נסחרת גם על ידי יבמ, אשר החלה לאחרונה להציע מגוון שירותים אנליטיים המשתמשים בטכנולוגיה. טכנולוגיה שבירת חדשות עבור

שירות IDG חדשות

. בצע יואב בטוויטר ב @ Joab_Jackson. כתובת הדואר האלקטרוני של יואב היא [email protected]