Windows

Hadoop מקבל יותר חיפוש עם MapR, משחרר Cloudera

How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox

How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox
Anonim

משתמשים של פלטפורמת עיבוד נתונים Hadoop עכשיו יש שני כלים נוספים כדי לעזור להם למיין את ההרים שלהם של מידע.

הפצה M7 החדש של MapR מסיר את שכבות Hadoop JVM כדי לשפר את הביצועים

Hadoop מפיץ Maper שילב את LucidWorks חיפוש לתוך ההפצה שלו. Cloudera, בינתיים, השיקה את הגרסה המלאה הראשונה של קוד המקור של אימפלה SQL שאילתה מנוע עבור Hadoop.

[המשך קריאה: שירותי הזרמת טלוויזיה הטוב ביותר]

"שימוש בחיפוש כממשק המשתמש עבור נתונים גדולים מאוד מעניין. החיפוש מתאים מאוד למינוף של סוגים שונים של מידע, במיוחד מידע לא מובנה ", אמר ג'ק נוריס, מנהל השיווק הראשי של MapR. "אנחנו רואים כמה יישומים מעניינים מאוד עם מנועי החיפוש בליבה שלהם, גם אם משתמש טיפוסי לא היה חושב עליהם כמנוע חיפוש מונע."

LucidWorks Search הוא הגרסה המסחרית של הקוד הפתוח Apache Lucene / Solr מלא -Text מנוע החיפוש. עם שילוב חדש של MapR, LucidWorks Search יכול לחפש באמצעות נתונים על Hadoop File Systems (HDFS) או על קבצים במערכות קבצים אחרות.

LucidWorks Search מציע צילומים ותמונות עבור זמינות גבוהה, ומבטל את רוב העבודה הנדרשת להתקין את Lucene / Solr מאפס. הוא מציע גם תמיכה מקורית עבור מקורות נתונים נוספים, ממשק משתמש גרפי ומסגרת אבטחה.

ניתן להשתמש במנוע החיפוש ביישום אינטרנט דינמי כדי לאחזר במהירות תמונות, פרסום, המלצות למוצרים ומידע אחר שניתן להשתמש בו כדי לאכלס אתרי אינטרנט על לטוס. "זה לא תחליף עלות נמוכה יותר עבור מחסני נתונים. מדובר במינוף מקורות נתונים חדשים וביצוע כמה דברים שיש להם השפעה דרמטית על העסק ", אומר נוריס.

MapR ו- LucidWorks עובדות יחד על שילוב הטכנולוגיות שלהן מאז 2011, כאשר הן יצרו הסכם שיווק משותף. מוקדם יותר השנה, הם שחררו מחבר זה עושה את זה קל לשימוש Lucene / Solr עם ההפצה Hadop MapR.

LucidWords חיפוש עובד עם ההפצה M7 של M7 שפורסמו לאחרונה, בטא הטופס. בנוסף לתמיכה ב- LucidWorks Search, המהדורה M7 נבחרה מחדש לחיסול קומפלקציות או בדיקות עקביות ברקע, מהירות מופרזת.

גם השבוע פרסמה Cloudera גרסה 1.0 של Cloudera Impala, קוד פתוח SQL תואם מנוע שאילתה עבור הדופ. SQL היא שפת ממשק מסד הנתונים המשמש במערכות ניהול מסדי נתונים יחסיים (RDMS) והיא ידועה על ידי מנהלי מסדי נתונים.

Impala תוכננה לבצע שאילתות מהר יותר מאשר כוורת Hadoop, מכיוון שהיא אינה משתמשת במסגרת MapReduce, אשר דורשת תוצאות חיפוש להיות כתוב בדיסק. במקום זאת, משתמשים יכולים שאילתה נתונים המאוחסנים HDFS ו- HBase ישירות. משתמשים יכולים לבצע שאילתות נתונים באופן אינטראקטיבי או באמצעות תהליכי אצווה.

Cloudera שיחררה לראשונה גירסה של מנוע זה באוקטובר האחרון כביתא. מאז, התוכנה נבדקה על ידי חברות כמו 37signals ו Expedia.

Impala הוא מרכיב הליבה של חבילת Cloudera Enterprise RTQ (Real-Time Query) עבור פלטפורמת Cloudera Hadoop. אימפלה ניתן להוריד ללא תשלום.

עודכן מאי 6 כדי לתקן מידע על הטכנולוגיה Cloudera Impala.